광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

Meta의 'Cicero' AI는 진정한 정체성을 밝히지 않고 인간을 괴롭혔다. 실패작이었던 시세로. Cicero는 완벽하지 않았다. AI의 대화는 대부분 현재 턴의 행동으로 제한되었으며 Cicero는 한 플레이어와의 대화가 장기적으로 다른 플레이어와의 관계에 어떻게 영향을 미칠 수 있는지 모델링하는 데 능숙하지 않았다. 또한 때때로 "접지 오류"가 포함된 메시지나 자체 계획과 모순되는 메시지를 보냈다.

운영자 | 기사입력 2022/12/04 [11:12]

Meta의 'Cicero' AI는 진정한 정체성을 밝히지 않고 인간을 괴롭혔다. 실패작이었던 시세로. Cicero는 완벽하지 않았다. AI의 대화는 대부분 현재 턴의 행동으로 제한되었으며 Cicero는 한 플레이어와의 대화가 장기적으로 다른 플레이어와의 관계에 어떻게 영향을 미칠 수 있는지 모델링하는 데 능숙하지 않았다. 또한 때때로 "접지 오류"가 포함된 메시지나 자체 계획과 모순되는 메시지를 보냈다.

운영자 | 입력 : 2022/12/04 [11:12]

 

 

사진 : Alberto Pizzoli ( 게티 이미지 )

IBM의 Deep Blue 인공지능시스템 이 1997년 자신의 게임에서 세계 체스 챔피언 Garry Kasparov를 이긴 이후로 인류는 불행하게도 우리의 코드 기반 부하들이 점점 더 복잡한 게임에서 우리를 정복하는 것을 지켜보았다. 그래도 문제가 있다. AI봇은 일대일 대결 보드 및 비디오 게임 경기에서 인간을 능가하는 데 점점 더 뛰어나지 만 일반적으로 공유작업을 수행하기 위해 다른 인간 과 협력 하라는 지시를 받으면 시스템은 훨씬 더 나쁘다. Meta의 연구원들은 그들의 새로운 "Cicero" AI가 그것에 대해 뭔가 말할 수 있을 것이라고 믿고 있다.

Meta의 Fundamental AI Research Diplomacy Team이 Gizmodo와 공유한 새로운 연구에 따르면 처음으로 연구원들은 전쟁 전략 보드 게임 Diplomacy 에서 "인간 수준의 성능"을 달성하기 위해 AI를 훈련했다 . 로마공화국의 몰락을 목격한 고전 정치가이자 학자의 이름을 딴 새로운 AI에이전트는 다른 인간 플레이어와 효과적으로 의사소통하고 전략을 세울 수 있었으며 승리를 위한 최선의 방법을 계획할 수 있었고 경우에 따라 인간으로 통과할 수도 있었다. 이제 연구원들은 대화와 전략적 추론 모델을 결합하여 작업을 수행한 Cicero가 다중 AI 에이전트 학습을 위한 "벤치마크"로 우뚝 섰다고 말한다.

지난 20여 년 동안 다양한 회사의 점점 더 인상적인 AI 시스템 모음이 체스와 바둑에서 스타크래프트와 같은 보다 현대적인 게임에 이르기까지 모든 분야에서 인간 플레이어를 압도했다. 콘텐츠는 다르지만 이러한 게임은 모두 하나의 근본적인 유사점을 공유합니다. 모두 제로섬이며 승자가 모든 경쟁을 한다.

외교는 다르다. Diplomacy 에서는 7명의 플레이어가 대부분의 공급센터를 장악하기 위해 경쟁한다. 플레이어는 지속적으로 서로 상호 작용하며 각 라운드는 일련의 사전 라운드 협상으로 시작된다. 결정적으로 외교 플레이어는 다른 사람을 속이려고 시도할 수 있으며 AI가 거짓말을 하고 있다고 생각할 수도 있다. 연구원들은 "플레이어가 누구도 믿지 않도록 장려하는 환경에서" 다른 사람들과 신뢰를 구축해야 하기 때문에 외교가 특히 어렵다고 말했다. 즉, AI가 Diplomacy 에서 "승리"하려면게임의 규칙을 효율적으로 이해해야 할 뿐만 아니라 인간의 상호 작용, 속임수 및 협력을 근본적으로 이해하고 고장난 식기세척기처럼 들리지 않으면서 문장을 연결하는 방법을 알아야 한다.

Cicero는 어느 정도 그렇게했습니다. Meta는 Cicero가 익명의 온라인 Diplomacy 게임 40개에서 인간 플레이어의 평균 점수를 두 배 이상 늘렸으며 하나 이상의 게임을 플레이한 플레이어 중 상위 10%에 들었다고 말했다. Cicero는 21명이 참가한 8경기 토너먼트에서 1위를 차지하기도 했다. 게임의 모든 단계에서 Cicero는 다른 경쟁 플레이어가 게임 성능과 텍스트 대화를 기반으로 행동할 가능성이 있는 방식을 모델링했다.

연구원들은 2022년 8월 19일과 10월 13일에 총 72시간 플레이하는 40개의 익명화된 온라인 weDiplomacy.net 게임에 대한 연구실험을 수행했다. 연구원들은 인간 플레이어가 자신이 AI와 대결하고 있다고 믿었다는 것을 암시하는 게임 내 메시지를 보지 못했다고 말한다. Cicero 는 82명의 고유한 플레이어와 함께 40개의 Diplomacy 게임에서 분명히 "인간 플레이어로 통과"했다. 연구에서 강조된 한 사례에서 Cicero는 상호 이익이 되는 조치를 제안하여 인간 플레이어의 마음을 성공적으로 바꿀 수 있었다.

Cicero는 다른 플레이어와 적절하게 통신할 수 있도록 준비하기 위해 이전 Diplomacy 데이터의 막대한 양에 대해 교육을 받았다. 연구원들은 AI가 125,261개의 ​​익명화된 Diplomacy 게임 데이터 세트에서 훈련되었으며 이 중 약 40,000개는 대화가 포함되어 있다고 말했다. 전체적으로 해당 데이터 세트에는 인간 플레이어 간에 교환된 1,200만 개 이상의 메시지가 포함되어 있다.

그러나 Cicero는 완벽하지 않았다. AI의 대화는 대부분 현재 턴의 행동으로 제한되었으며 Cicero는 한 플레이어와의 대화가 장기적으로 다른 플레이어와의 관계에 어떻게 영향을 미칠 수 있는지 모델링하는 데 능숙하지 않았다. 또한 때때로 "접지 오류"가 포함된 메시지나 자체 계획과 모순되는 메시지를 보냈다. ( 인간 이 종종 같은 실수를 저지른다는 점은 주목할 가치가 있다). 그러나 이러한 경고에도 불구하고 연구원들은 Cicer o가 인간과 협력할 수 있는 독특한 능력으로 인해 AI 보드 게임 명예의 전당에 자리를 잡아야 한다고 말했다.

이것은 한 보드 게임의 한 연구일 뿐이지만, Meta의 새로운 발견은 점진적인 AI 성공을 볼 수 있는 잠재적으로 참신하고 덜 묵시적인 렌즈를 나타낸다. Cicero는 AI 시스템이 우리가 한때 소중하게 여겼던 게임에서 점차 인간을 꺾는 것에 소름 끼치는 느낌이 아니라 인간과 AI가 잠재적으로 파트너로서 또는 최소한 상호 지인으로서 협력하여 문제를 해결할 수 있는 미래를 암시한다.

 

 

 

 
PHOTO
1/6
광고
광고
광고
광고
광고
많이 본 기사
AGILab 뉴스 많이 본 기사
최신기사