사회적 동물인 인간보다 더 협업 잘하는 AI 에이전트
인간은 사회적 동물이지만, 한 번에 유지할 수 있는 관계의 수에는 엄격한 한계가 있는 듯하다. 새로운 연구에 따르면 AI는 훨씬 더 큰 그룹에서 협업할 수 있을 것으로 보인다.
1990년대에 영국의 인류학자 로빈 던바(Robin Dunbar)는 대부분의 인간이 약 150명의 사회적 그룹만 유지할 수 있다고 제안했다. 던바가 이 숫자에 도달하기 위해 사용한 방법의 신뢰성에 대한 상당한 논쟁이 있지만, 이는 비즈니스 관리에서 인간 그룹의 최적 규모에 대한 인기 있는 벤치마크가 되었다.
다양한 환경에서 작업을 해결하기 위해 AI 그룹을 사용하는 데 대한 관심이 커지고 있으며, 연구자들은 오늘날의 대규모 언어 모델(LLM)이 효과적으로 함께 일할 수 있는 개인의 수에 있어서도 비슷하게 제한되는지 의문을 제기했다. 그들은 가장 유능한 모델이 인간보다 훨씬 많은 최소 1,000명의 그룹에서 협업할 수 있다는 것을 발견했다.
독일 콘스탄츠 대학교의 조르다노 드 마르조(Giordano De Marzo)는 뉴 사이언티스트에 "나는 매우 놀랐다."라고 말했다. "기본적으로 우리가 가진 계산 리소스와 우리가 가진 돈으로 우리는 최대 수천 개의 에이전트를 시뮬레이션할 수 있었고, 커뮤니티를 형성하는 능력이 깨질 조짐은 전혀 없었다."
LLM의 사회적 역량을 테스트하기 위해 연구자들은 동일한 모델의 여러 인스턴스를 만들어 각각에 무작위 의견을 할당했다. 그런 다음 연구자들은 각 사본에 모든 동료의 의견을 하나씩 보여주고 자신의 의견을 업데이트할지 물었다.
팀은 그룹이 합의에 도달할 가능성이 기본 모델의 힘과 직접적으로 관련이 있음을 발견했다. Claude 3 Haiku와 GPT-3.5 Turbo와 같은 더 작거나 오래된 모델은 합의에 도달하지 못했지만, 700억 개의 매개변수를 가진 Llama 3 버전은 인스턴스가 50개를 넘지 않으면 합의에 도달했다.
하지만 연구자들이 테스트한 가장 강력한 모델인 GPT-4 Turbo의 경우 최대 1,000개의 사본으로 구성된 그룹이 합의에 도달할 수 있었다. 연구자들은 제한된 계산 리소스로 인해 더 큰 그룹을 테스트하지 않았다.
결과는 더 큰 AI 모델이 인간을 훨씬 뛰어넘는 규모로 협업할 수 있음을 시사한다고 던바는 뉴 사이언티스트에 말했다. 그는 "그들이 다양한 의견을 모아 우리보다 훨씬 더 빠르게, 더 많은 의견으로 합의에 도달할 수 있다는 것은 확실히 유망해 보인다."라고 말했다.
이 결과는 함께 일하는 AI 그룹이 다양한 수학 및 언어 작업에서 더 나은 성과를 낼 수 있다는 것을 발견한 "다중 에이전트 시스템"에 대한 증가하는 연구에 추가되었다. 그러나 이러한 모델이 매우 큰 그룹에서 효과적으로 작동할 수 있더라도 너무 많은 인스턴스를 실행하는 데 드는 계산 비용으로 인해 이 아이디어는 비실용적일 수 있다.
또한 메릴랜드 대학교의 필립 펠드먼(Philip Feldman)은 뉴 사이언티스트에 무언가에 동의한다고 해서 그것이 옳다는 것을 의미하지는 않는다고 말했다. 모델의 동일한 사본이 빠르게 합의를 이루는 것은 놀라운 일이 아니지만, 그들이 정한 솔루션이 최적이 아닐 가능성이 크다.
그러나 AI 에이전트는 속도와 정보 대역폭에 대한 생물학적 병목 현상에 제약을 받지 않기 때문에 인간보다 더 큰 규모의 협업이 가능할 가능성이 높다는 것은 직관적으로 보인다. 현재 모델이 이를 활용할 만큼 스마트한지는 불분명하지만, 미래 세대의 기술이 이를 활용할 수 있을 가능성은 충분히 있는 듯하다.
이미지 출처: Ant Rozetsky / Unsplash