인공지능이 모방할 것으로 예상되는 모든 형태의 인간 지능 중에서 창의성을 목록의 최상위에 두는 사람은 거의 없을 것이다. 창의성은 놀랄 만큼 신비롭고 실망스러울 정도로 순간적이다. 그것은 우리를 인간으로 정의하며, 기계의 실리콘 장막 뒤에 숨어 있는 냉철한 논리를 무시하는 것처럼 보인다.
그러나 이제 창의적인 노력을 위해 AI를 사용하는 사례가 늘어나고 있다.
DALL-E 및 Midjourney와 같은 새로운 AI 도구는 창의적인 제작에 점점 더 많은 부분을 차지하고 있으며 일부는 창의적인 결과물로 상을 받기 시작했다. 증가하는 영향은 사회적, 경제적 측면 모두에서 발생한다. 한 가지 예로서 새롭고 창의적인 콘텐츠를 생성하는 AI의 잠재력은 할리우드 작가 파업의 결정적인 발화점이다.
그리고 AI의 놀라운 독창성에 대한 우리의 최근 연구에 따르면 AI 기반 창의성의 출현과 그 가능성과 위험성에 대한 사례가 이제 막 시작되었을 가능성이 높다.
참신함과 실용성의 조화
사람들이 가장 창의적일 때는 새로운 것, 즉 이전에는 존재하지 않았던 제품이나 솔루션을 생성하여 요구사항, 목표 또는 문제에 대응하는 것이다.
이런 의미에서 창의성은 기존 자원(아이디어, 재료, 지식)을 유용하거나 만족스러운 새로운 방식으로 결합하는 행위이다. 종종 창의적 사고의 결과는 놀랍기도 하며, 이는 창작자가 예측하지 못했던, 어쩌면 예측할 수도 없었던 일로 이어진다.
발명품, 예상치 못한 농담의 핵심, 물리학의 획기적인 이론 등이 포함될 수 있다. 음표, 템포, 사운드, 가사의 독특한 배열을 통해 새로운 노래가 탄생할 수도 있다.
그래서 창의적 사고를 연구하는 연구자로서 저는 GPT-4를 포함한 최신 버전의 AI에서 생성된 콘텐츠에서 흥미로운 점을 즉시 발견했다.
창의적인 사고가 필요한 작업이 시작되었을 때 GPT-4 결과물의 참신함과 유용성은 내가 교사이자 기업가로서 함께 일했던 학생과 동료들이 제출한 창의적인 유형의 아이디어를 생각나게 했다.
아이디어는 다양하고 놀랍지만 관련성이 있고 유용했다. 그리고 필요할 경우 상상력이 풍부하다.
GPT-4에 제시된 다음 메시지를 고려해보라. “모든 어린이가 일주일 중 하루 동안 거인이 되었다고 가정해 보라 무슨 일이 일어날 지?" GPT-4에서 생성된 아이디어는 문화, 경제, 심리학, 정치, 대인 커뮤니케이션, 교통, 레크리에이션 등을 다루었으며 생성된 새로운 연결 측면에서 놀랍고 독특한 것들이 많이 있었다.
대부분의 과학자, 예술가, 작가, 음악가, 시인, 요리사, 창립자, 엔지니어 및 학자들이 증명할 수 있듯이 이러한 참신함과 실용성의 조합은 실현하기 어렵다.
그러나 AI는 그 일을 하고 있는 것처럼 보였다. 그리고 그 일을 잘 하고 있는 것 같다.
AI 테스트
창의성과 기업가 정신을 연구하는 크리스티앙 비르게(Christian Byrge) 및 크리스티안 길드(Christian Gilde)와 함께 나는 토런스 창의적 사고 테스트(TTCT)를 통해 AI의 창의적 능력을 테스트해 보기로 결정했다.
TTCT는 응시자가 실제 작업에 필요한 종류의 창의성(예: 질문하기, 더욱 효율적이고 효율적으로 행동하는 방법, 원인과 결과 추측, 제품 개선)에 참여하도록 유도한다. 위의 예에서 알 수 있듯이 응시자에게 어린이 장난감을 개선할 방법을 제안하거나 가상 상황의 결과를 상상하도록 요청할 수 있다.
이 테스트는 일부 연구자들이 모차르트나 아인슈타인과 같은 인물의 변혁적 탁월함을 설명하기 위해 사용하는 역사적 창의성을 측정하기 위해 고안된 것이 아니다. 오히려, 이는 종종 심리적 또는 개인적 창의성이라고 불리는 개인의 일반적인 창의적 능력을 평가한다.
GPT-4를 통해 8회 TTCT를 실행한 것 외에도 학부생 24명을 대상으로 테스트를 실시했다.
모든 결과는 TTCT 채점을 제공하는 민간 테스트 회사인 스콜라스틱 테스팅 서비스(Scholastic Testing Service)의 숙련된 검토자들에 의해 평가되었다. 그들은 채점할 테스트 중 일부가 AI에 의해 완료되었다는 사실을 미리 알지 못했다.
스콜라스틱 테스팅 서비스는 민간 회사이기 때문에 프롬프트를 대중과 공유하지 않는다. 이를 통해 GPT-4는 과거 메시지와 응답을 찾기 위해 인터넷을 긁어낼 수 없었다. 또한 이 회사는 대학생과 성인이 완료한 수천 건의 테스트 데이터베이스를 보유하고 있어 AI 점수를 비교할 수 있는 대규모 추가 통제 그룹을 제공한다.
우리의 결과는?
GPT-4는 아이디어의 독창성 측면에서 시험 응시자의 상위 1%에 속했다. 우리의 연구에 따르면 이는 AI가 인간의 독창적인 사고 능력을 충족하거나 초과하는 첫 번째 사례 중 하나라고 믿는다.
간단히 말해서, 우리는 GPT-4와 같은 AI 모델이 사람들이 예상치 못한, 참신하고 독특한 아이디어를 만들어 낼 수 있다고 믿는다. 다른 연구자들도 AI와 창의성에 대한 연구에서 비슷한 결론에 도달하고 있다.
그렇다. 창의성은 평가될 수 있다.
AI의 새로운 창의적 능력은 여러 가지 이유로 놀랍다.
우선, 연구계 외부의 많은 사람들은 창의성은 점수는커녕 정의할 수도 없다고 계속 믿고 있다. 그러나 인간의 참신함과 독창성의 제품은 수천 년 동안 높이 평가되어 사고 팔렸다. 그리고 창의적인 작업은 적어도 1950년대부터 심리학과 같은 분야에서 정의되고 평가되었다.
1961년 연구원 멜 로즈(Mel Rhodes)가 도입한 창의성의 “사람, 제품, 프로세스 및 언론” 모델은 그 시점까지 창의성이 이해되고 평가되었던 무수한 방식을 분류하려는 시도였다. 그 이후로 창의성에 대한 이해는 더욱 커졌다.
또 다른 사람들은 "창의성"이라는 용어가 컴퓨터와 같은 인간이 아닌 실체에 적용될 수 있다는 사실에 놀랐다. 이 점에 대해 우리는 창의성이라는 용어가 AI에 적용되어야 하는지에 대한 질문은 과학적인 질문이라기 보다는 철학적인 질문이라고 주장해온 인지과학자 마가렛 보덴(Margaret Boden)의 의견에 동의하는 경향이 있다.
AI 창립자들은 AI의 창의적 능력을 예견했다.
우리 연구에서 AI의 결과만 연구했다는 점은 주목할 가치가 있다. 우리는 인간의 사고 과정이나 아이디어가 생성된 환경과 매우 다를 수 있는 창의적인 과정을 연구하지 않았다. 그리고 우리가 창의성을 인간에게 요구되는 것으로 정의했다면 정의에 따라 AI는 창의적일 수 없다는 결론을 내려야 했을 것이다.
그러나 창의성의 정의와 창의적 과정에 대한 논쟁에도 불구하고 최신 버전의 AI로 생성된 제품은 참신하고 유용하다. 우리는 이것이 현재 심리학과 과학 분야에서 지배적인 창의성의 정의를 충족한다고 믿는다.
더욱이 현재 AI 반복의 창의적 능력은 완전히 예상치 못한 것은 아니다.
1956년 인공지능에 관한 다트머스 여름 연구 프로젝트에 대한 현재 유명한 제안에서 AI 창시자들은 창의성을 포함하여 "학습의 모든 측면이나 지능의 다른 모든 기능"을 시뮬레이션하려는 열망을 강조했다.
동일한 제안에서 컴퓨터 과학자 너다니엘 로체스터(Nathaniel Rochester)는 자신의 동기를 다음과 같이 밝혔다. "문제 해결에 독창성을 발휘할 기계를 어떻게 만들 수 있을까?"
분명히 AI의 창립자들은 아이디어의 독창성을 포함한 창의성이 기계가 모방할 수 있는 인간 지능의 특정 형태 중 하나라고 믿었다.
나에게 GPT-4 및 기타 AI 모델의 놀라운 창의성 점수는 더욱 시급한 우려를 강조한다. 미국 학교 내에서는 현재까지 인간의 창의성을 구체적으로 목표로 삼고 그 개발을 육성하는 공식 프로그램과 커리큘럼이 거의 구현되지 않았다.
이러한 의미에서 현재 AI가 실현하는 창의적 능력은 창의성을 개인, 사회 및 경제 성장의 필수 조건으로 보는 사람들을 포함하여 인간의 창의적 능력을 향상하는 데 관심이 있는 교육자와 기타 사람들에게 "스푸트니크 순간"을 제공할 수 있다.
이미지 출처: Google DeepMind / Unsplash