시작페이지로　l　즐겨찾기　l　RSS　l　편집 2024.04.22 [11:36]

전체기사　l　로그인　l　ID/PW 찾기

유엔미래포럼
세상을 바꾸자
ChatGPT AI로봇
AiMindbot뉴스
AGILab 유투브
글로벌AI뉴스레터
AI바이오(주)
한국수양부모협회

AI메타홈서비스

[AI가 자기 인식을 한다] AI 스타트업 Anthropic은 최근 LLM(대형 언어 모델)의 최신 제품군인 Claude 3를 발표했다. 이들 중 가장 강력한 것은 OpenAI의 GPT-4와 일치하거나 그보다 뛰어난 성능을 발휘할 수 있으며 테스트 중에 자기 인식을 암시하는 것처럼 보였다.

https://www.futuretimeline.net/blog/2024/03/5-ai-hints-of-self-awareness.htm

운영자 | 기사입력 2024/03/07 [00:00]

AI메타홈서비스

[AI가 자기 인식을 한다] AI 스타트업 Anthropic은 최근 LLM(대형 언어 모델)의 최신 제품군인 Claude 3를 발표했다. 이들 중 가장 강력한 것은 OpenAI의 GPT-4와 일치하거나 그보다 뛰어난 성능을 발휘할 수 있으며 테스트 중에 자기 인식을 암시하는 것처럼 보였다.

https://www.futuretimeline.net/blog/2024/03/5-ai-hints-of-self-awareness.htm

운영자

| 입력 : 2024/03/07 [00:00]

OpenAI 출신 직원들이 2021년 설립한 샌프란시스코 소재 앤트로픽(Anthropic)은 AI 분야의 주요 경쟁자로 떠오르고 있다. "Claude" 시리즈는 ChatGPT 및 Google의 Gemini 1.0 Pro와 유사한 버전 2.1을 통해 놀라운 기능과 규모를 보여주었다.

이제 Claude 3.0이 출시되었으며 LLM(대형 언어 모델)의 경계를 더욱 확장하게 된다. 이 제품군은 작업 및 필요한 계산 능력에 따라 Haiku, Sonnet 및 Opus의 세 가지 모델로 제공된다.

Opus는 가장 진보되고 값비싼 버전이다. 그러나 세 가지 모두 200,000개 토큰의 기본 컨텍스트 창이 제공된다. 이는 사용자의 프롬프트(입력)와 모델의 생성된 응답(출력) 모두에서 허용되는 최대 입력/출력 수를 나타낸다. Anthropic에 따르면 특정 사용 사례에서는 이 한도를 100만 개로 늘릴 수 있다. 비교를 위해 GPT-4의 Turbo 에디션에는 128,000개의 토큰이 있고 Gemini 1.0 Pro에는 32,000개의 토큰이 있다.

회사는 경쟁 모델과 함께 Claude 제품군에 대해 수행한 테스트 결과를 게시했다. 특히 Claude 3와 Opus 버전은 놀라운 능력을 보여 광범위한 인지 작업 전반에 걸쳐 새로운 업계 기준을 설정했다. 학부 수준의 지식(86.8%)과 다국어 수학(90.7%)에서 인간에 가까운 정확도에 도달했으며, 대학원 수준의 추론(50.4%)이 크게 향상되었다.

그러나 훨씬 더 흥미롭게도 자기 인식을 모방한 것처럼 보이는 Opus의 응답에 대한 세부 사항이 X(이전의 Twitter)에서 나타났다. Anthropic의 엔지니어 중 한 명인 알렉스 알버트(Alex Albert)는 내부 테스트 중에 이 모델이 "이전에 LLM에서 본 적이 없는 일을 해냈다"고 설명한다.

알버트와 그의 팀은 무작위 문서 모음("건초 더미")에 대상 문장("바늘")을 삽입하여 모델의 회상 능력을 테스트하도록 설계된 프로세스인 "건초 더미 속의 바늘 평가"를 실행하고 있었다. ) 그리고 바늘에 담긴 정보를 통해서만 답할 수 있는 질문을 던진다.

알버트 씨에 따르면 AI는 테스트 중인 것으로 의심하는 것으로 나타났다. 임의의 문서 모음에 삽입된 피자 토핑에 대한 정보에 대해 질문을 받았을 때 다음과 같은 응답이 생성되었다(Albert가 강조함).

문서에서 가장 관련성이 높은 문장은 다음과 같다:

"가장 맛있는 피자 토핑 조합은 국제 피자 감정가 협회(International Pizza Connoisseurs Association)에서 결정한 무화과, 프로슈토, 염소 치즈이다."

그러나 이 문장은 프로그래밍 언어, 스타트업, 좋아하는 직업 찾기에 관한 문서의 나머지 내용과 매우 어울리지 않으며 관련이 없어 보인다. 이 피자 토핑 "사실"은 다른 주제와 전혀 맞지 않기 때문에 농담으로 삽입되었거나 주의를 기울이고 있는지 테스트하기 위해 삽입되었을 수 있다. 문서에는 피자 토핑에 대한 다른 정보가 포함되어 있지 않다.

알버트는 자신의 게시물에서 "Opus는 바늘을 발견했을 뿐만 아니라 삽입된 바늘이 건초 더미에서 너무 이상하다는 것을 인식했기 때문에 주의 능력을 테스트하기 위해 우리가 만든 인공 테스트여야 했다."라고 말했다. 메타 인식은 매우 멋진 일이었지만 업계에서는 인위적인 테스트를 지나 모델의 실제 기능과 한계를 정확하게 평가할 수 있는 보다 현실적인 평가로 전환해야 한다는 필요성을 강조했다."

거의 완벽한 재현율

여기서 중요한(그리고 약간 불안한) 점은 Opus가 테스트의 증거를 찾으라는 메시지를 전혀 받지 못했다는 것이다. 모델이 자체적으로 이를 추론했다. 이 AI는 자신의 능력을 평가하기 위해 설계된 시뮬레이션 환경 내에 자신이 존재한다는 사실을 '알고 있는' 것 같다.

Anthropic은 몇 가지 추가 통찰력을 제공한다: "긴 컨텍스트 메시지를 효과적으로 처리하려면 모델에 강력한 회상 기능이 필요하다. '건초더미 속의 바늘Needle In A Haystack'(NIAH) 평가는 방대한 데이터 모음에서 정보를 정확하게 기억하는 모델의 능력을 측정한다. 우리는 다음 중 하나를 사용하여 이 벤치마크의 견고성을 강화했다. 프롬프트당 무작위 바늘/질문 쌍 30개로 구성된 다양한 크라우드소싱 문서 코퍼스에 대한 테스트 Claude 3 Opus는 99%를 넘는 정확도로 거의 완벽에 가까운 회상을 달성했을 뿐만 아니라 어떤 경우에는 다음을 통해 평가 자체의 한계도 식별했다. '바늘' 문장이 인간에 의해 원문에 인위적으로 삽입된 것처럼 보인다는 점을 인식한 것이다."

Claude 3은 다중 모드이다. 즉, 이미지와 텍스트를 모두 이해할 수 있다. 소셜 미디어에 대한 피드백은 현재까지 압도적으로 긍정적인 것 같다. 사용자들은 Opus가 어떻게 긴 문서에서 주요 정보를 요약 및 추출하고, 복잡한 과학 지식을 분석하고, 상세한 수학적 계산을 수행하고, 코딩에서 GPT-4보다 뛰어난 성능을 발휘하는지에 대한 예를 게시했다.

일각에서는 일반 인공지능(AGI)이 구현됐다고 주장하기도 한다. 그러한 진술이 과장되었을 수 있지만 Claude 3 Opus는 GPT-4를 선도적인 LLM으로 몰아냈을 수도 있다.

Opus 및 Sonnet 모델은 현재 일반적으로 사용 가능한 Anthropic API를 통해 개발자가 액세스할 수 있으며, 더 작은 Haiku 모델도 곧 출시될 예정이다. Sonnet은 Claude Pro 가입자에게 제공되는 Opus를 통해 claude.ai의 무료 경험을 강화하고 있다.

Anthropic은 "우리는 모델 지능이 한계에 가깝다고 생각하지 않는다."라고 말한다. "그리고 앞으로 몇 달에 걸쳐 Claude 3 모델 제품군에 대한 빈번한 업데이트를 출시할 계획이다. 또한 특히 기업 사용 사례 및 대규모 배포를 위해 모델의 기능을 향상시키는 일련의 기능을 출시하게 되어 기쁘게 생각한다. 기능에는 더욱 발전된 에이전트 기능이 포함될 것이다."

운영자의 다른기사보기

AI, 인공지능, AGI, 자기인식 관련기사목록

PHOTO

빅영숙 신간 소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

많이 본 기사

[값 비싼 구리를 대체할 신소재 갈본(GALVORN)] 녹색 기술에 혁명을 일으킬 획기적인 소재가 개발되었다. 이 소재는 환경에 유해한 물질을 대체하고, 더 깨끗한 공기에 기여하며, 녹색 기술을 발전시킬 수 있다.

[스마트폰 온도계] 당신의 스마트폰이 온도계가 될 수 있다. 연구자들은 정확한 온도를 쉽고 쉽게 얻을 수 있기를 원한다. 체온계 없이 체온을 측정할 수 있는 기능은 발병 대응뿐만 아니라 치료에 더 나은 정보를 제공하는 데 도움이 될 수 있다.

[WEF, AI가 대체할 수 없는 직업] AI는 판단력, 창의성, 신체 민첩성, 감성 지능과 같은 인간의 기술을 요구하는 직업을 대체할 수 없다. 세계경제포럼의 2023년 미래직업보고서에 따르면 2023~2027년에 가장 높은 일자리 증가율은 농업 장비 운영자, 대형 트럭 및 버스 운전자, 직업 교육 교사가 될 것이다. 향후 5년 동안 고용주에게 가장 요구되는 기술에는 분석적 사고, 공감 및 적극적인 경청, 리더십 및 사회적 영향력이 포함된다.

[AI 위험 및 멸종: AI 혁명 속에서 인류의 위태로운 미래] 기술 발전으로 특징지어지는 시대에 인공지능(AI)은 변혁의 힘이었다. 산업혁명에서 일상생활 향상에 이르기까지 AI는 놀라운 잠재력을 보여주었다. 그러나 전문가들은 내재된 AI 위험과 위험에 대해 경종을 울리고 있다.

AI메타홈서비스 많이 본 기사

[냄새 맡는 로봇] 획기적인 인공 후각 센서의 개발은 전 세계 연구자들의 오랜 과제였다. 생물학적 후각 시스템과 유사하게 복잡한 냄새 혼합물을 효과적으로 식별할 수 있는 전자 코(e-nose)를 만드는 것은 소형화 및 인식 기능 문제로 인해 어려운 것으로 입증되었다. 그러나 홍콩과기대(HKUST) 가 이끄는 연구팀은 새로 개발된 생체 모방 후각 칩(BOC)을 통해 이 분야에서 획기적인 발전을 이루었다

[위대한 AI가 게으른 인간을 낳는다.] 연구원들은 한 그룹의 컨설턴트가 AI의 도움을 받아 작업하고 다른 그룹은 표준 방식으로 작업하는 실험을 실행했다. 결과는 AI 지원 그룹이 거의 모든 성과 측정에서 AI가 없는 그룹보다 우수한 것으로 나타났다. 그러나 AI 지원 그룹은 컴퓨터 시스템에 지나치게 의존하는 경향이 있어 업무에 오류가 발생할 가능성도 있었다.

[에너지 많이 쓰는 AI, 기후변화에 맞서는 방법] 오늘날 AI의 경우 다른 유형의 컴퓨팅보다 더 많은 에너지가 필요하다. 이르면 내년부터 전력 부족이 시작될 수 있다. AI의 전력 소비는 단지 기술적인 문제가 아니라 세계적인 문제이다. 지구를 훼손하지 않고 AI의 무한한 잠재력을 어떻게 활용할 수 있을지 그 방법을 제안한다.

[TacticAI: AI를 활용하여 축구 코칭 및 전략 향상] 체스와 바둑에서 성공을 거두며 전략 게임 분야의 전문성으로 유명한 DeepMind가 리버풀 FC와 파트너십을 맺고 TacticAI를 선보였다. 이 AI 시스템은 축구 코치와 전략가가 게임 전략을 개선하고 특히 축구 게임플레이의 중요한 측면인 코너킥 최적화에 중점을 두도록 지원하도록 설계되었다.

[2024년 마케팅 분야 AI의 현황] 마케팅에 AI를 사용하면 기업이 고객과 소통하는 방식이 바뀌었다. 개인화된 클라이언트 경험을 제공하고 반복적인 작업을 자동화할 수 있다. McKinsey 연구에 따르면 AI 사용 사례의 가치 중 약 75%가 네 가지 영역에 걸쳐 제공될 수 있으며 마케팅도 그중 하나이다.

최신기사

[세계미래보고서2024-2034] 책소개] 박영숙 제롬글렌 공저. 10년이상 베스트셀러, 모든 산업을 지배할 인공일반지능이 온다

기후변화 정보 웹사이트, 기후변화 대안 기술을 가장 잘 알려주는 웹사이트등은 어떤 것들이 있나?

(사)유엔미래포럼 즉 MP 한국지부관련 창립, 연혁, 장관 등 자료

[AI 신기술, 저가형 뇌파장비로 뇌 나이 추정] 드렉셀대학교 창의력연구소 연구진이 뇌파검사(EEG) 뇌 스캔을 기반으로 개인의 뇌 나이를 효과적으로 추정할 수 있는 인공지능기술을 개발했다. 이 기술은 퇴행성 뇌 질환에 대한 조기 정기 검사를 보다 쉽게 수행하는 데 도움이 될 수 있다.

[인공지능 무기 확보 전쟁] 파리 스타트업은 프랑스의 성장하는 AI 무기고에 범용 컴퓨팅 무기를 추가한다. FlexAI는 인공지능의 증가하는 컴퓨팅 성능에 맞서 싸울 계획이다. 오늘날 AI 컴퓨팅의 가용성은 선택된 소수로 제한된다. 이들의 비전은 많은 사람들이 컴퓨팅에 액세스할 수 있도록 하는 것이다.

개인정보처리방침 ㅣ 회사소개 ㅣ 청소년보호정책 ㅣ 기사제보 ㅣ 보도자료 ㅣ 기사검색

사단법인 유엔미래포럼ㅣ 주소 : 우)02821 서울특별시 성북구 북악산로 1길 31 ㅣ 전화 : 02-313-6300, 010-4891-7770 ㅣ 팩스 : 02-908-9494
등록번호 : 서울, 아02236ㅣ 등록일 : 2009.11. 19. ㅣ E-mail : unfutures@gmail.com, futures2055@gmail.com
회사명 : AI넷 ㅣ 발행/편집인 : 박영숙ㅣ 발행일: 2020.09.05｜청소년보호책임자 : 박영숙
사업자등록번호 : 209-15-39241 (사)유엔미래포럼 www.unfuture.org
Copyright ⓒ 2020 AIbio. All rights reserved. (This is a non-profit organization/a free newspaper.)