AI가 교육 전반을 바꾼다: AI가 인간이 쓴 답변보다 더 나은 성적을 받아온다.
숨겨진 인물
교묘하지만 영리한 실험에서, 영국 대학의 연구원들은 AI가 생성한 답변을 소속 기관의 실제 테스트에 제출하여 동료 교수들을 속이고 실제 학생보다 더 나은 성적을 받았다.
레딩 대학교(Reading University)에서 수행되어 PLOS ONE 저널에 게재된 이 연구는 AI가 교육 전반을 어떻게 뒤바꾸고 있으며, 앞으로 학생을 교육하고 평가하는 방법을 알아내려고 노력하는 강사에게 새로운 골칫거리를 주는 방법을 보여준다.
"우리의 연구는 정보의 생산자이자 소비자로서 우리가 가지고 있는 책임을 강조한다"라고 독서 심리학 교수이자 공동 저자인 에티엔 로쉬(Etienne Roesch)는 연구에 대한 성명에서 말했다. "우리는 학술 및 연구 진실성에 대한 헌신을 두 배로 강화해야 한다."
연구를 위해 연구원들은 심리학에 관한 여러 학부 과정의 시험을 치르고 OpenAI의 ChatGPT가 이에 대한 답변을 생성하도록 유도한 다음 가짜 학생 이름이 포함된 결과 작업을 제출했다. 시험은 최대 200단어의 짧은 답안이나 1,500단어의 에세이를 요구했다.
이 연구를 알지 못한 다른 교수들은 시험을 채점하고 AI가 생성한 답안을 암울한 6%로 평가했으며 대다수가 인간이 만든 것으로 통과했다고 한다. 그리고 눈에 띄게 AI 답변은 레딩 대학교의 실제 학생들에 비해 더 높은 점수를 받았다.
향후 계획
연구자들은 지금까지 AI가 교육에 미치는 영향에 대한 "동종의 가장 크고 가장 강력한 블라인드 연구"라고 부르며, 이 연구는 ChatGPT가 컴퓨터가 인간과 대화할 수 있는지 확인하는 방법인 튜링테스트(Turing Test)를 통과할 수 있음을 입증했다고 주장한다. 컴퓨터가 다른 사람이라고 생각하여 그 사람을 속인다.
연구에 참여한 연구자들은 또한 학생들을 평가하는 방식이 바뀌어야 하며 AI가 어떤 방식으로든 교육에 통합되어야 한다고 제안한다.
학생을 평가하고 AI 지원 표절을 방지하기 위해 교육자들은 이미 구술 시험부터 수업 내 작업에 이르기까지 다양한 옵션을 검토하고 있다. 집에 가져가는 시험이나 심지어 컴퓨터로 실시하는 시험도 아직 진행 중이 아니라면 빠르게 과거의 일이 될 수 있다.
하지만 교실에서 AI를 활용하는 측면에서는 이는 미래의 학생들이 무기력해지고 AI를 버팀목으로 의지하게 될 것이라는 공포스러운 운명에 빠지거나 AI가 큰 단점이 없는 또 다른 멋진 기술 도구라는 낙관주의에 빠지는 교육자들을 확실히 나누는 논란의 여지가 있는 주제이다.
시간이 사회가 어디로 향하고 있는지 말해 줄 것이다.