데이터베이스용 생성 AI
MIT 연구원들은 데이터베이스 사용자가 뒤에서 무슨 일이 벌어지고 있는지 알 필요 없이 표 형식 데이터의 복잡한 통계 분석을 더 쉽게 수행할 수 있게 해주는 새로운 도구를 개발했다.
데이터베이스용 생성 AI 시스템인 GenSQL은 사용자가 몇 번의 키 입력만으로 예측을 하고, 이상 현상을 감지하고, 누락된 값을 추측하고, 오류를 수정하고, 합성 데이터를 생성하는 데 도움을 줄 수 있다.
GenSQL은 불확실성을 설명하고 새로운 데이터를 기반으로 의사 결정을 조정할 수 있는 생성 확률 AI 모델과 표 형식 데이터 세트를 결합한다.
GenSQL은 또한 데이터베이스의 실제 데이터를 모방하는 합성 데이터를 생성하고 분석할 수 있다. 이는 환자 건강 기록과 같이 민감한 데이터를 공유할 수 없거나 실제 데이터가 희박한 경우에 유용하다.
SQL 확장
이 새로운 도구는 1970년대 후반에 도입되어 전 세계 수백만 명의 개발자가 사용하는 데이터베이스 생성 및 조작을 위한 프로그래밍 언어인 SQL을 기반으로 구축되었다.
연구원들은 데이터 분석을 위한 널리 사용되는 AI 기반 접근 방식에 비해 GenSQL이 더 빠르고 더 정확한 결과를 생성한다고 말한다. 또한 생성된 모델은 설명 가능하므로 사용자가 읽고 편집할 수 있다.
다음으로 연구원들은 GenSQL을 보다 광범위하게 적용하여 인구에 대한 대규모 모델링을 수행하려고 한다. GenSQL을 사용하면 분석에 사용되는 정보를 제어하면서 건강 및 급여와 같은 사항에 대한 추론을 도출하는 합성 데이터를 생성할 수 있다.
ChatGPT와 유사한 AI 전문가
장기적으로 연구원들은 사용자가 GenSQL에서 자연어 쿼리를 수행할 수 있도록 하려고 한다. 그들의 목표는 GenSQL 쿼리를 사용하여 답변의 근거가 되는 모든 데이터베이스에 대해 이야기할 수 있는 ChatGPT와 같은 AI 전문가를 개발하는 것이다.
이 연구는 최근 프로그래밍 언어 설계 및 구현에 관한 ACM 컨퍼런스에서 발표되었다.