광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

[무성 음성 인식 기술로 커뮤니케이션 혁신] 코넬 대학교의 연구원들은 입술과 입의 움직임을 기반으로 최대 31개의 무성 명령을 지속적으로 인식하기 위해 음향 감지 및 인공지능을 사용하는 묵음 인식 인터페이스인 EchoSpeech를 개발했다. 이 저전력 웨어러블 인터페이스는 스마트폰에서 작동할 수 있으며 명령 인식을 위해 몇 분의 사용자 교육 데이터만 필요하다.

https://www.unite.ai/echospeech-revolutionizing-communication-with-silent-speech-recognition-technology/

운영자 | 기사입력 2023/04/21 [00:00]

[무성 음성 인식 기술로 커뮤니케이션 혁신] 코넬 대학교의 연구원들은 입술과 입의 움직임을 기반으로 최대 31개의 무성 명령을 지속적으로 인식하기 위해 음향 감지 및 인공지능을 사용하는 묵음 인식 인터페이스인 EchoSpeech를 개발했다. 이 저전력 웨어러블 인터페이스는 스마트폰에서 작동할 수 있으며 명령 인식을 위해 몇 분의 사용자 교육 데이터만 필요하다.

https://www.unite.ai/echospeech-revolutionizing-communication-with-silent-speech-recognition-technology/

운영자 | 입력 : 2023/04/21 [00:00]

정보 과학 박사 과정 학생인 장루이동(Ruidong Zhang) "EchoSpeech: 어쿠스틱 센싱으로 구동되는 최소 눈에 거슬리는 안경의 연속 무성 음성 인식"의 주 저자이며이 논문은 컴퓨팅 시스템의 인적 요소에 관한 컴퓨팅 기계 협회 회의에서 발표될 예정이다. (CHI) 이번 달 독일 함부르크에서.

 

“소리를 낼 수 없는 사람들에게 이 무음 기술은 음성 합성기에 대한 훌륭한 입력이 될 수 있다그것은 환자들에게 그들의 목소리를 되돌려줄 수 있다.

 

실제 애플리케이션 및 개인 정보 보호 이점

현재 형태의 EchoSpeech는 시끄러운 식당이나 조용한 도서관과 같이 말하기가 불편하거나 부적절한 환경에서 스마트폰을 통해 다른 사람들과 통신하는 데 사용될 수 있다무음 음성 인터페이스는 스타일러스와 페어링할 수 있고 CAD와 같은 디자인 소프트웨어와 함께 사용할 수 있으므로 키보드와 마우스의 필요성이 크게 줄어든다.

 

연필 지우개보다 작은 마이크와 스피커가 장착된 EchoSpeech 안경은 웨어러블 AI 기반 소나 시스템으로 기능하여 얼굴 전체에서 음파를 송수신하고 입 움직임을 감지한다그러면 딥 러닝 알고리즘이 약 95%의 정확도로 이러한 에코 프로필을 실시간으로 분석한다.

 

정보과학 조교수이자 코넬 대학교의 SciFi(미래의 상호 작용을 위한 스마트 컴퓨터 인터페이스연구소 소장인 장 쳉(Cheng Zhang) "우리는 소나를 몸에 장착하고 있다."고 말했다.

기존의 무성 음성 인식 기술은 일반적으로 미리 결정된 제한된 명령 세트에 의존하며 사용자가 카메라를 마주하거나 착용해야 한다장 쳉은 이것이 실용적이거나 실현 가능하지 않으며 사용자와 사용자가 상호 작용하는 사람 모두에게 심각한 개인 정보 보호 문제를 야기한다고 설명했다.

 

EchoSpeech의 음향 감지 기술은 웨어러블 비디오 카메라가 필요하지 않다또한 오디오 데이터는 이미지나 비디오 데이터보다 작기 때문에 처리하는 데 필요한 대역폭이 적고 블루투스를 통해 실시간으로 스마트폰으로 전송할 수 있다고 정보 과학 교수인 프랑수아 기브레티에르(François Guimbretière)는 말한다.

 

"그리고 데이터는 클라우드에 업로드되지 않고 스마트폰에서 로컬로 처리되기 때문에 개인 정보에 민감한 정보는 절대 귀하의 통제를 벗어나지 않는다."고 그는 말했다.

 
안경의 연속 무성 음성 인식, 무음 기술, 음성 합성기 관련기사목록
PHOTO
1/6
광고
광고
광고
광고
광고
많이 본 기사
AGILab 뉴스 많이 본 기사
최신기사