마인즈랩은 딥러닝 기반의 음성 변환 응용 기술인 '코타트론(Cotatron)' 논문이 AI 세계 톱 학회인 인터스피치(Interspeech)에 게재 승인이 됐다고 28일 밝혔다.
인터스피치는 음성신호처리 분야에서 세계 최대 규모의 음성처리 분야 국제 학회이며, 국내외 글로벌 기업이나 연구소에서 매년 참가해 최신 기술 및 연구성과를 공유하는 권위있는 AI 학회이다.
인터스피치가 승인한 마인즈랩의 코타트론 기술은 입력 음성이 주어지면 마치 다른 사람이 그 음성을 똑같은 어조로 읽은 듯한 음성을 합성해내는 AI 기술이다. 음성변환 기술은 그동안 엔터테인먼트, 콜센터 등 분야에 활용될 가능성으로 주목받은 기술이지만 상용화가 되기에는 구현이 까다롭고 성능이 부족하다는 평가가 많았다. 이전 음성변환 기술은 대체로 2~4명 정도의 제한된 수의 화자 사이의 음성변환만 학습 가능했지만 마인즈랩의 코타트론 기술을 활용하면 많게는 100명 이상 화자 사이의 음성변환을 학습할 수 있어 데이터 부족 문제를 해결하고, 상용화에 드는 비용을 크게 줄일 수 있게 된다.
특히, 마인즈랩의 코타트론 논문은 올해 8월 아카이브를 통해 발표된 음성변환 분야 최고 석학들이 작성한 논문에서 인용되는 성과를 냈다.
연구 논문의 저자인 마인즈랩 박승원 수석 연구원은 "코타트론 기술을 활용해 임의의 화자의 음성을 다른 화자의 음성으로 변환할 수 있게 돼, 음성변환 기술의 활용 가능 분야를 크게 확장했다"며 "코타트론 기술을 잘 응용한다면 전 세계적으로 음성합성 관련 수요가 많은 엔터테인먼트, 콜센터 등 분야에서 큰 경제적 가치를 창출해낼 것"이라고 말했다.
Copyright ⓒ 메트로신문 & metroseoul.co.kr
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성