메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 CEO와칭 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

마인즈랩 음성변환 응용기술, AI 세계 톱 학회에 게재 승인

'코타트론(Cotatron)' 연구 논문의 저자인 마인즈랩 브레인팀 박승원 수석 연구원. /마인즈랩

마인즈랩은 딥러닝 기반의 음성 변환 응용 기술인 '코타트론(Cotatron)' 논문이 AI 세계 톱 학회인 인터스피치(Interspeech)에 게재 승인이 됐다고 28일 밝혔다.

 

인터스피치는 음성신호처리 분야에서 세계 최대 규모의 음성처리 분야 국제 학회이며, 국내외 글로벌 기업이나 연구소에서 매년 참가해 최신 기술 및 연구성과를 공유하는 권위있는 AI 학회이다.

 

인터스피치가 승인한 마인즈랩의 코타트론 기술은 입력 음성이 주어지면 마치 다른 사람이 그 음성을 똑같은 어조로 읽은 듯한 음성을 합성해내는 AI 기술이다. 음성변환 기술은 그동안 엔터테인먼트, 콜센터 등 분야에 활용될 가능성으로 주목받은 기술이지만 상용화가 되기에는 구현이 까다롭고 성능이 부족하다는 평가가 많았다. 이전 음성변환 기술은 대체로 2~4명 정도의 제한된 수의 화자 사이의 음성변환만 학습 가능했지만 마인즈랩의 코타트론 기술을 활용하면 많게는 100명 이상 화자 사이의 음성변환을 학습할 수 있어 데이터 부족 문제를 해결하고, 상용화에 드는 비용을 크게 줄일 수 있게 된다.

 

특히, 마인즈랩의 코타트론 논문은 올해 8월 아카이브를 통해 발표된 음성변환 분야 최고 석학들이 작성한 논문에서 인용되는 성과를 냈다.

 

연구 논문의 저자인 마인즈랩 박승원 수석 연구원은 "코타트론 기술을 활용해 임의의 화자의 음성을 다른 화자의 음성으로 변환할 수 있게 돼, 음성변환 기술의 활용 가능 분야를 크게 확장했다"며 "코타트론 기술을 잘 응용한다면 전 세계적으로 음성합성 관련 수요가 많은 엔터테인먼트, 콜센터 등 분야에서 큰 경제적 가치를 창출해낼 것"이라고 말했다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr