국내 연구진이 인공지능(AI)을 이용해 소리를 듣고 어떠한 상황인지 음향 인식 기술력을 겨루는 국제대회에서 세계 1위를 달성했다.
한국전자통신연구원(ETRI)은 지난 3일 세계적인 인공지능 기반 음향 이벤트 및 장면 인식 기술 경진대회(DCASE) '음향 장면 인식 분야'에 참가해 전 세계 기업, 대학 연합팀들과 겨뤄 이 같은 성적을 거뒀다고 20일 밝혔다.
올해로 6회째를 맞이한 이 대회는 세계 최대 전기·전자기술자협회(IEEE) AASP가 주관하고 구글, 인텔, 아마존, IBM, 삼성, LG 등 세계 유수 기관이 참가하는 음향 기술 관련 유일한 대회다.
대회는 6개 분야에 총 138개팀과 473개의 제안 시스템이 제출돼 지난 3월부터 6월 중순까지 과제별 기술 경쟁이 이뤄졌다. ETRI가 참가한 분야 중 하나인 '복수 단말 대상 음향 장면 인식' 과제는 여러 종류의 단말기로 녹음한 소리를 듣고 녹음 장소를 알아맞히는 분야다. 이번 대회는 ETRI 미디어부호화연구실 서상원 연구원, 박수영 연구원, 정영호 책임연구원이 공동으로 참여했다.
연구진은 이 분야에서 시스템 순위 1, 2위를 석권하며 기술력을 자랑했다. 팀별로 최대 4개 기술까지 제출이 가능해 총 28개 팀, 92개 시스템이 출전한 가운데 ETRI 기술들은 최고의 성적을 차지하며 팀 순위 1위를 달성했다. 팀 순위 2등은 조지아텍-중국과기대-텐센트-UEK 연합팀이 차지했다.
연구진이 개발한 기술은 노약자 및 청각 장애인 등을 위한 '위험 회피 기술' 분야로 응용이 가능하다. 연구진은 우수한 성적의 비결로 ▲소리를 주파수 대역별로 나눠 모델이 각각 학습을 할 수 있도록 만든 '딥러닝 기반 트라이던트 구조 신경망 개발' ▲단말별 오디오 신호처리 특성 일반화를 이루는데 강점을 지닐 수 있는 '비균등 입력 특징 분할 기법'을 설계, 적용한 점을 들었다.
ETRI 김흥묵 미디어연구본부장은 "딥러닝 기반 음향 인식 기술은 향후 새로운 응용 서비스 기술 개발을 통해 국내 관련 산업의 경쟁력 확보와 시장 활성화에 크게 기여할 것"이라며 "아직 갈 길이 먼 청각 분야 상황에서 '전자귀'와 같은 모든 음향을 인식할 수 있는 수준을 목표로 연구개발 중"이라고 밝혔다.
한편, 연구진은 '저복잡도 기반 음향 장면 인식', '음향 발생 방향 및 이벤트 인식' 분야에도 참가, 좋은 성적을 거뒀다.
Copyright ⓒ 메트로신문 & metroseoul.co.kr
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성