메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>방송통신

[일문일답] "말만 하면 척척"…SK텔레콤이 내놓는 AI 서비스는?

박일환 SK텔레콤 디바이스 지원단장이 음성인식 기반 인공지능 서비스 '누구'(NUGU) 소개 발표를 진행하고 있다. / SK텔레콤



"팅커벨, 오늘 날씨는 어때?"

'팅커벨'에게 날씨를 물으면 오늘 날씨를 바로바로 확인할 수 있다.

"가을에 어울리는 노래 추천해줄래?"

노래 추천을 요청하면 가을에 어울리는 분위기 있는 음악이 나온다.

스마트홈과 연동돼 조명이나 제습기, 플러그 등 가전기기를 제어할 수도 있다.

SK텔레콤이 인공지능 서비스를 선보이며, 'AI 대중화 시대' 개막을 선언했다. SK텔레콤은 31일 서울 중구 을지로 본사 사옥에서 열린 간담회에서 음성인식 기반 인공지능 서비스 '누구'(NUGU)와 전용 기기를 공개하고, 고객·외부 개발자와 인공지능 플랫폼 서비스의 진화를 함께 만들어 가겠다는 계획을 발표했다.

이형희 SK텔레콤 사업총괄은 "새로운 산업 영역 개척하고 새로운 생태계 생성함에 있어서 음성 인식이 기반이 되고 결과적으로 생활 편의성을 획기적으로 높여주는 서비스를 만들겠다는 생각에 누구를 개발하게 됐다"고 말했다.

누구는 고객과의 대화 맥락을 이해하는 인공지능 플랫폼과 음성 입출력이 가능한 원통형 디자인의 전용 스마트기기로 구성된 스피커형 인공지능 디바이스다.

누구는 고객이 원하는 바를 파악한 후 음악 스트리밍 서비스·스마트홈 등과 연동해 ▲조명, 제습기, 플러그, TV 등 가전기기 제어 ▲음악 추천 및 자동 재생 ▲날씨, 일정 등 정보 안내 ▲스마트폰 위치 찾기 등 다양한 정보와 편의를 제공한다.

누구의 한국어 특화 음성 인식 기술은 목소리 톤, 억양, 사투리까지 알아들을 수 있는 국내 최고 수준의 음성 인식률을 자랑한다. 여기에 SK텔레콤이 독자 개발한 '자연어 처리 엔진'을 적용, 일상에서 대화하듯 편하게 얘기해도 누구의 인공지능이 맥락을 빠르게 파악해 기능을 수행할 수 있다.

가령 "신나는 음악을 틀어줘"라고 말하면 경쾌한 음악을 자동으로 선곡 재생해주고, 음악 정보를 물으면 가수, 제목을 답해주는 식이다.

누구의 음성인식 기술에는 딥 러닝(Deep Learning)을 접목했다. 따라서 누구는 데이터가 쌓일수록 스스로 진화한다. 특히 고객 이용이 많아질수록 서비스가 이해할 수 있는 단어와 문장도 대폭 증가한다. 사용하면 할수록 음성 인식률이 높아지는 식이다.

SK텔레콤은 ▲인터넷 쇼핑, 배달 음식 주문 등 커머스 ▲T맵 연계 실시간 빠른 경로 안내, 간편 지식 검색 등 생활 정보 ▲인터넷라디오 재생, 뉴스·구연동화 낭독과 같은 미디어 등 고객 선호에 맞춘 다양한 기능을 누구에 순차적으로 반영하고 고도화해 나갈 계획이다.

외부 개발자(서드 파티)들이 서비스에 참여할 수 있도록 내년 상반기에는 누구의 핵심 정보(API)를 외부에 공개, 연계 서비스 개발을 통한 생태계 구축도 추진한다.

박일환 SK텔레콤 단장은 "궁극적으로 누구를 고객 일상과 언제나 함께하는 동반자이자 당사 생활가치플랫폼과 서비스를 전달하는 핵심 접점으로 성장시켜 갈 것"이라고 밝혔다.

다음은 SK텔레콤 박일환 디바이스지원단 단장, 김성한 디바이스지원단 기획본부장, 박명순 미래기술원 원장 등과의 일문일답이다.

- 누구 디바이스가 자체 통신 기능 갖추고 있는지, 아니면 스마트폰과 연동됐는지 궁금하다. 요금제는 따로 있나.

▲누구 디바이스는 처음에는 가동을 위해 스마트폰 애플리케이션(앱)을 통해 접속하는 일을 진행하게 된다. 그 이후는 독자적으로 통신한다. 누구로 인한 추가 요금은 없다.

- 누구에서 나오는 목소리 주인이 누군지 궁금하다. 시연 때 '팅커벨'로 불렀는데 이름 바꿔도 되나. 앱 연동은 어떻게 하는 것인지 궁금하다.

▲ 고객들에게 감성적인 목소리를 전달하기 위해 다양한 성우 목소리를 테스트해서 가장 감성적인 목소리 가진 성우를 채택해 녹음했다.

누구 명칭은 현재는 기술적 부분을 고려해 팅커벨, 크리스탈, 아리아, 레베카 네 가지 이름으로 명명할 수 있다. 향후에는 이름을 적용하기 위해 학습이 필요하다. 학습 이후에는 원하는 이름으로 부를 수 있도록 최대한 빠른 시간 안에 구현할 수 있도록 진행할 예정이다.

앱 연동은 누구 앱에서 T아이디 통해 회원가입 해 스마트폰 단말 연동시키면 쉽게 이용할 수 있도록 구현했다.

- 사람마다 다양한 언어 습관이 있다. 빅데이터로 이를 수집해야 한다고 보는데, 데이터베이스를 어떻게 접목시켰나.

▲자연어처리를 2011년부터 시작했다. 한국어와 관련 자연어처리 데이터베이스가 구축돼 있었다. 이번에 출시하면서 그 중 음악 관련 도메인을 집중적으로 했다. 음악 관련 데이터 추가로 구축했고 일반적인 것은 이전까지 쌓아온 데이터다. 출시 이후에는 고객들이 바라는 데이터 분석을 해 세미 리얼타임 형태로 구축해나갈 계획이다.

- 인공지능에서는 사용자 답변 머신러닝으로 알고리즘으로 처리한다. 알고리즘 필요한데, 자체적으로 어떻게 개발했나. 스피커만 있고, 디스플레이는 탑재하지 않았는데.

▲다양한 데이터들이 사용함으로 인해 들어오는 데이터가 다양할 것이다. 내부적으로는 머신러닝 인프라 자체적 200대 서버와 많은 CPU 등으로 구성돼 있다. 앞으로 수집할 데이터는 최소 위클리 단위로 모아 학습해 엔진에 반영할 계획이다.

또한 누구 디바이스 자체가 음성 인터페이스를 기본으로 하고 있다. 음성은 음성으로 답변하는 게 가장 자연스럽다고 판단했다.

음성은 큐레이션이고, 고객에게 맞는 최적 답변 제안하는게 장점이다. 다양한 서비스 로드맵 가지고 있고, 고객 제안에 따라 다양한 서비스 확장할 예정이다. 서비스 최적화될 단말 형태는 계속 내부적으로 고민, 확대시킬 것이다.

- 음성인식 인공지능 기기는 해외서도 에코, 구글 홈 등이 경쟁적으로 뛰어들고 있다. 장기적으로 경쟁을 피할 수 없을텐데 SK텔레콤은 어떤 부분에서 차별화 될 수 있나.

▲기술적 관점에서는 음성, 영상, 자연어처리 부분에서 국내 최초로 기술력을 장기간 투자해 해왔고 현재 상당부분 완성도 높여왔다고 자평한다. 하드웨어 부분서는 누구 디바이스가 외형, 디자인적으로 감성적인 포인트를 강조했다. 외부의 무드등 기능 해 감성적 교감 가능한 디자인이다. 또한 SK텔레콤 관계사인 아이리버 전문가들이 직접 튜닝 작업에 참여해 고품질 음악 서비스를 제공한다.

- 누구가 음성 인식할 때 자신의 음성을 기억하라고 입력해야 하나. 다른 사람 목소리 인식도 가능한가.

▲개인별 식별은 하지 않는다. 집에서 누구나 사용할 수 있다. 이후에는 음성으로 화자 인식을 하는 기술이 있다. 내년에는 화자 인증 기술을 가지며 아기, 엄마가 불렀을 때 이해하는 것을 달리 가져가는 것을 계획하고 있다.

- 누구는 한국어 처리만 가능한가. 다국어 계획 있나. 수출 계획은 없는지.

▲현재는 한국어 중심으로 돼 있다. 다국어처리 많은 인력이 필요하다. 영어 등을 접목하려면 개발보다는 영어를 처리하는 파트너사와 협업하는 게 맞다고 생각한다.
트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr