메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

이스트소프트, 'AI 플러스 2020'서 손정의 회장, 마크 주커버그 디지털 휴먼 선보여 큰 호응

이스트소프트 정상원 대표가 7일 온라인으로 개최된 'AI PLUS 2020' 콘퍼런스에서 개최 배경을 설명하고 있다. /이스트소프트

이스트소프트는 7일 개최한 인공지능(AI) 기술 콘퍼런스인 'AI PLUS 2020'에서 손정의 일본 소프트뱅크그룹 회장과 마크 주커버그 페이스북 최고경영자(CEO)의 화상 환영사를 내보내 웨비나에 모인 청중들의 큰 환호를 받았다. 하지만 이 화상 영상이 진짜가 아닌 최근 이스트소프트가 개발한 AI 아나운서 기술을 활용해 가상으로 제작한 것이라고 밝혀 깜짝쇼를 통해 '진짜 같은' AI 아나운서의 기술력을 보여줬다.

 

이날 온라인으로 개최된 콘퍼런스에서 이스트소프트 AI플러스랩의 권택순 수석은 'AI 아나운서 개발기' 주제 발표를 통해 "현재는 아나운서 개발시 데이터 검수 및 전처리에 2일, AI 모델 학습에 2일, 튜닝 및 검수에 1일 등 5일에서 일주일 정도면 개발을 완료할 수 있다"며 "움직임이 거의 없는 아나운서와 달리 손정의 회장과 마크 주커버그는 데이터도 많지 않고 움직임이 많아 개발이 더 어려웠다"고 말했다.

 

이스트소프트 AI플러스랩의 권택순 수석이 'AI 아나운서 개발기'라는 주제로 발표를 하고 있다. /이스트소프트

그는 "올해 7월부터 YTN플러스와 공동으로 김경수 아나운서를 모델로 한 AI 아나운서를 3개월 간 개발했는데, 목소리 생성 AI가 음성을 생성하고 얼굴 생성 AI가 그 음성에 맞는 이미지를 생성해 화면을 만들었다"며 "비전 사업부에서 진행하다 보니 얼굴을 잡아내기는 쉬웠지만 음성 기술이 없어 어려움이 있었다"고 설명했다. 음성 부분은 라이언로켓에서 제공받아 상용 서비스를 개발했다. 특히, 김 아나운서가 아닌 다른 사람을 모델로도 AI 개발이 가능해 모든 동영상에 적용이 가능하다고 덧붙였다.

 

권 수석은 또 "AI 아나운서는 기억했다 이를 끄집어내는 기술이 가장 핵심으로, 김 아나운서의 목소리와 이미지에 AI가 기억해 목소에 맞는 눈, 코, 입 등의 얼굴 모양을 끌어내는 데 중점을 두고 있다"며 "얼굴 인식 기술로 타깃 얼굴만 잡아내고 샘플링 중 앵커가 등장하는 구간 만 추려내 모든 프레임을 분석석했다"고 소개했다.

 

AI 아나운서를 개발하기 위해 방송사에서 1~3차까지 대량의 데이터를 제공받아, 600개 정도의 클립이 필요했으며, 데이터를 정제해 3시간30분 분량을 입력했다고 설명했다.

 

권 수석은 "처음에는 뉴스 길이 대비 3배 정도로 20초짜리 앵커멘트에 60초 정도의 영상이 필요했는 데, 프로토타입 때 퀄리티에 집중해 20초 영상을 20초면 만들 수 있을 정도로 기술력이 향상됐다"며 "일반인이 아닌 아나운서가 들었을 때 AI 아나운서의 영상이 괜찮을 건지에 대해서는 문제가 있을 수 있어 도메인에 적합한 음성기술은 자체 개발할 계획으로, 총 4개의 음성 생성 모듈을 개발할 예정"이라고 밝혔다. 또 방송국 전문가들과 협업을 통해 문맥에 맞는 눈짓, 고갯짓, 표정 등을 개선해나갈 계획이다.

 

정상원 이스트소프트 대표는 인사말에서 "코로나로 인해 온라인이 인류 생존을 위한 것으로 위상이 바뀌면서, 온라인상에서 사람과 유사한 사용자경험(UX)을 제공하는 디지털 휴먼에 관심을 갖게 돼 AI 아나운서를 개발하게 됐다"며 "디지털 휴먼은 사람과 구분되지 않는 인터페이스로 챗봇부터 교육, 화상 등 다양한 영역에 활용될 수 있다"고 소개했다.

 

정 대표는 또 "AI 서비스의 완성도를 높이기 위해 때로는 최신의 기술보다 다운그레이드가 중요하기도 하다"며 스마트디바이스인 '라운즈미러'의 사례를 소개했다.

 

그는 "안경을 고를 때 고객 불편함을 해소하고 언택트 트렌드에 맞춰 라운즈미러를 개발했는데, 초기에는 이미지 검색 기술 사용시 사람의 키, 얼굴 각도에 따른 문제가 생겨 이 기술을 포기했다"며 "안경에 모델 넘버 스티커와 광학 문자 인식(OCR) 기술을 사용하니 인식률을 100%까지 높일 수 있었다"고 말했다.

 

최동원 줌인터넷 이사는 "최근 AI 학습용 데이터가 공공데이터로 많이 제공되는데, 데이터 셋은 연구목적으로는 자유롭게 사용할 수 있다는 가이드가 나오고 있지만, 상용화하려면 별도의 협약이나 제휴가 있어야 하는데, 이 부분에서 법적인 해석이 다를 수 있어 사업화할 때 법적 자문이 필요한 문제가 있다"며 "얼굴 인식 관련 AI 서비스를 제공하는 회사는 초상권에서 자유로울 수 없다"는 의견을 제기했다.

 

의료 AI 기업 루닛의 연구조직을 총괄하는 유동근 이사는 '환자의 생존률을 높이기 위한 AI의 가능성' 주제 발표를 통해 "폐암에 걸린 실제 환자의 데이터를 바탕으로 연구를 진행했는데, 엑스레이에서는 2013년과 2015년까지 매년 정상으로 나왔고 2016년 검진에서 병변이 보여 폐암 확진을 받은 경우"라며 "하지만 AI는 2013년 강하지는 않지만 파란색으로 병변을 조금 볼 수 있었고 2014년부터는 뚜렷히 폐암을 확인할 수 있었다"고 밝혔다.

 

그는 "영상의학과 의사와 내과 의사, AI가 폐암을 찾는 테스트를 진행했는데, 우리가 개발한 '루닛인사이드'가 가장 높은 성능을 나타냈으며 의사들의 경험치가 높을수록 판독률도 더 높았다"며 "의사가 AI의 결과를 보고 판독을 바꿀 수 있도록 하자, 결과가 더 개선됐으며, 내과의사가 AI를 활용한 후 영상의학과 의사 수준으로 판독률을 높일 수 있었다"고 말했다.

 

또 치료 AI 분야에서 3세대 항암인 '면역항암' 요법에서 환자 별로 항암이 반응을 할지 세포간 상관관계, 분포, 혈관 근처인지 등 데이터를 가지고 예측이 가능해, 항암이 효과적으로 분석된 환자에는 함암을 하고 효과가 없게 나타난 환자에게는 항암을 하지 않는 방식으로 활용이 가능하다고 소개했다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr