메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

'말하는 AI' 시장규모 5년 내 56조 성장 …왜?

'말하는 AI' 시장 급성장
텍스트 기반→'멀티모달' 환경 진화 탓
프랑스 큐타이, 음성 AI '모시' 공개
구글·오픈AI, 작년 음성강화 AI 출시
네이버·카카오도 AI 역량 강화 나서

GPT로 생성한 '인공지능(AI) 기술이 텍스트 기반에서 멀티모달 환경으로 진화해 사용되는 모습'을 담은 AI 이미지.

인공지능(AI) 기술이 텍스트 기반에서 멀티모달 환경으로 진화하면서 음성 AI가 다시 주목받고 있다. 애플, 네이버, 카카오 등 주요 정보기술(IT) 기업들은 음성 AI 기술을 고도화며 스마트폰을 넘어 차량, 가전, 미디어 플랫폼 등 적용 범위를 확장하고 있다.

 

멀티모달은 텍스트, 이미지, 음성을 포함한 다양한 AI를 연동해 사용하는 방식을 의미한다.

 

5일 시장조사기관 모도인텔리전스에 따르면 글로벌 음성 AI 시장 규모는 2024년 20조원에서 2029년 56조원으로 3배 가까이 성장할 전망이다.

 

가트너 측은 "음성 인식과 자연스러운 대화 기능이 결합하면서 사용자 경험이 크게 향상해 수요가 급증하고 있다"고 분석했다.

 

◆'오픈소스 vs 폐쇄형'…음성 AI 패권 경쟁 '본격화'

 

음성 AI 시장이 빠르게 성장하면서 기술 패권 경쟁도 치열해지고 있다. 현재 AI 업계는 두 가지 패러다임으로 나뉜다.

 

하나는 오픈소스 AI 진영이다. 메타, 모질라, 큐타이, 코키 등은 AI 음성 기술을 오픈소스로 공개하며 기술 확산을 가속화하고 있다.

 

메타는 4000개 이상의 언어를 인식·생성할 수 있는 'MMS'를통해 오픈소스 기술을 강화하고 있다. MMS는 학습용 꼬리표(라벨) 없이도 데이터를 학습할 수 있다.

 

프랑스의 오픈AI라 불리는 AI 연구소 '큐타이'는 최근 '모시(Moshi)'라는 음성 AI를 공개했다. 모시는 인터넷 연결 없이도 작동하며, 0.2초라는 짧은 시간 안에 음성을 생성한다.

 

반면 오픈AI, 구글, 애플과 같은 빅테크 기업들은 폐쇄형 모델을 유지하며 독자적인 생태계를 구축하고 있다.

 

구글은 멀티모달 기능을 강화한 음성 AI '제미나이 2.0'을 지난해 12월 출시했다. 스마트폰을 비롯한 모바일 환경에 최적화했으며, 10가지 목소리를 제공해 톤과 스타일을 선택할 수 있다.

 

오픈AI도 한국어와 일본어를 포함한 50개 언어의 사용을 개선한 챗GPT '음성 모드'를 지난해 12월 출시했다. 음성 발화 속도 조절과 화자의 감정 인식 기능을 추가해 보다 자연스러운 대화를 구현한다.

 

◆네이버·카카오 등 국내 기업들도 기능 강화 위해 분주

 

애플도 음성 AI '시리(Siri)'에 챗GPT를 통합할 계획이다. 베타 테스트를 진행해 일부 기능을 2025년에 정식 출시할 예정이다. 이를 통해 홈팟, 아이폰, 맥OS 전반에서 더욱 자연스럽고 정교한 음성 인터페이스가 구현될 것으로 보인다.

 

업계 관계자는 "오픈소스 모델은 기술 접근성을 높여 빠르게 확산되지만, 폐쇄형 모델은 강력한 성능과 차별화된 기능을 제공하는 데 초점을 맞춘다"며 "각각의 강점이 있어 기업과 소비자들의 선택이 갈릴 것"이라고 말했다.

 

특히 중국의 AI 스타트업 딥시크도 오픈소스 AI 생태계를 더욱 확장시키는 변수로 떠오르고 있다. 딥시크는 올해 초AI 추론 모델 'R1'과 함께 음성 AI '딥시크보이스'를 공개했다. 텍스트와 음성을 동시에 처리하며, 인터넷 연결 없이도 작동할 수 있어 스마트폰, 차량 내장 AI, 스마트홈 등 다양한 디바이스에 적용될 가능성이 크다.

 

국내 기업들도 음성 AI 시장에서 발빠르게 움직이고 있다.

 

네이버는 AI 챗봇 '클로바X'에 정보 검색 도우미 기능 등 새로운 기능을 추가하며 역량을 강화하고 있다.

 

카카오는 올해 상반기 출시를 목표로 AI 음성 비서 '카나나'를 개발 중이다. 카나나는 개인용 AI '나나'와 그룹채팅용 AI '카나' 두 가지 버전으로 제공될 예정이다. 나나는 일대일 대화에 참여하고 그룹 대화 내용을 기억해 개인화된 응답을 제공한다. 카나는 그룹 채팅에 특화되어 퀴즈 생성, 답변 채점, 요약 등의 기능을 수행한다.

 

이 외에도 카카오는 '카카오 아이(i)' 음성 비서는 현재 카카오T·쇼핑·뱅킹 서비스와 연동하고 있다.

 

 

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr