메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 CEO와칭 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

네이버클라우드, 옴니모달 하이퍼클로바 X 공개...현실형 AI 에이전트 구현 가속

네이버클라우드는 '네이티브 옴니모델(HyperCLOVA X SEED 8B Omni)'과 '고성능 추론모델(HyperCLOVA X SEED 32B Think)'를 각각 오픈소스로 공개하며 일상과 산업 현장에서 누구나 활용할 수 있는 AI 에이전트 구현을 본격화한다고 밝혔다. 그림은 텍스트와 이미지의 맥락을 함께 이해해 결과물을 만들어내는 네이티브 옴니 모델. /네이버클라우드

네이버클라우드는 과학기술정보통신부 '독자 AI 파운데이션 모델' 프로젝트의 주관 사업자로서 추진 중인 '옴니 파운데이션 모델' 개발 과제의 첫 번째 성과를 29일 공개했다. 네이버클라우드는 국내 최초로 네이티브 옴니모달(하나의 모델이 텍스트·이미지·오디오와 같은 다양한 모달리티를 동시에 이해하고 생성할 수 있는 형태) 구조를 적용한 파운데이션 모델인 '네이티브 옴니모델(하이퍼클로버X씨드 8B 옴니)'과 기존 추론형 AI에 시각·음성·도구 활용 역량을 더한 '고성능 추론모델(하이퍼클로버X씨드 32B 씽크)'를 각각 오픈소스로 공개했다.

 

네이버클라우드는 옴니모달 AI의 잠재력을 극대화하기 위해 현실 세계의 다양한 맥락을 담은 데이터 확보에 집중한다는 전략이다. 네이버클라우드 하이퍼스케일 AI 성낙호 기술 총괄은 "모델을 대규모로 키워도 데이터 다양성이 한정되어 있다면 AI의 문제 해결 능력도 특정 영역 또는 특정 과목에만 집중되어 나타날 수밖에 없다"며 "디지털화되지 않은 생활 맥락 데이터나 지역의 지리적 특성이 반영된 공간 데이터 등 차별화된 현실 세계 데이터를 확보하고 정제하는 과정이 선행돼야 한다"고 설명했다.

 

텍스트·이미지·음성 모델을 결합하는 방식의 기존 멀티모달 접근과 달리, 단일 모델 구조의 옴니모달 AI는 규모 확장이 상대적으로 용이하다는 점도 특징이다. 또한 하이퍼클로버X씨드 8B 옴니는 텍스트 지시를 기반으로 이미지를 생성·편집하는 옴니모달 생성 기능도 갖췄다. 텍스트와 이미지의 맥락을 이해해 의미를 반영한 결과물을 생성해내는 방식이다.

 

'하이퍼클로버X씨드 32B 씽크'는 자체 추론형 AI에 시각 이해·음성 대화·도구 활용 능력을 결합해, 복합적인 입력과 요청을 이해하고 문제를 해결하는 옴니모달 에이전트 경험을 구현했다. 해당 모델로 올해 대학수학능력시험 문제를 풀이한 결과 국어·수학·영어·한국사 등 주요 과목에서 모두 1등급에 해당하는 성과를 거뒀으며, 영어와 한국사에서는 만점을 기록했다.

 

네이버클라우드는 이번 옴니모달 하이퍼클로바X를 기반으로 다양한 영역에서 활용 가능한 AI 에이전트를 단계적으로 확장하여 기술 생태계 구축에 속도를 낼 계획이라고 밝혔다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr