네이버의 인공지능 플랫폼 '클로바'와 인공지능 통번역 서비스 '파파고'의 공동 문자인식기술(OCR) 연구 팀이 알리바바, 텐센트 등 글로벌 업체들과의 경쟁에서 우위를 차지하며 기술력을 입증했다.
네이버는 국제패턴인식협회 'IAPR'이 시작한 국제 경진 대회인 'ICDAR 로버스트 리딩 컴피티션'을 통해 올해만 세 가지 과제에서 1위를 기록했다고 10일 밝혔다. 이 대회는 디지털 이미지와 비디오 상에서 텍스트를 감지·인식하는 기술 분야에서 가장 권위있는 국제대회다.
문자인식기술은 크게 이미지에서 ▲문자의 위치를 찾는 '검출 기술'과 ▲문자가 무엇인지 알아내는 '인식 기술'로 나뉘는데, 특히 네이버의 문자 검출 기술이 알리바바, 텐센트, 센스타임 등 글로벌 업계와의 경쟁에서 이들보다 높은 점수를 기록했다.
우선 2017년에 공개된 다국어 데이터를 기반으로 한 문자 영역 검출에 대한 과제에서는 네이버가 73.68%를 기록하며 1위를 차지했다. 해당 기술은 영어를 포함한 라틴 계열의 문자뿐 아니라 한국어, 일본어, 중국어, 아랍어, 뱅골어, 특수 기호 등 총 7개의 문자 영역을 검출하는 기술로, 단일 언어를 검출하는 것 보다 훨씬 고도화된 기술력이 요구된다.
또한, 2017년 다국어 데이터 기반의 문자 종류 구분에 대한 과제에서도 네이버 클로바팀에서 인턴으로 재직하고 있는 정성효 학생(고려대 주재걸 교수 연구실 소속)이 주도로 연구한 방식이 89.01%를 기록, 1위를 차지했다. 문자 종류 구분 기술은 다국어 문자 검출 기술과 연관된 기술로, 검출된 영역에 해당하는 총 7개의 문자 종류 중 하나의 문자 종류로 분류하는 기술이다.
네이버는 앞으로도 연구 중인 OCR 기술을 파파고 등 실제 서비스에도 적용하며 AI 기술을 실제 사용자들이 쉽게 체감할 수 있도록 지원한다는 방침이다.