정부가 인공지능(AI) 학습용 데이터 구축을 위한 공통기준을 마련하는 표준화 작업에 착수했다.
또 올 연말까지 표준안을 바탕으로 AI 개발자, 공공기관 관계자 등이 인공지능 데이터의 품질을 더 체계적으로 관리할 수 있도록 자세한 설명을 포함하는 '인공지능 데이터 품질관리 가이드'를 개발·배포할 계획이다.
과학기술정보통신부는 디지털 뉴딜 '데이터 댐'의 핵심자원인 AI 데이터 관련 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 개발하고, 국내외 표준화를 추진한다고 5일 밝혔다.
한국정보통신기술협회(TTA) 단체표준으로 만들기 위해 6일 한국정보통신기술협회 내 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 공식 제안했고, 전문가 등 의견수렴 절차를 거쳐 내년 6월 표준안이 최종 채택·확정될 것으로 전망된다.
과기정통부 관계자는 "10대 분야에서 AI 데이터를 구축하다보니 분야 별로 데이터 구축 과정도 다르고 일괄적이지 않은 측면이 있었다"며 "정해진 기준에 따라 데이터를 구축하게 되면 데이터 품질이 더 일률적으로 나올 수 있어 기존에 사용된 기준을 강화하고 더 세분화했다"고 설명했다.
이번 표준안에서는 인공지능 데이터의 품질을 '인공지능 기술에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보해 사용자에게 유용한 가치를 줄 수 있는 수준'으로 정의했다. 이는 데이터가 적정한 절차와 요구사항, 규격 등으로 처리되는지에 따라 인공지능 기술과 서비스의 성능을 좌우하는 핵심요소로 꼽히기 때문이다.
하지만, 아직 인공지능 데이터가 세계적으로 품질 수준이 높지 않은 상황으로, 세계적 IT 기업인 마이크로소프트나 구글 등이 4~6년 넘게 구축·업데이트해온 유명한 개방 데이터셋의 경우에도 정확도가 43~83%에 불과하다는 문제가 있다. 이는 아직 세계적으로 인공지능 데이터 품질에 대한 체계적인 방법론이 정립되지 않은 것이 중요한 원인으로 분석된다.
인공지능 데이터 표준화는 지난 4월 우리나라가 '인공지능 국제표준화회의(ISO/IEC JTC1/SC42)'에 인공지능 데이터(딥러닝) 품질 관련 사항을 신규 과제로 제안해 채택되는 등 이제 막 논의가 시작되는 초기단계이다.
이에 따라 정부는 한국정보통신기술협회와 한국정보화진흥원을 통해 지난해 개발된 '인공지능 학습용 데이터 구축 및 품질관리 공통기준'을 해외사례 분석, 인공지능 및 품질관리 전문가 자문 등을 거쳐 보완·구체화해 이번 표준안을 개발했다.
표준안은 자연어처리, 자율자동차, 의료, 농축수산, 제조 등 분야에서 공통적으로 적용 가능한 범용 표준의 형태로 개발됐으며, 데이터 품질을 체계적으로 확보하고 상호호환성을 제고할 수 있도록 데이터 수집·정제·가공·품질검증·활용 등 전주기 단계별로 필요한 표준절차와 품질 요구사항 등을 정의하고 기본적인 데이터 규격을 담고 있다.
세부적으로는 ▲원시데이터 수집단계의 다양성, 사실성 등의 품질 요구사항과 파일 포맷, 해상도 등 기술 적합성 요구사항 ▲정제단계의 데이터 중복방지 및 비식별화 조치 요구사항 ▲가공단계의 객체 분류체계 및 라벨링 규격 요구사항 ▲품질검수·활용 단계의 유효성 등 검수 요구사항·방법 등으로 구성돼 있다.
과기정통부는 이번에 개발된 표준안을 이미 추경사업인 10대 분야, 150종 데이터 구축에 적용하고 있다. 또 향후 산·학·연 전문가 의견수렴을 거쳐 신속하게 단체 표준화를 추진하고, 관련 사항을 '인공지능 국제표준화회의'에 제안하는 등 국제표준화로 이어지도록 할 계획이다.
과기정통부 관계자는 "이번에 개발된 표준안이 디지털 뉴딜 '데이터 댐'의 핵심자원인 인공지능 데이터의 품질을 향상시키고, 국가 전반의 인공지능 기술과 서비스의 성능을 높이는데 크게 기여할 것으로 기대된다"며 "앞으로 국제표준화를 선도하고 우리나라가 인공지능 강국으로 도약하기 위해 더욱 노력할 계획"이라고 밝혔다.
Copyright ⓒ 메트로신문 & metroseoul.co.kr
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성