584개사 참여 정부 'AI 데이터 구축' 사업 품질 저하 우려에 정부 데이터 '품질 자문위' 출범
정부가 올 하반기 10대 분야에서 150종의 인공지능(AI) 학습용 데이터 구축 사업을 추진하면서 무려 584개 기업·기관이 참여기업으로 선정돼, 자질을 갖추지 못한 기업도 AI 데이터 구축을 맡아 데이터 품질이 저하될 수 있다는 우려가 제기돼 왔다. 이에 따라 정부는 데이터 품질에 대한 전문적인 자문 역할을 맡을 '품질 자문위'를 출범하고, 데이터 품질을 글로벌 수준으로 대폭 강화하기로 했다. 정부는 데이터 활용 단계에서 품질 문제가 발생할 수 있다고 보고, 유지보수 체계인 무상 유지보수기간을 1년으로 설정했다. 과학기술정보통신부는 디지털 뉴딜의 '디지털 댐' 핵심인 AI 학습용 데이터 구축사업의 성공적 추진을 위한 품질검증 지원체계를 마련하기 위해 전문가들이 참여하는 '품질 자문위'를 구성하고, 첫 킥오프 회의를 22일 한국정보화진흥원 서울사무소에서 개최했다. AI 서비스 개발에 필수적인 AI 학습용 데이터를 대규모로 구축·개방하는 이번 사업은 추경 2925억원이 배정됐으며, 지난 8월말 수행기업·기관 선정을 완료했다. 다만, 국내에서 AI·데이터 사업을 실제로 전개하는 기업이 250~300개 정도로 파악돼 아직 데이터 구축 경험이 거의 없는 기업도 이번 정부 사업에 참여한다는 문제가 제기돼 왔다. 과기정통부는 양질의 데이터를 구축하기 위해 품질관리 전담기관으로 한국정보통신기술협회를 운영하고 있는데, 이번에 자연어·자율주행차 등 분야별로 전문적인 품질검증 지원체계를 마련하기 위해 자문위를 구성했다. 자문위는 자연어처리, 헬스케어, 자율주행, 농축수산, 국토환경, 미디어, 안전, 기타 등 8개 분과로 운영되며, 분과별로 산·학·연 전문가, 데이터 활용기업 등 10명 내외, 총 80여명이 참여한다. 자문위는 ▲데이터 구축계획 타당성 ▲구축단계별 품질절차 준수 ▲원시 데이터 및 라벨링 데이터의 품질·활용도 검증 등에 대한 전문 자문 역할을 담당할 예정이다. 이날 회의는 위원장으로 선임된 AI 분야에 명망이 높은 서울대학교 전기정보공학부 이경무 교수와 분야별 위원장 등이 참석해 품질관리를 위한 다양한 방안을 논의했다. 특히 과기정통부는 데이터 품질관리 강화를 위해 ▲세계 수준의 품질검증 및 유지보수 체계 확립 ▲사업 수행기관의 품질 역량 및 책임성 대폭 강화를 기본방향으로 '품질 자문위 운영'을 포함한 세부적인 방안을 마련했다. 우선, 지난해 개발된 '인공지능 학습용 데이터 구축 및 품질관리 공통기준'을 해외사례 분석, AI 및 품질관리 전문가 자문 등을 거쳐 보완·구체화해 데이터의 다양성, 정확성, 유효성 등을 종합 평가할 수 있는 품질기준 및 검증방법을 확립했다. 또 대량의 데이터가 전 과정 대부분 수작업으로 구축돼 구축단계에서 완벽한 품질검증이 어려운 한계를 고려해 무상 유지보수기간(1년)을 설정하고, 기 구축된 데이터에 대해서도 필요시 내년에 유지보수 및 업데이트할 계획이다. 또 수행기관 책임감을 제고하기 위해 ▲과제책임자 포함 등 데이터별 구축기업 실명제 도입 ▲품질평가 결과 공개 및 내년 사업선정 시 반영 ▲하자 보증금 납부 등 방안도 마련했다. 강도현 인공지능기반정책관은 "품질 자문위에 참여하는 각 분야 전문가들의 지혜를 모아서 '디지털 댐'의 핵심인 활용도 높은 양질의 AI 학습용 데이터 구축에 최선을 다하겠다"고 밝혔다.