'이루다' 사태로 AI 챗봇 '심심이' 나쁜 말 걸러주는 필터 기술 DBSC 관심

AI 챗봇 '심심이'는 악플을 99% 이상 탐지하는 문장 분류 솔루션 'DBSC'를 적용해 악성 글, 악플 탐지 기능을 제공하고 있다. /심심이

인공지능(AI) 챗봇 '이루다'의 개인정보 악용 및 AI 윤리 문제가 수면위로 떠오르면서 유사한 서비스를 제공하는 '심심이'이 악성 글, 악플 탐지 기능이 관심을 모으고 있다.

AI 챗봇 기업 심심이는 자체 연구개발 노하우를 바탕으로 악플을 99% 이상 실시간 탐지할 수 있는 문장 분류 솔루션 'DBSC'를 2019년 말 정식 출시했으며, 최근 새로 출시한 2.0 버전을 출시했다고 27일 밝혔다.

2.0 버전의 경우, 한국어 채팅에 많이 쓰이는 문장을 210만개 확보해 학습데이터로 사용했다.

특히, 기존의 악플 차단 솔루션은 특정 키워드를 차단하는 방식 위주로 구현돼 신규 용어나 은유적인 표현 등에 취약하다는 지적을 받아왔으며, 악플 아닌 댓글을 과도하게 필터링하는 문제를 보이기도 했다. 반면 DBSC는 과도하게 필터링하지 않으면서 금지 키워드를 피해 문장을 교묘하게 변형한 악플, 은유적인 악성 표현들을 집어내는 특화된 차단 성능을 발휘했다고 회사측은 설명했다.

심심이에 따르면 DBSC의 딥러닝 모델 정확도는 99% 이상으로 집계되고 머신러닝의 성능 지표인 F1점수도 0.99 이상으로 나타나 높은 정밀도와 재현율을 나타내고 있다.

심심이는 과기정통부가 발표한 AI 서비스 윤리 기준이 '모든 사람이 모든 분야에서 자율적으로 준수하며 지속 발전을 영위하는 것'으로 정의되고, 10대 핵심 요건으로는 인권 보장, 프라이버시 보호, 다양성 존중, 침해 금지, 공공성, 연대성, 데이터 관리, 책임성, 안전성, 투명성을 포함하는데, 이 기준에 부합하도록 기술 개발에 지속적 연구와 투자를 단행하고 있다고 밝혔다.

심심이는 DBSC 성능을 비약적으로 향상시키기 위해 딥러닝 학습데이터 양과 질에 많은 노력을 기울이고 있다. 특히 각 문장마다 10명의 무작위 패널 투표를 받는 방식으로 순도를 높인 라벨링을 추구하고 있으며, 최근 전문가를 동원해 심심이 한국어 대화 시나리오 교정 작업을 진행하는 등 심심이와 주고받는 대화의 질을 높이기 위해 연구를 진행 중이다.

심심이 최정회 대표는 "쉽게 구현할 수 있는 키워드 필터링은 즉각적인 효과가 있지만 유연하지 못하고, 다국어 서비스에서 대응 수준이 떨어진다"며 "사람이 전수검사를 하는 방식은 정확하지만 속도가 느려, DBSC는 이 두 방식 장점을 살려, 사람이 전수검사한 정확한 데이터를 학습한 딥러닝 모델이 유연하고 즉각적으로 다국어에 대응하고 있다"고 밝혔다.

메트로人

머니

산업

IT·과학

정치＆정책

생활경제

사회

에듀＆JOB

기획연재

오피니언

라이프

플러스

독자서비스

포럼＆컨퍼런스

'이루다' 사태로 AI 챗봇 '심심이' 나쁜 말 걸러주는 필터 기술 DBSC 관심