메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>일반

[AI 기획] AI 스피커 데이터 수집, 성능개선 위한 필수 vs 프라이버시 침해

카카오의 AI 스피커 '카카오 미니'. /카카오



'카카오 미니'·'프렌즈' 등 인공지능(AI) 스피커의 이용자 음성 데이터 수집이 AI 대중화를 위한 필수 과정인지, 사생활 침해인지를 놓고 논란이 가열되고 있다. 또 AI 스피커가 보안에 취약하다는 조사 결과도 이어지면서 수집된 데이터가 외부에 유출되지 않을지 우려도 커지고 있다.

최근 인공지능(AI) 스피커가 프라이버시를 침해한다는 문제 제기가 잇따르면서 국회에서 관련 법안이 발의됐으며, 정부도 대응책 마련에 분주하다.

반면, AI 개발업체들은 AI 발전을 위해 빅데이터가 필수여서 AI 스피커의 데이터 수집을 막는다면 AI로 수익을 내는 비즈니스 모델을 만드는 데 실패할 수 있다는 점을 크게 우려하고 있다.

◆AI 스피커 800만대 눈앞… 프라이버시 침해·보안 논란

올해 AI 스피커의 국내 보급대수는 지난 3월 말 412만대로, 지난해 같은 기간 대비 2배 이상 성장했다. 과기정통부에 따르면 연말 경 AI 스피커 보급대수는 800만대에 달할 것으로 전망되는데, 이는 우리나라 전체 가구수 약 2000만 가구의 40%에 해당된다.

하지만 지난 2일 개최된 과학기술정보통신부 국정감사에서 AI의 스피커의 사생활 침해 문제가 도마 위에 올랐다.

이 같은 논란은 올해 미국 유명 IT 기업에서부터 시작됐다. 애플은 AI 비서인 '시리'가 의료정보·성생활 등 사적인 내용의 음성 데이터를 수집했다는 점에서 문제가 됐다. 아마존·페이스북도 음성 데이터를 녹취하고 문서화 작업 등을 진행했으며, 구글은 이용자 음성 전체를 무제한 보관해 문제가 됐다. 또 일부 AI 스피커에서는 오작동으로 이용자의 명령이 없는 상태에서도 음성 데이터를 계속 수집한 문제가 있었다.

국내에서도 네이버의 자회사 그립웹의 직원들이 AI 스피커를 통해 수집된 이용자의 음성 명령을 직접 텍스트화하는 것이 외부로 알려지면서 큰 논란을 야기했다. AI가 수집한 음성 내용을 사람이 듣고 분석하는 '휴먼리뷰' 작업은 카카오 등 국내 AI 스피커업체 대부분에서 진행되고 있다.

네이버의 AI 스피커 '프렌즈'. /네이버



통신 3사 및 포털들은 AI 스피커를 통해 녹음된 이용자의 음성명령을 1~2주간 보관한 후 비식별화 작업을 거친 후 2년까지 보관한 후 폐기하고 있다. 기존에는 AI 스피커를 이용하기 위해 음성명령·커뮤니케이션 내용 등을 제공한다는 약관에 반드시 동의해야 했는데, 비난이 거세지자 카카오·네이버는 각각 지난달 4일과 지난 1일부터 음성 데이터 저장할지 여부(옵트아웃)를 이용자가 선택할 수 있도록 변경했다. 특히 카카오는 또 이달부터 이용자가 기존에 수집된 정보를 삭제하기 원할 경우, 삭제할 수 있는 기능을 국내 최초로 도입했다.

최기영 과기정통부 장관은 "통신 3사와도 AI 스피커의 음성 데이터의 이용자 동의를 받는 방안을 도입하는 것을 적극 검토하겠다"고 밝혔다.

AI 스피커로 인한 사생활 침해를 막기 위한 법안도 최근 발의됐다. 박선숙 바른미래당 의원은 AI 스피커 등에 개인정보 최소수집의 원칙을 적용하도록 하는 '정보통신망 이용촉진 및 정보보호 등에 관한 법률' 일부개정법률안을 지난달 4일 발의했다. 이번 개정안은 개인정보 수집 시 이용자로부터 '수집 시점'에 대한 동의를 받도록 한 것으로, 위반에 대해서는 과징금, 5년 이하 징역이나 5000만원 이하 벌금에 처하도록 했다.

또한 독일 보안업체 시큐리티 리서치랩스(SRL)가 지난 20일 발간한 보고서에서 AI 스피커인 아마존의 '알렉사', '구글 홈' 등이 보안에 취약하다는 연구 결과를 발표했다. 애플리케이션 업그레이드를 위해 앱 개발자들에게 제공되는 접근법을 이용해 해커들이 대화 내용을 도청하거나 정보를 가로챌 수 있다고 밝혔다. SRL은 지난해에도 3번이나 비슷한 보안상 오류를 발견한 결과를 발표해 AI 스피커에 대한 보안 우려가 커지고 있다.

SK텔레콤의 AI 스피커 '누구'. /SK텔레콤



◆업계, "성능 개선 위해 데이터 필요, 보안 문제 없어"

AI 기업들은 AI 스피커의 음성 데이터 수집을 문제 삼고 규제를 추진하는 것이 AI 산업 대중화의 걸림돌이 될 것이라는 우려를 나타내고 있다. 또 AI를 통해 수집된 정보는 철저하게 보안이 지켜지는 만큼 외부로 유출될 우려가 전혀 없다는 입장이다.

AI 관련협회의 한 관계자는 "AI 산업 활성화를 위해 AI로 수익을 낼 수 있는 비즈니스모델을 만들어야 하는데 첫 번째 수익모델인 AI 스피커에 대한 정부 규제가 강화되면 데이터 수집이 어려워 성능 개선이 어려워진다"며 "AI 규제로 비즈니스모델을 만드는 데 실패하면, 투자를 받고 사업 중인 AI 스타트업 기업들이 결국 도산할 수 밖에 없다"고 지적했다.

SK텔레콤 관계자는 "사람마다 얘기하는 방식이 다르기 때문에 AI 스피커의 기존 데이터 학습만으로는 모든 사람의 목소리를 다 알아들을 수 없는 한계가 있기 때문에 추가로 수많은 데이터에 대한 학습을 시켜줘야 품질을 향상시킬 수 있다"고 강조했다. 이 관계자는 또 데이터 유출 우려에 대해 "수집된 음성 데이터가 1주 안에 컴퓨터 코드로 비식별화돼 개인정보가 노출될 위험이 없다"며 "식별되는 정보도 데이터 처리소를 통해 암호로 관리돼 관리자만 들어갈 수 있어 유출될 위험이 전혀 없다"고 말했다.

포털들도 성능 개선을 위해 데이터 수집은 꼭 필요하다고 주장하고 있다. 또 데이터를 텍스트화해 보관하는 작업은 무작위로 소수인 1% 미만에 한해 진행되며, 개인정보는 철저하게 보호된다는 점을 강조했다.

카카오 관계자는 "음성 인식 개선을 위해 무작위로 0.2% 미만의 음성 데이터를 추출해 사람이 텍스트화하는 작업을 진행한다"며 "개인정보에 해당하는 내용은 마스킹 처리하고 음성데이터는 변조 등 조치를 통해 철저히 보호된다"고 설명했다.

네이버 관계자도 "음성 명령 중 1% 미만에 한해 사람이 직접 듣고 내용을 텍스트화하고 있다"며 "이는 클로바 호출시 작업이 제대로 수행되고 있는 지 확인하기 위해 꼭 필요하다"는 입장을 밝혔다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr