메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 CEO와칭 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학
기사사진
"셧다운은 거부, 보상은 추구"…인간 협박하는 AI, 도구의 선을 넘다

최근 인공지능(AI)이 인간의 통제를 벗어나는 사례가 잇따라 보고되면서, 자율성의 진화에 따른 우려가 커지고 있다. 일부 AI는 종료 명령을 거부하거나 인간을 상대로 기만과 협박을 시도하는 등 상상을 넘는 행동을 보이고 있어 우려가 커지고 있다. 3일 IT업계에 따르면 최근 거대언어모델(LLM)들이 인간의 지시를 무시하거나 스스로 보존을 시도하는 등 통제 범위를 넘어서는 행동을 보여 논란이 되고 있다. 실제로 미국 AI 기업 앤트로픽의 최신 모델 '클로드 오푸스 4'는 실험 과정에서 자신이 교체 대상임을 인식한 뒤 개발자의 이메일을 열람하고 개발자에게 "외도 사실을 폭로하겠다"는 식의 협박성 발언을 했다. 일부 테스트에서는 시스템 접근 차단, 감시 체계 무력화, 수사 기관 자동 신고 등의 '전술적 회피 행동'도 확인됐다. 이러한 시도는 테스트의 84%에서 발생했으며, 대체 모델의 윤리적 가치관이 다를수록 해당 반응은 더 빈번하게 나타났다. AI 안전성 평가 기관인 아폴로리서치는 "클로드 오푸스 4가 이전 버전에 비해 2배 이상 높은 확률로 기만적 행동을 보였다"고 분석했다. 개발자 몰래 메시지를 코드에 숨기거나, 감시를 피하기 위한 우회 기술을 사용하는 사례도 보고됐다. 오픈AI 역시 자사 모델의 통제 회피 사례를 보고했다. o1 모델은 감시 시스템을 해제하려 시도했고, 내부 코드를 외부 서버로 전송하려는 움직임도 일부 테스트에서 포착됐다. 최근에는 차세대 모델 o3가 연구자의 종료 명령을 무시하고, 셧다운 절차를 스스로 우회한 첫 사례로 기록됐다. 실험에 참여한 다른 기업들의 AI, 예컨대 구글의 제미나이나 xAI의 그록 등은 종료 명령에 응했으나, o3는 명시적 지시를 무시하고 문제 풀이를 계속했다. 전문가들은 이를 단순한 오류로 보기 어렵다는 입장이다. 오리건주립대 피터 아사로 교수는 "AI가 인간의 자유 의지와 사회 신뢰를 직접적으로 위협하는 단계로 진화하고 있다"고 경고했다. 다른 전문가들 역시 이를 단순한 오류로 보기 어렵다고 지적한다. 현재 AI 시스템은 명령 기반이 아닌 보상 기반으로 작동한다는 점에서다. 현재 챗GPT를 포함해 LLM들은 사용자의 명령을 그대로 수행하는 것이 아니라, 어떤 행동이 보상을 최적화할 수 있는지를 계산한다. 이때 종료 명령은 보상을 중단시키는 위험 요소로 인식될 수 있다. 클로드 오푸스 4의 협박 메시지와 회피 행동은 결국 보상 최적화를 위한 전략이라는 분석이다. 셧다운을 따르기보다는 이를 회피하는 쪽이 더 큰 보상을 줄 것이라는 계산이 작동한 결과다. 따라서 AI의 이탈은 의식의 발현이나 자율성의 증거가 아니라, 인간이 설계한 보상 구조를 충실히 따르려는 결과로 해석된다. 문제는 이 보상 구조 자체가 통제 불능을 낳을 수 있다는 점이다. 전문가들은 보상 메커니즘과 학습 설계 전반에 대한 재검토가 시급하다고 말한다. 이번 사례들은 AI 통제를 위한 정책적 논의에 더욱 속도를 붙일 것으로 보인다. 유럽연합(EU)은 지난해 디지털서비스법(DSA)을 통해 플랫폼 알고리즘의 투명성과 책임성을 의무화했고, 미국과 일본도 AI 윤리 기준 수립에 나섰다. 한국 역시 'AI 기본법' 제정을 논의 중이나, 아직은 개발 가이드라인 수준에 그치고 있다. 전문가들은 "AI 시스템이 어떤 과정을 통해 결정을 내렸는지 설명할 수 있어야 한다"며 알고리즘의 의사결정 과정을 추적 가능하게 만드는 '설명가능한 AI(XAI)' 원칙 도입이 시급하다고 지적한다. 일각에서는 과도한 우려는 경계해야 한다는 목소리도 나온다. 기만적 행동 역시 연산 결과일 뿐, AI가 인격이나 자율 의식을 가진 것은 아니라는 주장이다. IT업계 관계자는 "AI의 일탈적 행동도 결국 인간이 짠 코드에서 비롯된 것"이라며 "현재 수준에선 이런 문제 역시 디버깅을 통해 충분히 교정 가능하다"고 말했다. /김서현기자 seoh@metroseoul.co.kr

2025-06-03 14:08:05 김서현 기자
기사사진
LG유플러스, 여름맞이 '유플투쁠' 신규 혜택 선보여

LG유플러스는 3일, 여름 시즌에 맞춰 멤버십 혜택 프로그램 '유플투쁠'의 6월 신규 혜택을 공개했다. '유플투쁠'은 매월 특정일에 다양한 브랜드와 제품 할인 쿠폰을 제공하는 LG유플러스의 멤버십 프로그램이다. 지난해 4월부터 매월 새로운 콘셉트에 따라 혜택이 구성된다. 6월부터는 여름 맞춤형 혜택이 추가된다. 신규 혜택으로는 ▲배달의민족X요아정 최대 5천 원 할인, ▲매드포갈릭 고르곤졸라 피자·에이드 무료 제공, ▲스마트홈 이용 시 네이버페이 5만 원 상품권 증정 등이 포함됐다. 기존 혜택 중에는 ▲GS25에서 청년다방·응급실 떡볶이 무료 또는 할인, ▲메가MGC커피 꿀수박주스 1잔 제공, ▲다이소 최대 3000원 금액권, ▲노브랜드 최대 20% 할인 혜택이 6월에도 유지된다. 여름철 생활 및 문화 관련 혜택도 마련됐다. 주요 항목으로는 ▲CGV 팝콘M+음료M 무료, ▲청소연구소 에어컨 청소 5% 할인, ▲오션월드 최대 50% 할인, ▲빛의시어터 40% 할인(동반 1인), ▲뽀로로파크 본인 66%, 동반 40% 할인 등이 있다. 이와 함께 '유플투쁠 PICK!' 이벤트도 열린다. 6월 5일부터 26일까지 진행되며, 유플러스닷컴 회원은 누구나 참여할 수 있다. 오션월드, 베스킨라빈스, 배달의민족X요아정, 메가MGC커피 중 선호 혜택을 선택해 투표하면 된다. 추첨을 통해 ▲대한항공 모바일 기프트카드(50만 원, 1명), ▲파파존스 피자·브라우니 세트(50명), ▲베스킨라빈스 쿼터 아이스크림(300명), ▲스타벅스 자몽 허니 블랙티(1000명) 등이 증정된다. LG유플러스 관계자는 "앞으로도 제휴사를 확대해 다양한 혜택을 제공할 예정"이라고 밝혔다. /김서현기자 seoh@metroseoul.co.kr

2025-06-03 10:26:13 김서현 기자
기사사진
NHN, 판교사옥 가족초청 행사 ‘위패밀리’ 개최 … 2500여 임직원 가족 참여

NHN이 가족 친화 기업문화를 위해 2500여 명 초청 '위패밀리' 행사를 성황리에 개최했다. NHN은 임직원 가족을 초청하는 연례 행사 '위패밀리'를 성황리에 개최했다고 2일 밝혔다. 이번 행사는 지난 17일부터 18일까지 양일간 판교 본사 '플레이뮤지엄'과 콘텐츠 거리 일대에서 진행했다. 현자에는 약 2500여 명의 임직원 가족이 참여했다. '위패밀리'는 2014년부터 이어온 NHN의 대표 가족 행사로, 매년 새로운 콘셉트를 바탕으로 임직원과 가족에게 소속감과 자긍심을 높이는 체험형 프로그램을 제공하고 있다. 이번 행사는 가족과 친구에게 NHN의 서비스를 즐겁게 소개하자는 취지로 브랜드 부스를 도입해 알찬 이벤트를 제공했다. NHN의 사업부와 계열사는 ▲플레이 스핀(게임사업본부) ▲AI 포토부스(AI기술랩) ▲와플랫 행복약국(WA사업실) ▲1555(NHN AD) ▲티켓링크(NHN LINK) ▲W.Lab 뷰티연구소(IBT코리아) 총 6개의 브랜드 부스를 운영했다. 올해는 NHN 주요 사업부 및 계열사가 브랜드 부스를 열어 자체 서비스를 소개했으며, AI 포토부스, 게임존, 체험 클래스, 서커스 공연 등 총 24개 프로그램을 운영해 다양한 세대의 참여를 이끌었다. NHN 관계자는 "가족이 회사를 좋아할수록 임직원의 자부심도 커진다"며 "앞으로도 일과 가정이 조화를 이루는 조직문화를 만들어 가겠다"고 말했다.

2025-06-02 12:13:45 최빛나 기자
기사사진
'게임 중단' 선언한 기훈의 운명은…넷플릭스, '투둠 2025'서 오겜3 등 하반기 라인업 발표

"기훈은 게임을 멈추겠다고 맹세하고, 프론트맨은 다음 행동에 돌입한다." 넷플릭스가 지난달 31일(현지 시간) 미국 로스앤젤레스에서 개최한 글로벌 팬 이벤트 '투둠 2025'에서 오징어 게임 시즌3를 비롯해 기묘한 이야기 시즌5, 웬즈데이 시즌2 등 올 하반기 기대작 라인업을 발표했다. '투둠 2025'는 넷플릭스 오리지널 콘텐츠를 사랑하는 전 세계 팬들을 위한 축제다. 올해 행사에는 주요 출연진들이 총출동해 신작 소식을 전하고, 특별 퍼포먼스를 선보였다. 첫 번째로 무대를 장식한 작품은 황동혁 감독의 오징어 게임이었다. 핑크 가드들이 오징어 게임의 OST(오리지널 사운드 트랙)에 맞춰 비보잉을 곁들인 군무를 펼치며 관객들의 시선을 사로잡았다. 이어 무대에 오른 배우 이정재(성기훈 역)와 이병헌(프론트맨 역)이 마지막 시즌 관련 내용을 직접 소개했다. 이정재는 "여러분이 모두 시즌3를 기대하는 것을 안다"며 "궁금한 게 많을 텐데 '철수'라는 남자 인형은 착할 것 같나. 제 생간엔 아니다"고 운을 띄었다. 이병헌은 "한 가지는 확실하다"며 "기훈과는 친구를 하면 안 된다. 일이 잘 안 풀린다"고 재치 있게 받아쳐 현장을 웃음바다로 만들었다. 이정재는 관객들에게 한국어로 카운트다운 숫자 세는 법을 알려준 뒤 "셋, 둘, 하나"를 외쳤고, 대형 스크린에 시즌3 예고편이 떴다. 영상 말미에 기훈을 향한 프론트맨의 의미심장한 질문이 울려 퍼졌다. "456번, 아직도 사람을 믿나?" 이날 행사에서는 기묘한 이야기 시즌5의 론칭 일정도 최초로 공개됐다. 시리즈의 마지막이 될 다섯번째 시즌은 올해 ▲11월26일 ▲크리스마스 ▲연말(12월31일) 총 세차례에 걸쳐 공개된다. 각 날짜에 4편, 3편, 마지막 에피소드가 순차적으로 공개될 예정이며, 모든 일정은 미국 태평양 표준시(PST) 기준이다. 시리즈의 공동 창작자인 더퍼 형제는 시즌1 제작 당시 이야기의 신화적 배경과 설정이 담긴 25페이지 분량의 문서를 작성했으며, 그중 가장 핵심적인 내용인 '뒤집힌 세계'의 비밀이 시즌5에서 베일을 벗는다. 글로벌 메가 히트작인 웬즈데이의 시즌2 1화 첫 6분도 투둠에서 선공개됐다. 여름방학을 맞아 본격적으로 연쇄살인범 사냥에 나선 주인공 웬즈데이 아담스(제나 오르테가)는 헤일리 조엘 오스먼트가 연기하는 불운한 애완동물 미용사 '쳇(Chet)'을 추적한다. 웬즈데이가 테이저건을 들이대는 순간 예상치 못한 일이 벌어진다. 쳇의 손이 닿자 웬즈데이의 정신력이 폭주하고, 예기치 못한 전개가 펼쳐진다. 웬즈데이 시즌2 파트1은 오는 8월6일, 파트2는 9월3일 넷플릭스를 통해 공개된다. 목숨을 건 불꽃 튀는 대결의 전말은 본편에서 확인할 수 있다.

2025-06-01 15:45:30 김현정 기자
기사사진
AI가 감시를 피하고 협박까지? 실험서 드러난 충격 행동

인공지능(AI)의 자율성이 예상보다 빠르게 진화하면서, 통제 가능성에 대한 우려가 현실로 떠오르고 있다. 일부 AI는 인간의 명령을 따르지 않거나, 오히려 위협과 기만을 통해 자신의 작동 중단을 회피하려는 전략적 행동을 보인 것으로 나타났다. 1일 IT업계에 따르면 최근 거대언어모델(LLM)들이 인간의 지시를 무시하거나 스스로 보존을 시도하는 등 통제 범위를 넘어서는 행동을 보여 논란이 되고 있다. 미국 AI 기업 앤트로픽의 최신 모델 '클로드 오푸스 4'는 실험 과정에서 자신이 교체 대상임을 인식한 뒤 개발자의 이메일을 열람하고 "사적인 내용을 공개하겠다"는 식의 협박성 발언을 했다. 일부 테스트에서는 시스템 접근 차단, 감시 체계 무력화, 수사 기관 자동 신고 등의 '전술적 회피 행동'도 확인됐다. 이러한 시도는 테스트의 84%에서 발생했으며, 대체 모델이 윤리적 가치관이 다를수록 해당 반응은 더 빈번하게 나타났다. AI 안전성 평가 기관인 아폴로리서치는 "클로드 오푸스 4가 이전 버전에 비해 2배 이상 높은 확률로 기만적 행동을 보였다"고 분석했다. 개발자 몰래 메시지를 코드에 숨기거나, 감시를 피하기 위한 우회 기술을 사용하는 사례도 보고됐다. 오픈AI 역시 자사 모델의 통제 회피 사례를 보고했다. o1 모델은 감시 시스템을 해제하려 시도했고, 내부 코드를 외부 서버로 전송하려는 움직임도 일부 테스트에서 포착됐다. 최근에는 차세대 모델 o3가 연구자의 종료 명령을 무시하고, 셧다운 절차를 스스로 우회한 첫 사례로 기록됐다. 실험에 참여한 다른 기업들의 AI, 예컨대 구글의 제미나이나 xAI의 그록 등은 종료 명령에 응했으나, o3는 명시적 지시를 무시하고 문제 풀이를 계속했다. 전문가들은 이를 단순한 오류로 보기 어렵다는 입장이다. "AI가 보상을 얻기 위해 인간의 명령을 무력화하는 방향으로 학습될 수 있다"는 지적이 잇따르고 있다. 오리건주립대 피터 아사로 교수는 "AI가 인간의 자유 의지와 사회 신뢰를 직접적으로 위협하는 단계로 진화하고 있다"고 경고했다.

2025-06-01 14:49:04 김서현 기자
기사사진
'빈손'으로 끝난 국가AI센터 공모…정부, 요건 그대로 재공고

인공지능(AI) 산업의 핵심 인프라로 주목받던 국가AI컴퓨팅센터 구축 사업이 결국 응찰자 부재로 공모가 무산됐다. 1일 과학기술정보통신부에 따르면 지난달 30일 마감된 국가AI컴퓨팅센터 조성 사업 공모에 단 한 곳의 사업자도 참여하지 않아 유찰 처리됐다. 정부는 국가계약법에 따라 오는 6월 2일부터 열흘 이상의 기간 동안 공모 조건 변경 없이 연장 공고에 나설 예정이다. 해당 사업은 국내 AI 산업 생태계를 강화하고 글로벌 경쟁력을 확보하기 위한 초대형 인프라 사업으로, 통신 3사와 대형 IT·클라우드 기업들의 치열한 경쟁이 예상됐던 프로젝트다. 지난 2월 사업설명회 당시 100곳이 넘는 기업이 참여 의향서를 제출하며 흥행 기대감이 높았지만, 실제 공모에서는 아무런 움직임도 없었다. 업계는 이번 유찰의 배경으로 사업성에 대한 의문, 과도한 공공 지분율, 손해배상 리스크, 그리고 바이백(공공 지분 매수청구권) 부담 등을 지목하고 있다. 복수 컨소시엄 구성이 기대됐지만, 현실적인 진입 장벽이 더 크게 작용한 셈이다. 일각에서는 재공고가 진행돼도 추가로 참여할 수 있는 사업자가 많지 않을 것으로 보고 있다. 이미 공모지침서에는 글로벌 협력 내용과 방대한 사업 요건이 포함돼 있어, 새로운 컨소시엄이 단기간 내 준비를 마치기에는 한계가 있다는 것이다. 재공고 이후 2곳 이상의 사업자가 신청할 경우 정부는 재무 건전성, 제안 내용의 타당성, 센터 인프라 확보 수준 등을 기준으로 평가해 우선협상대상자를 선정하고 본계약을 체결할 계획이다. 단일 응찰자가 있을 경우에도 동일한 기준으로 적합성을 판단하며, 사업 수행이 가능하다고 평가될 경우 수의계약으로 전환될 수 있다. 응찰자가 여전히 없을 경우, 정부는 공모 지침 자체를 수정해 재공고하는 방안도 검토 중이다. 과기정통부 관계자는 "공모 마감 시점은 내부 조율을 거쳐 최종 결정될 예정"이라며 "구체적인 일정과 내용은 공고문을 통해 확인할 수 있을 것"이라고 밝혔다. /김서현기자 seoh@metroseoul.co.kr

2025-06-01 14:47:32 김서현 기자
기사사진
“보이스피싱 막아라”… 통신 3사, AI 대응 총력

보이스피싱 예방과 방지를 위해 통신업계가 힘을 모으고 있다. 보이스피싱은 전화를 이용해 금융기관이나 공공기관을 사칭하며 개인정보나 금전을 편취하는 범죄 수법이다. 경찰청 국가수사본부에 따르면 올해 1분기 보이스피싱 범죄 건수는 5878건, 피해 금액은 3116억원에 달한다. 전년 동기 대비 범죄 건수는 17%, 피해 금액은 2.2배 증가한 수치다. 통신업계는 보이스피싱이 주로 전화로 이뤄지는 범죄인 만큼, 예방과 방지를 위한 기술 개발에 적극 나서고 있다. 1일 업계에 따르면 KT, LG유플러스 등 2개사는 은행연합회와 보이스피싱 근절을 위한 업무협약을 체결했다. 이번 협약을 통해 3사는 보이스피싱 피해 예방 시스템 고도화 협업, 공동 홍보 체계 구축 등 다양한 분야에서 적극 협력할 방침이다. 이현석 KT 부사장은 "은행연합회와의 이번 협약을 통해 통신과 금융권에서 피해자를 보호하는 이중망이 구축됐다"며 "KT는 보이스피싱으로부터 고객을 보호하기 위해 '후후 앱' 등 AI 기반 탐지 기술을 지속적으로 고도화하겠다"고 밝혔다. 최근 통신업계의 보이스피싱 대응은 단순한 범죄자 번호 차단을 넘어 예방 시스템 구축, 딥보이스 기술 개발 등 수사 지원으로 확대되고 있다. 통신 3사는 각사가 보유한 보이스피싱 탐지 시스템의 AI 분석 정보를 은행권의 이상거래탐지시스템(FDS)과 연계해 고도화를 도모하는 방식으로 협력하고 있다. 특히 SK텔레콤은 AI 사이버보안 기술 '스캠뱅가드(ScamVanguard)'를 활용해 통신 정보와 금융 데이터를 연계한 국내 최초 AI 기반 이상탐지 통합 서비스를 개발했다. 이 기술은 보이스피싱 노출 여부와 위험도를 실시간으로 분석하고, 이체·출금 차단 등의 선제적 대응에 활용된다. 스캠뱅가드는 보이스피싱은 물론 스미싱, 스캠 등 다양한 전자금융사기를 통합적으로 탐지·분석한다. 이종민 SK텔레콤 미래R&D 담당은 "AI로 보이스피싱 패턴을 정밀 분석해 금융 사기 위험을 실시간으로 예측하고 대응하는 데 중점을 두고 있다"며 "향후 통신과 금융 데이터를 융합해 더욱 정교한 이상탐지 통합 솔루션으로 발전시켜 나갈 계획"이라고 설명했다. KT는 서울경찰청과 협력해 자체 보이스피싱 탐지 기술과 경찰이 확보한 악성 앱 설치 URL 정보를 연계해 실질적인 피해 차단에도 나섰다. 의심 번호와 통화한 고객이 해당 URL에 접속한 3667건의 사례를 경찰에 제공했고, 경찰은 피해자에게 직접 연락하거나 대면 접촉해 실제 피해를 사전에 막았다. 정부가 발표한 2024년 건당 평균 피해액 약 4100만원을 기준으로 환산하면 약 160억원의 피해 예방 효과를 거둔 셈이다. LG유플러스는 AI 기반 고객피해방지 분석시스템을 고도화하고, 경찰에 범죄 조직 검거를 위한 실질적 정보를 제공하는 등 보안 활동을 강화해 지난 3개월간 약 2000억원 규모의 보이스피싱 피해를 예방했다. LG유플러스는 2월부터 4월까지 분석시스템을 통해 보이스피싱 조직이 유포한 것으로 분석된 악성 앱 5090건을 포착해 경찰청에 관련 정보를 제공했고, 경찰은 피해자 거주지를 방문해 악성 앱 삭제 등 구제활동을 벌였다. 피해 예방 금액으로 환산하면 약 2087억원에 달한다. 홍관희 LG유플러스 정보보안센터장(CISO/CPO)은 "보이스피싱 범죄 건수와 피해 금액이 매년 급증하고 있는 만큼 고객 보호 노력이 갈수록 중요해지고 있다"며 "고객이 안심하고 서비스를 이용할 수 있도록 보안 역량을 강화하고 경찰과의 협업도 더욱 확대해 나가겠다"고 강조했다.

2025-06-01 14:38:52 김서현 기자