메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 CEO와칭 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
기사사진
오픈AI, 中 딥시크에'지식재산권' 침해 의혹… 법적 대응 검토

챗GPT의 개발사인 오픈AI가 중국 인공지능(AI) 스타트업 딥시크가 자사의 독점 모델을 무단 활용했다며 지식재산권(IP) 침해 의혹을 제기했다. 오픈AI는 현재 조사에 착수했으며 법적 대응도 검토 중이다. 30일(현지시간) 블룸버그 통신 등 외신에 따르면 오픈AI는 딥시크가 오픈AI의 AI 모델에서 데이터를 무단으로 추출했는지를 조사하고 있다. 딥시크는 최근 AI 모델 'R1'을 출시하며 오픈AI의 최신 모델과 유사한 성능을 보인다는 평가를 받고 있다. 특히 딥시크는 R1 개발에 약 600만 달러를 투자했다고 밝혔는데, 이는 오픈AI가 GPT-4 모델 개발에 투입한 비용의 1/100 수준에 불과하다. 오픈AI는 딥시크가 '증류' 기법을 활용해 자사 AI 모델의 출력을 학습 데이터로 사용했을 가능성을 의심하고 있다. 증류는 더 크고 정교한 AI 모델의 지식을 작은 모델에 축소·전이해 효율적으로 학습하는 방식으로, 훈력 목적으로 AI 연구에서 널리 활용된다. 하지만 경쟁사의 모델을 학습 데이터로 사용할 경우 저작권 침해 논란이 발생할 수 있다. 오픈AI 대변인은 "딥시크가 오픈AI의 도구에서 대량의 데이터를 추출해 기술 개발을 도왔다는 징후를 검토 중"이라며 증류 기법이 사용됐을 가능성이 크다고 밝혔다. 오픈AI는 자사 서비스 약관에서 AI 모델 출력을 활용해 경쟁 모델을 개발하는 행위를 명확히 금지하고 있다. 오픈AI의 주요 파트너사인 마이크로소프트 역시 딥시크가 오픈AI의 API를 통해 데이터를 무단 사용했는지 조사 중이며, 관련 계정을 이미 차단한 상태다. API는 소프트웨어 개발자들이 AI 기능을 자신들의 프로그램이나 앱에 넣을 수 있게 해주는 도구로, 사용하려면 허가가 필요하다. 일부 딥시크 사용자들은 챗봇이 오픈AI의 정책 문구와 유사한 답변을 내놓는다는 점을 지적하기도 했다. 한 레딧(Reddit) 사용자는 딥시크 챗봇이 "오픈AI의 정책에 따라 의식이나 지각력이 있다고 주장하는 것을 피해야 한다"고 응답했다고 공개했다. 이는 오픈AI의 챗GPT 정책과 거의 동일한 문구다. 오픈AI는 조사 결과에 따라 법적 조치를 취할 가능성이 크다. 오픈AI 대변인은 "기술 보호를 위해 적극적으로 대응하고 있으며, 미국 정부와도 긴밀히 협력하고 있다"고 밝혔다. 이와 관련해 트럼프 정부의 AI·가상화폐 정책 책임자인 데이비드 색스도 지난 28일(현지시간) 폭스뉴스와의 인터뷰에서 "딥시크가 오픈AI의 기술을 도용했을 가능성이 있다"며 "딥시크가 오픈AI 모델에서 지식을 추출한 증거가 상당하다"고 주장했다. 반면, 딥시크 측은 "증류 기법을 사용했지만, 우리의 AI 모델은 독자적인 연구 결과에 기반하고 있다"며 오픈AI의 주장을 전면 부인했다. 딥시크는 또한 최근 연구 논문을 통해 "증류 기법을 이용해 R1 모델을 개선했지만, 이는 오픈AI 모델이 아닌 자체 개발한 데이터에서 비롯된 것"이라고 주장했다.

2025-01-30 15:05:46 이혜민 기자
기사사진
오픈AI, 한국서 첫 '빌더랩 개최…AI 협력·투자 '본격화'

생성형 인공지능(AI) '챗GPT' 개발사 오픈AI가 국내에서 처음으로 국내 AI 기업 및 개발자와 협력을 모색한다. 30일 정보기술(IT) 업계에 따르면 오픈AI는 내달 4일 서울에서 '빌더랩'이라는 이름의 개발자 행사를 개최할 예정이다. 오픈AI가 한국에서 주최하는 첫 행사로, 아시아에서는 싱가포르에 이은 두 번째다. 이번 행사는 국내 AI 개발자 및 기업 관계자 100여명을 초청해 협업 방안을 논의하고 기술적 노하우를 공유하는 자리로 마련됐다. 앞서 오픈AI는 미국 샌프란시스코와 영국 런던, 싱가포르에서 '데브데이'라는 이름으로 개발자 행사를 진행한 바 있다. 기존 대규모 컨퍼런스와 달리 빌더랩은 워크숍 형태로 진행된다. 오픈AI 챗GPT의 애플리케이션 프로그램 인터페이스(API)와 모델 구축 방법에 대한 교육과 실습이 중심이 될 전망이다. 원활한 진행을 위해 참석 인원을 70~100명 규모로 제한하고 비공개로 운영한다. 업계에서는 이번 행사에 맞춰 샘 올트먼 오픈 AI 최고경영자(CEO)가 방한할 가능성이 크다고 보고 있다. 올트먼 CEO는 2023년 6월 중소벤처기업부 초청으로 처음 방한했으며, 지난해 1월에는 삼성전자 평택공장을 방문한 바 있다. 특히 올트먼 CEO가 삼성전자, SK하이닉스 등 국내 주요 대기업 총수들과 만날 가능성도 제기된다. 오픈AI가 대규모 데이터센터 건설을 추진하고 있는 만큼, 반도체 공급 협력 논의가 이뤄질 것이라는 전망도 나온다. 이번 행사에는 AI 애플리케이션 개발사를 중심으로 국내 주요 AI 기업 CEO 및 최고기술책임자(CTO)들이 대거 참석할 예정이다. 삼성전자, SK텔레콤 등 대기업뿐만 아니라 업스테이지, 뤼튼테크놀로지스 등 AI 기반 서비스 기업의 경영진과 개발자들이 초청된 것으로 알려졌다. 업계에서는 이번 행사를 계기로 오픈AI가 한국 법인 설립과 투자 확대에 나설 가능성이 크다고 보고 있다. 오픈AI는 2023년부터 한국 AI 기업들과 공동 사업을 모색해 왔다. 지난해에는 AI 영어 학습 플랫폼 '스픽'을 운영하는 스픽이지랩스코리아에 지분 투자를 단행했으며 한국산업은행(KDB)과 AI 생태계 활성화를 위한 기술 지원 및 금융 업무협약(MOU)을 체결한 바 있다. 현재 오픈AI는 일본과 싱가포르에 지사를 운영하고 있으며, 올해 안에 한국 지사를 설립할 가능성도 유력하게 거론된다. 업계 관계자는 "이번 개발자 행사는 오픈AI의 한국 시장 공략을 본격화하는 중요한 전환점이 될 것"이라며 "스타트업 투자뿐만 아니라 대기업과의 협력 가능성도 논의될 것으로 보인다"고 말했다./이혜민기자 hyem@metroseoul.co.kr

2025-01-30 13:41:11 이혜민 기자
기사사진
LGU+, 양자내성암호로 보안 강화…계정관리 솔루션 '알파키' 출시

LG유플러스는 양자내성암호(PQC) 기술을 활용한 통합 계정관리 솔루션 '알파키(Alphakey)'를 정식 출시하고, 금융·의료·공공기관 등 다양한 산업군의 고객사에 보급한다고 30일 밝혔다. 알파키는 수십 개의 SaaS(클라우드 기반 서비스형 소프트웨어) 서비스를 이용하는 기업의 클라우드 기반 업무환경에서 임직원의 업무 계정 권한을 자동으로 관리하고, 양자내성암호·동형암호를 통해 보안을 강화한 LG유플러스만의 IDaaS(ID 관리 서비스)다. 알파키를 이용하면 임직원의 신원을 확인해 SaaS 서비스, 파일 등에 접근할 수 있는 권한을 부여하고 최신화된 인사 정보에 맞춰 퇴사자/휴직자와 같은 비권한자의 접속을 제한하는 등 계정 권한을 자동으로 관리한다. 알파키는 지난해 LG유플러스의 임직원을 대상으로 베타 서비스를 시행하며 사용성과 보안성을 검증했다. 주요정보통신기반시설 지정기관인 LG유플러스가 직접 운용하며 검증한 만큼 금융·의료·제조·IT 등 다양한 산업군에서도 활용 가능할 것으로 기대된다. 또한 알파키에 적용된 양자내성암호 기술은 양자컴퓨팅 위협에 대응할 수 있는 차세대 암호화 기술로, 기존 보안 기술로는 대응이 어려운 해킹 공격에도 안전한 것이 강점이다. 알파키에는 사용자 인증과 개인정보 취급 과정을 양자내성암호 기술로 암호화해 보안을 더 강화했다. LG유플러스는 이번 클라우드 기반 솔루션 출시를 시작으로, 연내 한국인터넷진흥원(KISA)의 클라우드 서비스 보안인증(CSAP)을 획득해 공공·금융시장 진입을 가속화할 예정이다. 주엄개 LG유플러스 유선사업담당(상무)는 "알파키는 LG유플러스가 보유한 보안 기술력과 고객 중심 혁신을 바탕으로 개발된 국내 유일의 차세대 통합 계정관리 솔루션이다"라며 "알파키의 정식 출시를 계기로 클라우드 전환을 준비중인 기업부터 금융·공공 기업까지 고객들이 더 편리하고 안전한 클라우드 환경을 구축하도록 지원하겠다"고 말했다. /구남영기자 koogija_tea@metroseoul.co.kr

2025-01-30 12:04:37 구남영 기자
기사사진
한전기술, R&D 투자율 1위…과기부 장관 표창 수상

한국전력기술(한전기술)이 연구개발(R&D) 투자 성과를 인정받아 장관상을 받았다. 한전기술은 과학기술정보통신부(과기부)가 지난 23일 주최한 '과학기술 혁신 유공 통합 시상식'에서 공공부문 연구개발 우수 기관으로 선정돼 장관 표창을 받았다고 30일 밝혔다. 과기부는 공공기관의 기술경쟁력 강화를 위해 '연구개발 투자권고 제도'를 운영하며, 매년 공공기관을 대상으로 권고안 준수 여부와 연구 성과를 평가해 우수 기관을 선정한다. 한국전력기술은 원자력발전소 등 다양한 발전시설의 설계를 담당하는 기술 전문 공기업으로, 매출의 10% 가량을 지속적으로 R&D에 투자하며 기술 혁신을 주도하고 있다. 지난해에도 10.7%의 투자율로, 과기부 투자 권고 대상인 39개 공공기관 중 2년 연속 'R&D 투자율 1위'를 달성했다. 이 같은 적극적인 연구개발을 바탕으로 한국전력기술은 혁신형 소형모듈원자로(i-SMR) 개발, 해양 소형 원전 시스템(BANDI) 개발 등 차세대 원자력 기술을 연구하고 있으며, 해상풍력·수소 등 탄소중립 기술 확보에도 집중하고 있다. 한국전력기술 관계자는 "국가 미래 에너지 연구개발을 선도하는 공공기관으로서 지속적인 기술 혁신과 투자를 이어가겠다"고 밝혔다.

2025-01-30 11:28:08 이혜민 기자
기사사진
국내 연구진, 세계 최초 '상온 양자역학 현상' 발견…네이처 게재

국내 연구진이 세계 최초로 상온에서 양자역학적 스핀 펌핑 현상을 발견했다. 과학기술정보통신부는 KAIST 이경진·김갑진 교수와 서강대 정명화 교수 공동연구팀이 극저온이 아닌 실온에서도 스핀 전류를 효율적으로 생성할 수 있음을 입증했다고 30일 밝혔다. 이번 연구는 과기정통부 기초연구사업 등의 지원을 받아 수행됐으며, 국제 학술지 네이처 최신 호에 29일(현지시간) 게재됐다. '스핀트로닉스'는 전자의 자기적 성질인 스핀을 활용해 열 발생을 줄이고 더 효율적인 전자 소자를 개발하는 차세대 반도체 기술이다. 기존 전자기기는 전자의 흐름(전하 전류)으로 작동하지만, 이 과정에서 전자가 원자와 충돌하며 열이 발생해 전력 손실이 커지고 성능 저하로 이어지는 문제가 발생한다. 이를 해결하기 위해 전 세계 많은 과학자들은 전하 대신 전자의 스핀을 활용하는 기술인 '스핀트로닉스'를 연구해 왔다. 스핀트로닉스 기술의 핵심은 전하 전류가 아닌 스핀 전류를 안정적으로 생성하는 것이다. 그중 대표적인 방법이 '스핀 펌핑'으로, 특정 물질에서 전자의 스핀을 조작해 전류처럼 흐르게 하는 기술이다. 이를 활용하면 전력을 적게 쓰면서도 발열을 최소화할 수 있어 고효율·저전력 반도체 개발에 중요한 역할을 할 것으로 기대된다. 공동 연구팀은 철(Fe)-로듐(Rh) 자성박막을 활용해 기존 대비 10배 이상의 스핀 전류를 생성하는 데 성공했다. 특히 대부분의 양자역학적 현상이 극저온에서만 관측되는 것과 달리, 이번 연구는 상온에서도 스핀 펌핑 현상을 관측해 주목받고 있다. 이번 연구는 정명화 교수팀이 2019년 발표한 자성박막 내 스핀 상호작용 연구를 기반으로 진행됐다. 공동 연구팀은 "기존 스핀트로닉스 연구는 고전적인 스핀 운동을 기반으로 했지만, 이번 연구는 양자적인 특성을 활용해 더 효과적인 스핀 전류 생성 방법을 제시했다는 점에서 의의가 크다"고 밝혔다. /이혜민기자 hyem@metroseoul.co.kr

2025-01-30 10:35:10 이혜민 기자
기사사진
'딥시크 모멘트'에 美, 대(對)중국 AI 반도체 수출 통제 효과 "?"

혜성처럼 나타난 중국의 인공지능(AI) 모델 '딥시크(Deepseek)' 이후 미국의 대(對)중국 첨단 반도체 수출 통제가 효과가 있었냐는 의문이 제기되며 트럼프 행정부의 규제 정책에도 빨간불이 켜졌다. 29일 <메트로경제>의 취재에 따르면 그동안 중국을 국제적으로 압박하는 한편 첨단 AI 기술 개발을 방해하기 위해 AI 반도체 수출 통제를 지속한 미국의 조치를 두고 실효성 논란이 이어지고 있다. 지난 20일 중국 AI 스타트업 딥시크는 AI 모델 '딥시크 R1'을 공개하고 미국 주요 빅테크 기업들의 AI 대비 1/10 수준의 비용으로 단 2달 만에 개발에 성공했다고 발표했다. 더불어 엔비디아의 H100 등 최고사양 AI 반도체 대신 한층 낮은 사양인 H800을 사용했다고 발표했다. 딥시크 R1은 6710억 개의 매개변수를 확보한 챗GPT와 같은 대규모언어모델(LLM)이다. 딥시크 측의 설명에 따르면 약 2개월의 시간 동안 558만 달러(약 80억 6800만 원)의 비용으로 학습했다. 짧은 개발 기간과 낮은 비용은 효율적인 학습 및 훈련을 위한 새로운 아키텍처 덕분으로 전해졌다. 해당 아키텍처를 이용하면 LLM은 학습하는데 278만 GPU시간만 필요로 할 만큼 소요 시간이 줄어드는 것으로 전해진다. 개발을 위해 사용한 반도체 또한 주요 빅테크 기업이 활용한 반도체에 못 미치는 성능이다. 그럼에도 해당 모델은 2024년 AIME(미국 수학경시대회) 벤치마크에서 오픈AI의 최신 AI 모델 o1을 근소한 차이로 따돌렸다. 대중국 수출 규제가 오히려 중국의 기술 발전을 촉진시킬 것이라는 전망이 들어맞으면서 미국의 대중국 정책에도 빨간불이 켜졌다. 미국 정부는 지난 13일(현지시간) AI 반도체에 대한 수출 통제를 강화하고 우회수출까지 차단하는 수출관리규정(EAR)을 개정, 발표하고 120일 간의 의견수렴 절차에 들어갔다. EAR은 각국의 첨단 AI 반도체 접근 수준에 따라 3개 등급으로 구분하고, 중국을 22개 적성국 중 하나로 규정, 최고 수준으로 통제한다. 딥시크의 사태 후 미국 내 주요 IT 관계자들은 이번 사태를 '스푸트니크 모멘터'로 칭하며 미국의 대중국 견제의 효과에 대해 의문을 제기하고 있다. 스푸트니크 모멘트는 기술우위를 갖던 나라가 후발 주자의 기술에 충격을 받는 순간을 뜻한다. CNN은 "미국이 수년간 안보를 이유로 첨단 AI 반도체의 중국 공급을 제한해 온 점을 고려하면 이번 결과는 매우 충격적"이라고 평가했다. 미국은 지난 2022년 조 바이든 행정부 시절부터 중국이 AI 개발과 학습에 쓰이는 주요 반도체를 전쟁무기화 할 가능성이 있다며 엔비디아와 AMD 내 주요 최고성능 반도체의 중국 수출을 규제하기 시작했다. 이때 엔비디아의 A100과 차세대 모델 H100이 중국 수출에 제동이 걸렸다. H100은 오픈AI와 MS, 구글 등이 AI 모델을 개발하기 위해 활용하고 있는 최고 성능의 AI 반도체다. 딥시크가 활용한 반도체는 H800으로 H100의 하위 버전이다. 반도체 접근 규제를 통한 기술 발전 통제를 도모했으나 역효과가 난 만큼 EAR에 반대 의사를 피력했던 주요 반도체 기업의 입장에도 공감대가 모이고 있다. 지난 EAR 개정 발표 후 주요 글로벌 IT 기업들은 일제히 조치에 반발했다. 국가 정부가 전세계를 상대로 한 기업의 수출입에 과잉 관여한다는 주장이다. 엔비디아는 당시 "시장 결과를 조작하고 경쟁을 억압함으로써 미국이 어렵게 얻은 기술적 이점을 낭비할 위험이 있다"고 꼬집었다. 그러면서 "미국은 혁신과 경쟁, 그리고 전 세계와 기술을 공유함으로써 승리하는 것이지, 정부의 과잉개입이라는 벽 뒤에 숨어서 후퇴하는 것이 아니다"고 비난했다. /김서현기자 seoh@metroseoul.co.kr

2025-01-30 08:00:29 김서현 기자
기사사진
스플랩 '우모', 1년 만에 매출 5배 성장…대형 박람회 진출 박차

B2B 네트워킹 올인원 설루션 '우모(Umoh)'가 가파른 성장세를 이어가고 있다. 스플랩이 운영하는 우모는 비즈니스 행사 참석자들의 온라인 교류를 지원하고, 참석자 승인 및 관리, 행사장 출입증 발급, 공지 발송 등 원활한 행사 운영을 돕는 올인원 설루션이다. 2023년 11월 커뮤니티 기능을 접목한 첫 버전을 출시하며 약 40개 고객사를 확보했고, 지난해 4월 정식 버전을 선보였다. 29일 스플랩에 따르면, 우모는 지난해 1분기 대비 4분기 매출이 약 5배 증가했다. 이 같은 성장 배경에는 비즈니스 네트워킹 수요 증가와 함께, 행사 운영을 효율화하려는 기업들의 요구가 주효했던 것으로 스플랩 측은 분석했다. 지난해 우모를 활용한 행사 주최 기업과 단체는 약 80개, 플랫폼에 접속한 참석자는 3만6000명에 달한다. 초기에는 50~300명 규모의 기업 세미나 및 소규모 네트워킹 행사에 주로 활용됐으나, 하반기부터 최대 3만명이 참여하는 대형 행사까지 지원하며 빠르게 성장했다. 참석자들은 우모 내에서 프로필을 등록한 후 원하는 상대에게 대화를 요청하거나 미팅도 제안할 수 있다. 지난해 우모를 통해 성사된 비즈니스 미팅은 약 1만6000건에 달한다. 또 행사 종료 후 진행된 설문조사에서 '우모를 통해 만나지 못했을 사람을 만났다'라는 응답이 80%에 달하는 등 긍정적인 평가를 받았다. 우모가 활용된 주요 행사로는 ▲NextRise 2024, Seoul ▲MAX SUMMIT 2024 △2024 ATD Korea Summit ▲디지털 혁신 페스타 2024 ▲G-STAR 사이드 이벤트 ▲COMEUP 2024 등이 있다. 한편, 우모는 2025년을 맞아 '이벤트, 콘퍼런스에서의 만남이 우모를 통해 또 다른 기회로 확장된다'는 슬로건을 내걸고 브랜드 아이덴티티를 개편했다. 새로운 로고와 심벌은 '우모'의 자음 'ㅇ'과 'ㅁ'을 활용해 신뢰·연결·확장의 의미를 담았다./이혜민기자 hyem@metroseoul.co.kr

2025-01-29 19:03:08 이혜민 기자
기사사진
알트먼 오픈AI CEO "딥시크, 가성비 인상적이지만 기술은 아니다"

"(딥시크 R1의)제작 비용을 고려하면 인상적이다." 27일(현지시간) 샘 알트먼 오픈AI 최고경영자(CEO)가 중국 인공지능(AI) 스타트업 딥시크 열풍에 이같은 의견을 냈다. 딥시크 R1이 폭발적인 관심을 끌기 시작한 후 처음이다. 알트먼은 자신의 SNS X(구 트위터)에 딥시크 R1 모델에 대해 "새로운 경쟁자의 등장은 매우 고무적"이라면서도 "우리가 훨씬 뛰어난 모델을 개발하고 있다"고 덧붙였다. 업계에서는 알트먼이 비용 절감 측면에서는 인정하나 기술적인 면에서는 다소 무시했다는 평가다. 딥시크는 지난 25일 AI 모델 '딥시크 R1'을 공개하면서 V3 개발에 558만 달러에 불과한 비용이 들었으며 엔비디아의 최상급 AI 반도체를 사용하는 대신 H800을 이용했다고 밝혔다. 또 자체 기술 보고서를 통해 문장으로 이미지를 생성하는 능력 분야에서 자신들의 Janus 최신 버전이 오픈AI의 DALL-E와 영국 스태빌리티AI의 '스테이블 디퓨전'을 제쳤다고 주장했다. 딥시크 R1 공개 직후 AI 스타트업 스케일 AI CEO인 알렉산더 왕은 외신과 인터뷰를 통해 "딥시크가 H100을 5만 장 확보했을 것"이라며 "단지 미국의 대중국 견제로 숨기고 있을 뿐"이라고 주장하기도 했다. 알트먼은 딥시크의 공개와 공개 이후 나스닥의 기술주들을 중심으로 한 대폭락장, AI 거품론의 재점화 등에도 별다른 의견을 밝히지 않았다. /김서현기자 seoh@metroseoul.co.kr

2025-01-28 23:08:27 김서현 기자
기사사진
메타 1/10 비용에 저성능 반도체로 이룬 中 AI '딥시크' 관심 폭발

중국 인공지능(AI) 스타트업 딥시크(Deepseek)가 출시한 '딥시크 R1'이 연일 화제가 되고 있다. 일부 영역에서는 현존 최고 수준으로 일컬어지는 오픈AI의 챗GPT를 추월한 것으로 알려졌다. 28일 IT업계에 따르면 딥시크 사(社)의 AI 딥시크 R1이 챗GPT 등 주요 AI 모델 대비 수천배 이상 저렴한 비용으로 개발됐다. 딥시크 사는 2023년 5월 중국 저장성 항저우에서 1985년생 량원펑(梁文&#38155;)에 의해 설립 된 스타트업 기업이다. 량원펑은 공학분야 명문대인 저장대에서 전자정보공학, 정보통신공학 학사와 석사를 각각 받았다. 그는 대학 졸업 후 금융에 AI를 적용하기 위한 연구를 했고 2016년 동기 2명과 AI와 수학에 의존해 투자를 진행하는 헤지펀드사 '하이 플라이어'를 설립했다. 딥시크의 모회사이기도 한 하이 플라이어는 한때 100억 위안 이상의 자산을 운용했다. 량원펑은 2021년부터 돌발적으로 수천 개의 엔비디아 GPU 구입을 시작했고, 이를 바탕으로 딥시크를 창업했다. 량원펑에 따르면 미국 정부의 중국 AI 반도체 규제 압박 전 이미 엔비디아 A100 GPU를 1만 개 이상 확보했고, 이를 토대로 LLM 개발에 나설 수 있었다. 딥시크 R1은 챗GPT와 같은 대규모언어모델(LLM)로 6710억 개의 매개변수를 확보했다. 알려진 바에 따르면 약 2개월의 시간 동안 558만 달러의 비용으로 학습했다. 메타의 최신 AI 모델이자 엔비디아의 H100으로 훈련한 라마(Llama)3 모델의 훈련 비용 대비 1/10 수준에 그친다. 딥시크가 주요하게 활용한 H800은 미국이 대(對) 중국 견제를 위해 AI 반도체 수출 규제 강도가 강해지자 엔비디아가 H100의 성능과 사양을 낮춰 출시한 제품이다. 여타 AI 모델과 비교해도 압도적이다. 오픈AI의 챗GPT의 학습과 훈련에는 최소 수억 달러에서 최대 수십억 달러에 달하는 비용이 든 것으로 알려졌다. 이는 딥시크가 비용 효율적인 학습과 훈련을 위해 설계된 새로운 아키텍처를 활용하기 때문인데, 해당 아키텍처를 이용하면 LLM은 학습하는데 278만 GPU시간만 필요로 할 만큼 소요 시간이 줄어든다. 페이스북의 메타가 자체 모델을 훈련하는데 필요한 3080만 GPU시간과 큰 차이가 난다. 세계적 기술 투자자인 마크 앤드레슨은 자신의 SNS 계정을 통해 "딥시크는 내가 본 것 중 가장 놀랍고 인상적인 혁신 중 하나"라고 설명했다. /김서현기자 seoh@metroseoul.co.kr

2025-01-28 22:55:19 김서현 기자