내일시론
딥시크, 벤처기업의 새로운 모범
“엔지니어들이 딥시크를 미친 듯이 분석하고 가능한 모든 것을 복사하려고 노력 중이다”(메타 직원), “AI 기업에 과도하게 투자한 일부 벤처캐피털을 멸종시킬 수준의 사건이다”(악시오스 기자). 지난 1월 20일 중국의 인공지능(AI) 스타트업 ‘딥시크(Deepseek)’가 출시한 최신 AI 모델 ‘R1’에 대한 반응이다.
성능은 미국 오픈AI 최신 모델과 비슷한데 훈련비용은 557만달러밖에 들지 않았다는 사실이 충격적이다. 대형언어모델(LLM) 훈련비용은 수억달러로 추정된다. 딥시크의 설명대로라면 1/20 이하로 비용을 낮췄다. AI 선두기업이 1만6000장 이상의 칩을 사용해 챗봇(chatbot)을 훈련한 것과 달리 딥시크는 엔비디아가 생산한 그래픽처리전용칩(GPU) 2000장만 필요했다. 훈련에 사용된 GPU는 H800이다. H800은 미국의 규제로 H100의 중국수출이 금지되자 그보다 사양을 낮춰 중국에 수출된 제품이다.
‘누가 더 적은 비용으로 고성능 AI를 구현하느냐’가 승부처
딥시크의 훈련비용이 실제로는 더 많다는 지적도 있다. 557만달러는 정확히는 딥시크가 지난해 12월 출시한 ‘딥시크 V3’의 공식 훈련비용이다. 그 이전 모델(V1, V2) 개발비, 그리고 V3에서 R1으로 넘어가는 데 추가된 비용은 모두 빠져있다. 그럼에도 불구하고 딥시크가 제시한 AI 혁신 메시지는 분명하다. ‘누가 더 적은 비용으로 고성능 AI를 구현하느냐’가 승부처가 됐다는 것이다.
AI 개발기업이 돈을 버는 방법은 크게 두가지다. 하나는 챗봇 같은 서비스의 개별 이용자에게서 직접 구독료를 받는 것이고(챗GPT 플러스의 경우 월 20달러), 다른 하나는 애플리케이션 프로그래밍 인터페이스(API)를 개발자에 제공해서 그 이용료를 받는 것이다. API를 이용하면 개발자는 그 AI 모델 기능을 포함시킨 프로그램을 만들 수 있다. API 이용료는 사용하는 토큰(데이터 단위)에 비례해서 책정된다. 딥시크는 초저가 공습을 감행했다. 이번 출시한 딥시크 R1의 API 이용료는 100만 토큰당 출력 기준 16위안(2.19달러)인데 GPT o1(60달러)과 비교해 거의 1/30 수준이다.
딥시크는 AI 시장에서 경쟁규칙을 바꿔 놨다. 딥시크가 설명하는 ‘저비용 혁신’의 비결은 5가지다. 첫째, 전문가조합(MoE, Mixture of Experts) 설계다. 복잡한 작업을 더 작은 작업으로 분해한 뒤 각 전문가에 할당하는 모델이다. 마치 족집게 강사가 시험에 나올 핵심만 정리해 알려주는 방식과 같다. 이를 통해 딥시크는 6710억개 매개변수 중 약 340억개만 활성화시킴으로써 비용과 시간 모두를 크게 절약했다.
둘째, 8비트 부동소수점(floating point) 연산방식이다. 일반적으로 컴퓨터에서는 숫자를 32개의 0 또는 1, 즉 32비트의 부동소수점으로 표현해 연산한다. 그러나 딥시크는 이것을 8비트로 줄이면서 메모리 사용량을 32비트 대비 75% 절감했다.
셋째, 오픈소스다. 딥시크는 소프트웨어 소스 코드를 누구나 열람·수정하고 배포할 수 있는 오픈소스 방식을 채택했다. 마치 기존 요리법을 참고해 새로운 요리를 만드는 것과 비슷하다. 이름과 달리 폐쇄형인 오픈AI와는 다른 방식이다. 오픈소스 방식은 딥시크가 짧은 기간에 고성능 AI를 출시할 수 있었던 핵심 비결로 꼽힌다.
넷째, 연구 생태계 혁신이다. 클라우드 의존도를 줄이고 스마트폰과 노트북에서도 고성능 AI를 실행할 수 있는 기반을 마련해 고사양 인프라 없이도 AI 실험을 진행할 수 있도록 했다. 다섯째, 중국의 저렴한 인건비와 정부 지원금도 한몫했다.
딥시크, 기술·자본·경영을 ‘자주적’으로 해결
딥시크의 인력구성에 세간의 이목이 집중됐다. 딥시크의 창업자는 1985년생인 량원펑(40)으로 공학 분야 명문대인 저장대에서 전자공학 학·석사를 받았다. 딥시크 연구팀은 미국 유학파가 아닌 중국 국내파 출신 20~30대 인재들로 구성되어 있다.
량원펑은 2016년 대학친구들과 함께 AI와 수학 기반의 투자회사 ‘하이플라이어(High-Flyer)’를 설립해 큰돈을 벌었다. 2021년부터 그는 수천장의 엔비디아 GPU를 구매하기 시작했고 이를 바탕으로 2023년 5월 딥시크를 창업했다. 그는 미국의 AI칩 규제 전 이미 엔비디아 A100을 1만장 이상을 확보하면서 LLM개발업의 발판을 마련했다. 자본투자는 자산운용규모가 80억달러를 넘어선 모회사 High-Flyer가 진행했다.
딥시크는 150여명의 인력으로 기술·자본·경영을 ‘자주적’으로 해결했다. 기존보다 차원을 높인 벤처기업의 새로운 모범이다. 최첨단 기술에서 미국이 근본적으로 우월하다는 ‘미국 예외주의’는 종말을 고했다. 딥시크의 벤처정신은 전세계 젊은 엔지니어의 심장을 뛰게 한다. 세계 2군 수준의 한국 AI업계가 자신감을 갖고 혁신할 때다.
박진범 재정금융팀장