내일시론

딥시크, AI 패권을 흔들다

2025-02-12 13:00:04 게재

딥시크가 유명해진 것은 ‘R1’ 모델을 발표하기 약 8개월 전이다. 설립한 지 1년밖에 안된 딥시크는 지난해 5월 ‘챗GPT-3’와 견줄 만한 ‘딥시크 V2’를 오픈소스로 공개하며 인공지능(AI) 업계에 큰 반향을 일으켰다. 이 모델의 추론 비용은 메타 ‘라마 3’의 약 1/7, ‘GPT-4 터보’ 모델의 1/70 수준에 불과했다. 즉각적인 반응이 나타났다. 알리바바는 자사 AI 모델의 가격을 최대 97%까지 인하했고 바이두와 텐센트도 경쟁적으로 가격을 내렸다. 실리콘밸리에서도 딥시크의 등장은 충격이었다. 오픈AI의 전 정책 담당자이자 앤트로픽(Anthropic) 공동 창업자인 잭 클라크는 “흥미로운 연구 논문과 함께 매우 훌륭한 모델을 출시했다”며 “그들은 AI 마법사”라고 극찬했다.

컴퓨팅 파워의 한계를 알고리즘 혁신으로 뛰어넘다

트럼프 대통령 취임식이 열린 1월 20일, 딥시크는 ‘R1’ 모델을 공개하며 전 세계에 충격을 주었다. 가장 민감하게 반응한 곳은 미국 주식시장이었다. 엔비디아의 주가는 하루 만에 17% 하락하며 시가총액에서 약 5890억달러(약 846조원)가 증발했다. 미국 주식시장 역사상 단일 기업이 하루 만에 기록한 최대 손실이다. 엔비디아뿐만 아니라 마이크로소프트 오라클 등 기술 대기업들의 주가도 하락하며 전체 기술 섹터에서 약 1조달러의 시가총액이 증발했다. 이러한 주가 폭락은 딥시크의 저비용 AI 모델이 기존 미국 기술 기업들의 경쟁력에 대한 의구심을 불러일으킨 결과였다.

‘딥시크 R1’이 오픈소스로 공개되자, 오픈AI CEO 샘 올트먼은 “AI 모델의 투명성과 접근성을 높이는 방안을 고려 중”이라며 전략 변경 검토 의사를 밝혔다. 애초 오픈AI는 2015년 창립 당시 일론 머스크, 샘 올트먼 등이 비영리 연구소로 시작했다. AI 연구를 개방하고 코드를 공개하며 안전한 방식으로 공유하겠다고 약속했다. 하지만 2019년 영리법인 구조를 만들어 대기업 투자를 유치하고 폐쇄적인 상업 모델로 돌아섰다. 오픈소스를 표방하는 딥시크의 등장은 오픈AI에게 큰 도전이다. 딥시크의 오픈소스 모델이 AI 기술 표준이 될 수 있기 때문이다. 메타(Meta)의 최고 AI 과학자인 얀 르쿤은 딥시크의 성공을 언급하며 “오픈소스 모델이 독점 모델을 능가하고 있다”고 평가했다.

딥시크는 중국의 제한된 컴퓨팅 자원을 알고리즘 혁신으로 극복했다는 점에서 더욱 주목받았다. AI 개발의 세 가지 핵심 요소는 컴퓨팅 파워, 알고리즘, 빅데이터다. 이 중에서도 알고리즘은 AI 모델이 데이터를 처리하고 학습하는 방식을 결정하는 중요한 요소다. 딥시크의 성공은 AI 개발에서 가장 중요한 것은 단순히 강력한 GPU를 확보하는 것이 아니라 주어진 자원을 얼마나 효율적으로 활용하는가에 달려 있음을 보여줬다.

특히 딥시크가 구현한 엠엘에이(MLA, Memory-Limited Attention) 아키텍처와 엠오이(MoE, Mixture of Experts) 모델은 혁신적이었다. 기존 AI 모델은 모든 데이터를 그대로 저장하고 처리해야 했기에 메모리 사용량이 많았다. 하지만 MLA 아키텍처는 중요한 정보만 요약 저장해 더 적은 메모리로도 학습이 가능하도록 최적화됐다. 또 기존 AI 모델이 모든 질문을 하나의 AI가 처리했다면 MoE 모델은 질문에 따라 해당 분야의 전문가만 활성화하도록 설계돼 메모리 사용량을 획기적으로 줄였다.

뿐만 아니라, 기존의 대규모 언어 모델(LLM)이 인간이 지도하는 방식을 통해 정답을 학습했다면, 딥시크 R1은 인간의 정답없이 스스로 강화학습을 통해 강력한 추론 능력을 확보했다.

"혁신에서 중요한 것은 경험이 아니라 기초 실력, 열정과 호기심”

딥시크의 성공 뒤에는 창립자 량원펑이 있었다. 1985년생인 량원펑(40)은 저장대 전자정보공학과에서 AI를 전공했다. 그는 2015년 AI를 활용한 투자회사를 설립해 큰 부를 쌓았다. 하지만 그는 AI 분야에서 더 큰 혁신을 원했다.

그는 “챗GPT가 나왔을 때, 중국에서는 투자자부터 대기업까지 모두 격차가 너무 크다고 생각하고 응용에만 집중했다. 혁신에는 자신감이 필요하고 이는 보통 젊은이에게서 더욱 두드러진다”고 말했다. 그의 인재 선발기준은 언제나 기초실력, 열정과 호기심이다. 경험은 중요하지 않다. 그는 “단기 목표를 추구한다면 경험 있는 인력이 필요하지만, 장기적으로는 그렇지 않다. 기초 실력, 창의성, 그리고 열정이 더 중요하다. 딥시크의 핵심 기술 직책은 주로 신입 또는 졸업 후 1~2년 된 사람들”이라고 말했다.

딥시크의 성공은 AI 업계에 새로운 변화를 예고했다. 컴퓨팅 파워 경쟁이 아니라, 보다 효율적인 AI 개발 방법이 필요하다는 사실을 증명했다. 그렇다면 우리는 어디에 서 있는가? 우리에게 진정 부족한 것이 무엇인지 되짚어 볼 때다.

장병호 외교통일팀장

장병호 기자 기사 더보기