LG 추론AI ‘엑사원 딥’ 오픈소스 공개
매개변수 320억개 모델 … “딥시크 대비 5% 규모로 글로벌 최고 수준 성능”
LG가 오픈AI 구글 딥시크 등의 인공지능(AI) 모델과 경쟁할 수 있는‘엑사원 딥’(EXAONE Deep)을 오픈소스로 공개했다.

엑사원 딥은 LG AI연구원이 자체 개발한 AI로 ‘에이전틱 AI’를 표방하고 있다.
에이전틱 AI는 스스로 가설을 세우고 이를 검증하기 위한 추론을 진행하는 과정을 통해 자율적으로 의사결정을 할 수 있는 능동적인 AI를 말한다. 이를 구현하기 위해서는 기존 ‘지식 AI’를 넘어서는 ‘추론 AI’ 개발이 필수적이다.

LG AI연구원에 따르면 오픈AI나 딥시크 등이 개발한 AI에 비해 매개변수는 적으면서도 비슷하거나 일부 평가에서는 더 우수한 성능을 나타냈다. 매개변수(파라미터)는 AI가 데이터 학습을 통해 만들어 추론에 사용하는 변수를 말한다. 일반적으로 AI는 변수가 많을수록 우수한 성능을 낸다. 하지만 많은 매개변수를 가진 AI를 만들기 위해선 학습에 많은 비용이 든다. 이 때문에 매개변수가 적으면서도 성능이 우수한 AI모델을 만드는 것이 기술력이다.
‘엑사원 딥-32B(320억개 매개변수)’는 딥시크 R1(6710억개 매개변수)의 5% 규모 매개변수만으로도 미국과 중국 모델들과의 비교에서 우수한 성능을 보였다.
LG AI연구원은 글로벌 오픈소스 AI 플랫폼 ‘허깅 페이스’에 매개변수가 다른 3가지 엑사원 딥의 논리적 사고력과 문제해결 능력을 평가하는 다양한 성능 평가 결과를 공개했다.
엑사원 딥-32B는 복잡한 수학 문제와 과학 문제 해결 능력에서 우수성을 입증했다.
특히 한국어에 강점이 있는 엑사원 파운데이션 모델을 기반으로 하고 있어 2025학년도 수능 수학 영역에서 94.5점으로 최고점을 기록했다. 선택과목(확률과 통계, 미적분, 기하) 모두에서 1등급을 달성했다. 또한 수학 문제 해결 능력을 평가하는 지표인 수학(MATH)-500은 95.7점을 기록했다.
엑사원 딥-32B는 물리학 화학 생물학 등 박사 수준의 과학 추론 능력을 평가하는 지표에서도 우수한 성능을 달성했다.
과학 문제 해결 능력을 평가하는 GPQA 다이아몬드 테스트에서 66.1점을 받아 매개변수 규모가 유사한 추론 AI 모델과의 경쟁에서 앞서는 결과를 기록했다. 코딩 능력을 평가하는 라이브코드벤치도 59.5점을 기록하며 경쟁력 있는 성능을 보였다.
LG AI연구원은 엑사원 딥이 수학과 과학, 코딩 등 전문 분야 평가 지표에서 높은 성능을 보여줘 향후 기업이 필요로 하는 전문 분야뿐만 아니라 물리와 화학 등 과학 연구와 교육 현장에서 활용도가 높아질 것으로 기대하고 있다.
LG AI연구원은 엑사원 딥-32B와 함께 개발한 경량 모델 ‘엑사원 딥-7.8B’, 온디바이스 모델 ‘엑사원 딥-2.4B’도 오픈소스로 공개했다.
경량 모델은 엑사원 딥 32B의 24% 크기임에도 성능을 95%까지 유지했다. 온디바이스 모델은 7.5% 규모임에도 성능이 86%에 달해 높은 경제성과 실용성을 동시에 갖췄다.
실제로 경량 모델인 7.8B의 성능은 미국 오픈AI의 ‘o1-mini’의 성능을 상회했다. 온디바이스 모델인 2.4B 또한 동급 모델과의 성능 비교 평가에서 세계 최고 수준의 성능을 보였다.
고성수 기자 ssgo@naeil.com