LG AI 크기 97% 줄고 성능은 56% 개선

2024-08-07 13:00:02 게재

LG AI연구원‘엑사원 3.0’ 오픈소스로 공개 … “경량화·최적화로 소비 전력 문제 해결”

LG그룹이 모델 크기를 획기적으로 줄이면서도 성능은 향상시켜 전력 소비 문제를 해결한 인공지능(AI)을 선보였다.

LG AI연구원은 7일 최신 AI 모델 ‘엑사원(EXAONE) 3.0’을 오픈소스로 공개했다. 오픈소스는 비용을 내지 않고 누구나 사용할 수 있는 프로그램을 의미한다.

LG AI연구원은 AI 연구 생태계 발전에 기여하기 위해 ‘엑사원 3.0’ 모델 중 성능과 경제성에 있어 가장 활용도가 높은 ‘경량 모델’을 연구 목적으로 활용할 수 있도록 오픈소스 공개를 결정했다.

배경훈 LG AI연구원장은 “국내에서는 처음으로 자체 개발한 AI 모델을 오픈소스로 공개해 학계, 연구 기관, 스타트업 등이 최신 생성형 AI 기술을 활용할 수 있게 함으로써 개방형 AI 연구 생태계 활성화와 더 나아가 국가 AI 경쟁력을 높이는 데 기여하고자 한다”고 말했다.

LG AI연구원에 따르면 엑사원 3.0은 성능과 경제성을 모두 잡은 것이 특징이다.

이전 모델인 ‘엑사원 2.0’ 대비 추론 처리 시간은 56%, 메모리 사용량은 35% 줄이고 구동 비용은 72% 절감했다.

LG AI연구원은 “AI로 인해 촉발된 소비 전력 문제를 해결하기 위해 경량화·최적화 기술 연구에 집중해 초기 거대 모델 대비 성능은 높이면서도 모델 크기는 100분의 3으로 줄이는데 성공했다”고 설명했다.

LG AI연구원은 엑사원 3.0 기술 보고서에 △MT-Bench △AlpacaEval-2.0 △Arena-Hard △WildBench 등 AI 모델 성능을 평가하는 대표적인 벤치마크(성능 평가 지표)와 함께 평가에 활용한 25개 벤치마크의 개별 점수와 각 영역별 평균 점수를 모두 공개했다.

보고서에 따르면 엑사원 3.0은 실제 사용성을 비롯해 코딩과 수학 영역 등 13개 벤치마크 점수 순위에서 메타 구글 등의 동일 크기 오픈소스 AI 모델을 제치고 1위를 차지했다.

한국어와 영어를 학습하고 이해할 수 있는 이중언어 모델인 엑사원 3.0은 한국어 성능도 세계 최고를 기록했다.

엑사원 3.0은 특허와 소프트웨어 코드, 수학, 화학 등 국내외 전문 분야 데이터 6000만건 이상을 학습했다.

LG AI연구원은 연말까지 법률 바이오 의료 교육 외국어 등 분야를 확장해 학습 데이터 양을 1억건 이상으로 늘려 엑사원 3,0의 성능을 더 끌어올릴 계획이다.

LG AI연구원은 하반기부터 LG 계열사들과 함께 제품과 서비스에 엑사원 3.0 입히기에 나선다.

LG AI연구원은 온디바이스 AI에 들어갈 ‘초경량 모델’부터 범용 목적의 ‘경량 모델’, 특화 분야에 활용할 수 있는 ‘고성능 모델’까지 활용 용도에 따라 모델 크기를 다르게 설계했다.

LG 계열사들은 각 사가 보유한 데이터로 엑사원 3.0을 최적화하고 사업과 제품, 서비스 특성에 맞게 이를 적용해 혁신 속도를 높여갈 계획이다.

한편 LG는 7일부터 임직원을 대상으로 ‘챗엑사원(ChatEXAONE)’ 베타 서비스를 시작한다.

챗엑사원은 엑사원 3.0을 기반으로 만든 생성형 AI 서비스로 △실시간 웹 정보 기반 질의응답 △문서, 이미지 기반 질의응답 △코딩 △데이터베이스 관리 등 업무 편의성과 효율성을 높일 수 있는 다양한 기능을 제공한다.

LG 임직원은 검색부터 요약, 번역, 데이터 분석, 보고서 작성, 코딩까지 AI를 다양한 업무에 활용하며 일하는 방식의 변화를 경험할 수 있다.

챗엑사원은 소프트웨어 개발자와 데이터 분석 전문가를 위한 기능도 제공한다.

LG AI연구원은 챗엑사원이 자연어(사람이 일상적으로 사용하는 언어) 입력만으로 파이썬, 자바, C++ 등 22개 프로그래밍 언어와 데이터베이스 관리에 활용할 수 있는 SQL(구조화된 질의 언어) 쿼리까지 생성할 수 있어 임직원의 업무 효율성을 높일 수 있을 것으로 기대하고 있다.

고성수 기자 ssgo@naeil.com

고성수 기자 기사 더보기