문송천 칼럼
기업 AI 경영, 이것 없인 실패한다
실험실이 아닌 기업에서 인공지능(AI) 경영이 과연 소용이 있을지에 대해서는 아직 긍정적으로 검증된 바는 없다. 여러 기업에서 생성AI소개 이후 1년간 시도해봤지만 좋은 결과가 나오지 않은 이유는 AI에 적용할 학습물이 신통치 않아서였다.
빅데이터 급으로 자료가 많이 축적된 분야에서는 AI가 효력이 있다는 사례를 이번 노벨 물리학상과 화학상 수상자들이 단적으로 보여줬다. 수상자 5명 전부 의외로 전산학자였다. 과학엔 실험 데이터가 많다. 태생적으로 AI가 잘 놀 수 있는 마당이다.
바둑 기보가 쌓일수록 AI 검색엔진 알파고가 잘 작동했듯 말이다. 학습 데이터를 토대로 다음 묘수를 찾아내는 데 탁월했다. 그런 수치 데이터가 없었다면 알파고는 게임에서 졌을 것이다.
이렇듯 AI는 데이터를 기반으로 새로운 방안을 제시하는 데 우수하다. 신체에서 중요한 역할을 하는 단백질의 구조를 밝히기 위해 과학자들은 많이 노력해왔다. 그러나 단백질구조 분야는 연구비와 시간을 투자한다고 해서 결과가 그에 비례해서 나오는 분야가 아니다. 이 과정을 AI가 파고든 것이다. 단백질은 기다란 끈이 말려 있거나 접혀 있는 모양의 아미노산으로 이뤄져 있다. 아미노산 단위로 긴 사슬 형태로 이루어진 실체가 바로 단백질이다.
AI, 데이터 기반 새로운 방안 제시 우수
알파고 개발자 하사비스는 영국대학 박사과정 시절에 소속 연구실에서 개발된 ‘폴드잇’이라는 게임을 해본 적이 있다. 폴드잇은 가상 공간에서 아미노산을 갖가지 방법으로 접어보면서 조합을 시도하는 온라인 게임이다. 단백질을 직접 접어 보면서 안정된 구조를 찾아간다. 폴드잇에서 새로운 구조를 찾아 나가는 과정이 바둑을 둘 때 다음 수를 내놓는 것과 같다고 생각해 같은 원리로 봤다.
바둑기사들이 다음 수를 놓는 과정과 단백질구조 예측을 하는 과정이 유사하다고 판단했고 이에 대한 실증작업으로 알파고를 만들어 이세돌 9단을 이긴 뒤에는 학습을 마친 AI는 확률적으로 가장 나은 제안을 한다는 사실에 확신을 가졌다. 그 자신감을 바탕으로 그는 단백질 검색엔진 알파폴드 팀을 꾸렸다. 그를 통해 마치 챗GPT가 다음에 올 최적화된 단어를 찾아내듯이 인간에게는 난해한 단백질 구조를 분석해냈다.
인류는 무려 50년에 걸친 아미노산의 특징을 파악한 데이터를 보유하고 있다. 과학계에서 단백질 구조에 관한 데이터를 수집해 온 지는 그만큼 됐다. 즉 그간 파악해 놓은 단백질 구조 빅데이터가 존재했다는 뜻이다. 아미노산의 종류는 20개로 한정돼 있지만 단백질의 종류는 수천만개에 달한다.
아미노산과 함께 그동안 인류가 밝혀왔던 단백질의 특징과 같은 실험 결과가 쌓였기에 AI에 큰 도움을 준 것이다. 그렇다면 단백질 및 아미노산 데이터 같은 것은 어떤 부류의 데이터인가. 그것은 전부 실험 데이터다. 즉 도표 형태로 묘사된 데이터로서 문서 부류에 속하는 데이터와는 판이하게 다른 구조다. 즉 문서가 아니라는 뜻이다. 문장의 형식 (문서)과는 달리 단지 수치를 담고 있는 도표들이 데이터의 역할을 하는 것이다. 데이터 치고는 매우 단순 구조다.
그러나 세상에는 실험 데이터보다 문서 데이터가 더 많다. 기업은 특히 그렇다. 문서 데이터는 숫자가 아닌 문장 형태로 표현된다. 실험실 환경과 기업 환경은 이렇게 다르다. 그러므로 데이터가 수치뿐으로 단순 구조를 갖는 분야에서 AI가 괄목할 성과를 보인다고 해서 기업부문에서도 소기의 성과를 거둔다고 가정하는 것은 무리다.
문장형태로 복잡하게 얽히고 설켜 있는 데이터 구조를 있는 그대로 AI에 학습시킬 때 문제는 환각현상이다. 따라서 기업에서 AI 적용 전 철저한 사전준비가 가 있어야 가능하다. 철저히 준비해야 한다는 뜻은 기업이 보유한 문서들을 준비 없이 학습시켰다가는 낭패를 본다는 뜻이다. 직장 특유의 축약형 혹은 개조식 표현으로 문장이 문법적으로 온전치 않기 때문이다. 따라서 모든 문서 내 매 문장의 문법적 온전성을 판별하는 과정이 필수적이다.
문장 기본은 6하 원칙이다. 주어 목적어 동사가 매 문장마다 늘 명확해야 한다. 이런 기본 중의 기본을 무시하면 AI를 적용해본들 실패하는 건 당연하다.
기업의 AI적용 철저한 사전준비 해야
문서 데이터에서 중요한 점은 그것을 AI의 먹이로 작용시키고자 할 때는 문서 내의 문장이 과연 행위 중심으로 기술되어 있는지 살펴봐야 한다는 점이다. 행위란 주문 생산 등 업무에서 발생하는 것이다. 행위 중심으로 묘사돼 있지 않을 경우에는 꼭 변환(교정)을 거쳐야 한다. 그후에 AI에 문서 데이터를 먹여주어야 한다.
이런 변환은 업무를 잘 아는 인간의 고유 영역이다. 그것까지 해주는 AI는 존재하지 않는다. 인문계가 하기에 매우 적합한 일이다. 기업 데이터 환경이 실험실과 다르다는 사실을 간과했다간 비용만 낭비한다. 경영진은 신뢰를 잃을 수도 있다. AI 추론기능이 이것도 자동으로 해주지 않겠나 생각하면 잘못이다.
