기고
생물자원 보전 위해 AI 활용 전문인력 양성해야
국가생물종목록에 약 5만8050종이 등록돼 있고, 국립생물자원관 한반도의 생물다양성(https://species.nibr.go.kr/index.do)에서 모든 종의 분류학적 정보를 검색할 수 있다. 국내 자생종으로부터 분류 생태 유전정보 소재 효능 등의 바이오 빅데이터가 계속 발굴되고 있다. 이렇게 축적되는 바이오 빅데이터를 활용해 생물종을 지속가능하게 보전하고, 생물에서 유래한 DNA 등 다양한 물질들을 활용해 녹색산업을 견인할 수 있는 방안이 요구된다.
국내 자생종 원천데이터 발굴해야
빅데이터에서 가치와 의미를 찾는 생물정보학 기법과 인공지능 기술이 엄청난 속도로 발전함에 따라 이러한 기술들을 △이미지 기반 생물의 종 판별 △환경DNA(eDNA)를 이용한 환경 모니터링과 평가 △유용바이오소재개발 등에 활용하는 것이 하나의 방안이 되겠다.
생물자원 데이터에는 디지털로 되어 있지 않은 전통적인 데이터와 새로운 빅데이터가 함께 있다. 전통데이터의 지속적인 발굴과 더불어 '3D 이미징(imaging)'과 같은 기술을 활용해 표본정보와 출현정보 같은 전통적인 데이터의 디지털 전환과 함께 인공지능 기술을 빅데이터에 적용한 분석을 병행해야 한다. 또한 인공지능 학습을 위한 원천데이터 확보가 매우 중요하다.
검색 플랫폼에 공개된 온라인 데이터로 훈련하는 데는 한계가 있다. 그러면 우리 스스로 국내 자생종의 원천데이터를 발굴하고 활용해야 한다. 국내자생종의 이미지 소리 데이터와 유전체 등 멀티-오믹스(multi-omics) 데이터, 소재정보는 아직 많이 부족하다. 발굴된 데이터는 전문 인력들이 사용가능하도록 기계가 자동으로 처리할 수 있는 표준양식으로 공개되고 공유돼야 한다.
이렇게 데이터 통합 플랫폼을 만들고 데이터들을 연계한 새로운 데이터와 분석 기반을 다양한 분야의 연구자들에게 제공할 수 있을 것이다. 국내 전문 연구인력 양성이 핵심이다. 인공지능 원천기술을 개발하고 해석하고 최신이론을 연구하는 인공지능 정보과학자들이 배출되도록 장기적으로 지원해야 한다.
국내 전문 연구인력 양성이 핵심
그러나 인공지능 기술을 접목해 생물종 인식과 환경DNA 데이터를 이용한 환경 모니터링과 예측, 바이오소재 개발, 야생동물 질병유전자 분석과 진단·분석기법의 개발 등 수요 기반의 바이오 핵심 빅데이터를 활용하는 석·박사급 전문인력은 상대적으로 단기간에 길러낼 수 있다. 이들이 생물자원 보전과 발굴의 여러 분야에 인공지능 기법들을 자유자재로 사용할 수 있게 해야 한다.
연구결과를 국내외 학술논문으로 출판하고 학술대회에서 발표하고 특허 등 지적재산으로 만든다. 이러한 전문 인력들이 경험과 사례들을 워크숍 등에서 서로 공유하면서 발전한다면 이 분야에서 우리가 세계적으로 앞서 나갈 수 있다.
국립생물자원관에서 주관하는 '생물정보 빅데이터 활용 전문인력 양성' 사업은 이러한 맥락에서 시의적절하다. 이 전문가 양성사업은 혁신융합대학이나 특성화대학원 등으로 확대 발전되어야 한다. 인력양성사업에서 배출된 신진 전문 인력들이 습득한 인공지능기술을 마음껏 발휘할 수 있는 관련분야 기업 등 산학연 일자리에 취업해 국가생물자원의 보전과 가치제고를 위해 일할 수 있게 되길 간절히 소망한다.