과학산책
인공지능, 생물학의 새 지평을 열다
단백질이 다양한 생체분자와 상호작용하는 방식을 예측하는 방법론이 빠르게 발전하고 있다. 5월 초 구글 딥마인드에서 개발한 인공지능 기반 구조예측 프로그램인 알파폴드3이 가장 대표적이다. 각 단백질이 지닌 3차원 구조를 예측하는 혁신을 넘어 신약개발에 한발 다가서는 혁신을 불러온 것이다.
이러한 예측 프로그램은 생체 내에서 가장 핵심 역할을 하는 분자 중 하나인 단백질이 작동하는 방식을 매우 빠른 속도로 제법 정확하게 예측할 수 있는 기회를 제공한다. 이번 업데이트를 통해 단백질이 다른 생체 분자와 결합하는 구조를 보다 정확하게 예측함으로써 단백질을 조절하기 위한 기반이 마련되고 있다. 암 또는 유전질환을 앓고 있는 환자에서 단백질의 기능을 조절할 수 있는 약물분자를 빠르게 예측함으로써 질병 및 질환을 치료할 수 있는 시간을 앞당길 수 있을 것이라 기대된다.
단백질이 다른 생체 분자와 서로 결합할 수 있는 방식을 예측하는 일은 단백질을 인위적으로 조절하기 위한 연구의 일환이다. 단백질은 세포 안의 다양한 화학반응을 매개하는 핵심 생체 분자로 세포 내 유전자 정보를 기반으로 생산된다. 현재까지 알려진 약 6만여개의 사람 유전자 중 2만여개에서 단백질이 생성될 수 있다.
이처럼 서로 다른 유전자에 담긴 정보를 기반으로 생산된 단백질은 저마다 다른 생체반응을 일으킨다. 이러한 단백질 종류의 조합을 달리함으로써 세포는 저마다 서로 다른 기능을 담당하게 된다. 그 조합에 따라 어떤 세포는 신경세포가 되고, 다른 세포는 근육세포가 되는 식으로 기능이 나뉜다. 단백질이 제 기능을 발휘할 수 있어야 세포도 제 역할을 수행할 수 있다. 이를 위해 단백질이 생산되는 양과 위치, 그 안정성 등을 제대로 조절하는 것이 필요하며 이러한 조절이 잘 작동할 때 생물은 건강하게 살아갈 수 있다.
단백질의 작동방식 제법 정확히 예측
이러한 단백질 기능 및 조절을 이해하고 활용하는 데 있어 가장 중요한 정보 중 하나는 단백질의 구조정보다. 단백질은 유전자에 담긴 정보를 기반으로 아미노산이라고 하는 구슬이 일렬로 꿰어지면서 생산되며 이후 이것이 구겨지고 접히며 특정한 3차원 구조를 띠게 된다. 이 구조는 단백질이 제 기능을 하는 데 핵심적인 역할을 한다.
잘 접힌 단백질은 표면에 특정한 부위를 노출시키게 되고 이곳에 다른 단백질이나 생체분자가 붙었다 떨어지며 다양한 화학반응이 일어나게 된다. 그러니 단백질 구조를 분석하면 이러한 부위에 어떤 생체분자가 결합해 어떤 반응을 일으킬지 예측할 수 있다. 나아가 이 부위를 덮어씌워 단백질의 기능을 막는 새로운 약물분자도 예측할 수 있다. 예컨대 암세포의 주요 단백질 구조를 기반으로 결합용 화학물질을 예측하고, 실제로 해당 단백질의 작동을 막아 암세포를 억제하는 신약개발이 가능한 것이다.
문제는 이러한 단백질 구조를 확인하는 일, 어떤 물질과 결합하고 결합하지 않는지를 검증하는 실험이 매우 어렵다는 것이다. 단백질 하나가 어떤 구조를 지니는지 연구하는 데만 몇년씩 걸리는 경우가 허다하며, 그와 결합할 수 있는 분자를 검증하는 것도 몇년은 걸리는 일이다. 그러니 2만개의 유전자에서 만들어지는 단백질 구조와 결합 분자를 확정짓는 것은 막대한 자원을 쏟아야만 하는 일이었다.
그러나 단백질 구조 예측 프로그램이 발전하며 이 과정이 자동화됨에 따라 그 생산성이 눈부시게 향상되고 있다. 사람이 지닌 2만여 유전자에 대한 단백질 구조는 이미 모두 예측돼 공공자료로 공개된 지 오래다. 지금까지 예측된 생물의 단백질 구조는 2억개도 넘는다. 고성능 컴퓨터를 활용하면 어떠한 생물의 단백질이든 그 구조를 예측할 수 있게 됐다.
그리고 이제는 단백질 자체의 구조뿐만 아니라 이러한 단백질이 다른 단백질과 어떻게 결합할 수 있는지, DNA나 RNA 작은 분자들과는 어떻게 결합할 수 있는지도 예측하는 것이 가능해졌다. 10년은 족히 걸리던 일을 이제는 몇달 만에 제법 정확하게 예측할 수 있게 되면서 신약개발이 가속화될 것으로 내다본다.
예측 고도화 통해 신약개발 가속화
이처럼 생물학은 여느 분야와 마찬가지로 인공지능을 통한 예측 고도화와 이를 통한 자동화를 통해 빠르게 발전하고 있다.
과기정통부에서 내건 디지털바이오는 그 발전을 가속화할 것으로 보인다. 여전히 부족한 다양한 생명현상에 대한 고품질 자료가 대량으로 생산된다면 이를 기반으로 한 예측 또한 고도화될 것이기 때문이다.
이를 통해 생물학 연구의 생산성이 높아지고 더 빠르게 더 정확하게 질병 치료와 예방에 다가서길 기대한다.
김 준 충남대 교수 생명시스템과학대학