단백질 컴퓨터 모델
얼마 전 한국의 이세돌 기사에 맞서서 펼친 바둑대회에서 이긴 AI 알파고를 개발한 그룹으로 잘 알려진
딥마인드/DeepMind가 이번에는 과학자들이 50여 년간 풀지 못했던 어려운 과제를 해결하는
획기적인 프로그램을 개발해서 다시 한번 세상의 주목을 받게 되었다.
이번에 개발된 AI 프로그램인 알파폴드/AlphaFold는 생명체의 중요한 부분을 차지하지만,
상상을 초월할만큼 복잡하고 어려운 단백질이 어떻게 접혀서
단백질의 구조와 모양을 빠르고 정확하게 예측을 해 주는 대단한 시스템이다.
과학자들은 이 획기적인 기술은 질병을 유발케 하는 메카니즘을 간단하게 쪼개 분석해서
새로운 디자인 신약을 개발하는 데 중요한 단서를 제공해 주기도 하고,
영양가가 더 많이 포함된 곡식을 재배할 수도 있고,
요즘 심각한 공해의 주범인 플래스틱을 분해할 수 있는 '초록 효소'/green enzymes을
개발할 수 있는 유용한 시스템이라는 점에서 각광을 받고 있다.
딥마인드의 창립자이자 데미스 하사비스/Demis Hassabis는
알파폴드의 알고리듬은 점점 진화하면서 아주 파워풀한 시스템으로 발전할 수 있으며,
우선 말라이아, 수면병과 기생충에 의한 리슈마니아증 치료약 개발에 참여해서
신약 개발과 오랫동안 곤충이나 기생충으로 인한 질병을 퇴치하는 데 큰 도움이 되고,
다른 과학적인 과제에도 적용될 수 있어서 기쁘다."라고 밝혔다.
딥마인드는 그동안 체스, 바둑, 그리고 스타크래프트 II와 아타리 게임 경기에서
인간의 능력을 이미 능가하는 시스템을 개발한 회사로 잘 알려졌다.
하지만 그들의 궁극적인 목표는 이런 인간의 게임을 이기는 데 있는 것이 아니라
이런 AI 시스템을 개발하면서 점점 파워풀하게 되어서 세상의 실제로 해결해야 할
문제를 해결할 수 있는 시스템을 개발하기 위한 전초전에 불과했다.
단백질 접힘/protein folding 은 생물학계에서 과거 50년 동안 주요한 과제였다.
신체 내에서 발생하는 대부분의 생물학적 작용은 단백질과 밀접한 관계가 있으며,
단백질의 특정된 기능은 그 단백질의 형태와 구조에 달려있다.
그래서 연구원들이 단백질의 어떻게 접히는지 안다면, 그 단백질이 하는 역할을 알 수 있게 된다.
예를 들면, 인슐린이 어떻게 혈액 내의 포도당 수치를 컨트롤하고,
신체 내의 면역체가 어떻게 코로나 바이러스에 대처하는지 모두 단백질 구조에 따라서 정해진다.
그동안 과학자들은 2억 개 이상의 단백질을 발견했지만,
그 수많은 단백질 중에서 그 구조와 형태를 아는 단백질의 숫자는 지극히 적다.
그리고 지금까지 이 구조를 알아내려면 수년에서 수십 년에 걸친 시간이 요구되었다.
그 이유는 단백질이 아미노산이라는 긴 체인이 서로 복잡하게 얽히고 접히게 되면서
1 x 10E300, 즉 10의 300승이라는 상상을 초월하는 어마어마한 숫자의
다양한 단백질 구조를 만들어 낼 확률이 있기 때문이다.
이 복잡한 구조를 인지시키기 위해서, 딥마인드는 그들이 개발한 알고리듬을
공유저작물에 올라 있는 170,000개의 단백질 배열과 구조를 트레이닝을 시켰다.
많은 컴퓨터 공학자들은 지난 50여 년간 단백질 형태를 파악하는 프로그램 개발에 정진해 왔으며,
과거 25년간 서로 연구한 자료들을 서로 교환하고 공유하기 위해서
2년마다 개최되는 Critical Assessment of Structure Prediction/C.A.S.P. 국제 컴퓨터 경연대회를
통해서 진행되어 왔는데, 딥마인드측은 알파폴드를 이 CASP 비날에게 출전해 왔다.
이 대회에서는 각 출전팀에 약 100개의 단백질 구조를 제공해 주고, 컴퓨터를 사용해서
그 단백질의 접힘을 분석해서 가능한 구조를 최대한으로 파악하는 것이 목표이다.
이 CASP 대회에서 알파폴드는 100점 만점에 평균 92.5점을 얻어서,
다른 컴퓨터 프로그램보다 월등히 우수한 성적과 정확도를 과시했다.
참고로 오랜 시간에 걸쳐서 실험실에서 밝혀된 결과를 90점으로 보고 있다.
이번에 개발된 알파폴드의 방법이 좀 더 개선이 된다면,
연구팀이 신약개발은 물론, 이미 개발된 약을 새로 발생한 바이러스와 질병에 효과가 있는지
신속하게 진행할 수 있게 될 가능성이 높다.
안타깝게도 이 새 시스템이 올해 전 세계를 강타한 코로나 바이러스에 대처하기에는 너무 늦었지만,
앞으로 발생할 수 있는 또 다른 팬데믹에 재빠르게 대처할 수 있는 백신과 치료제를 개발할 수 있다고
많은 전문가들은 내다 보고 있다.
아울러 알차이머 병과 낭포성 섬유증 등 다양한 유전병을 이해하는 데
큰 공헌을 할 수 있다고 보고 있다.
딥마인드는 지난 10년동안 급격하게 대학교, 연구소, 제약계와 테크놀로지 등
여러 분야에 걸쳐서 주요 조력자로 부상했는데, 이는 그들이 개발한
'신경 네트워크/neural network'라는 AI 테크놀로지 덕분이다.
이 신경네트워크는 인간의 뇌의 신경세포 네트워크를 모델로 개발된
수학적 시스템으로 방대한 데이터를 초대로 스스로 인지하고 해석하는 능력을 갖추었다.
이 시스템은 이미 여러가지 분야에 사용되고 있는데,
예를 들면, 페이스북에 우리가 사진을 포스팅하면 사람을 얼굴을 알아볼 수 있고,
스마트폰에 말로 명령을 내리면, 알아서 시행을 해 주고,
스카이프에서 한 언어에서 다른 언어로 번역 기능을 들 수 있다.
바로 이 테크놀로지를 사용해서 단백질의 구조와 형태를 예측하게 된 것이다.
점점 빠른 속도로 인간의 능력을 능가하는 AI가 개발되면서,
예전의 연구 방식보다 보다 빠르고, 정확하게 지구상에 존재하는
여러 가지 문제들을 해결하는 해결사로 자리 잡을 가능성도 높아지는 요즘
AI의 활약을 기대해 본다.