신약개발과 같은 분야에서 인공지능을 이용하는 것은 이제 당연한 일이 되었다. 게다가 딥러닝의 발전은 이전의 방식과는 다른 접근이 가능하게 해주었으며, 그 중 하나가 바로 그래프 뉴럴 네트워크(Graph Neural Network)이다.

  분자는 원자와 원자 간의 결합으로 이루어져 있으므로 이를 노드(Node)와 노드 간의 에지(Edge)로 이루어진 그래프를 이용해 표현하는 것은 자연스러운 과정이다. 딥 러닝의 역사는 여러 픽셀로 이루어진 이미지에서 패턴을 분석하기 위해 합성곱(Convolution)을 이용하며 발전해왔다. 이미지를 픽셀에 대한 합성곱을 통해 분류하는 것과 마찬가지로 그래프도 노드에 대한 합성곱을 통해 분류하는 일이 가능하다. 이처럼 그래프 뉴럴 네트워크를 통해 분자의 특정 물성을 예측하는 것이 가능해졌다.

  하지만 아쉽게도 새로운 모델과 알고리즘만으로 혁신적인 변화를 일으키는 것은 어려운 일이다. 그래프 기반의 다양한 연구들이 새로운 성과를 만들고 있는 것은 사 실이지만, 모든 모델들이 그렇듯이 실제로 활용되기 위해서는 먼저 적절한 데이터가 충분히 필요하다. 따라서 데이터가 불균형하거나, 신뢰하기 어렵거나, 양이 적은 경우에는 좋은 모델이라도 실력을 발휘하기는 어렵다. 이는 단순히 논문과 과제를 위한 연구보다도 실제로 산업에서 모델을 개발하는 과정 중에 특히 해결하기 어려운 문제이다.

  데이터의 부재에도 그래프 뉴럴 네트워크는 단백질-단백질 상호작용 또는 약물-단백질 상호작용과 같은 두 가지 대상 사이의 관계를 예측하는 일에 새로운 성과를 만들어냈다. 마찬가지로 용매와 용질 사이의 용해도는 두 분자 그래프 간의 관계를 통해 예측할 수 있었으며, 물론 여기서도 적절한 용해도 실험 데이터가 먼저 필요했다. 뿐만 아니라, 이와 같이 두 대상을 동시에 이용하는 다중 입력 모델은 다양한 관계를 학습하므로 데이터가 없는 미지의 분자 사이의 용해도를 예측할 수 있다는 잠재력을 확인할 수 있었다.

  인공지능은 빠르게 발전하고 계속해서 독창적이고 혁신적인 모델들이 제안되고 있다. 과학과 산업은 새로운 기술을 적용하여 이전보다 낮은 비용으로 높은 효율을 이루어 내고 있다. 특히 산업에서는 인공지능을 자신들의 분야에 어떻게 적용하여 누가 더 빠르게 깃발을 꽂는지 경쟁하는 기업 간의 구조가 형성되었으며, 이는 단연 그 기업의 인공지능 연구원에게만 요구되는 자세가 아닐 것이다.

저작권자 © 숭대시보 무단전재 및 재배포 금지