ICT/융합

중국과기대, 인공지능으로 단백질 광학지문 최초로 예측

발행일 : 2019 / 06 / 11

최근 중국과기대학 미세규모물질과학국가연구센터 장쥔(江俊) 연구팀은 인공지능 기계학습의 신경망기술로 단백질 펩티드결합 구조 및 성질 간 구조-활성 상관관계를 시뮬레이션하여 연산량을 대폭 줄였다. 해당 성과는 단백질의 광학특성을 예측하는데 고효율적 도구를 제공했다. 해당 성과는 “미국국립과학원회보(PNAS)”에 게재되었다.

단백질의 스펙트럼 응답신호, 특히 자외선스펙트럼은 단백질 골격의 “지문”이라 불린다. 해당 “광학지문”은 이론적 시뮬레이션 해석을 통해 단백질 구조를 정확하게 규명할 수 있어 생명과학 및 의학진단에 중요한 정보를 제공할 수 있다. 하지만 단백질 구조는 매우 복잡다변 하여 대량의 고정밀 양자화학 이론적 연산이 필요하고 관련 연산량도 너무 많아 슈퍼컴퓨터마저 소화해내기 어렵다. 단백질 스펙트럼 이론적 해석은 장기적으로 해결하기 어려운 문제로 남아 스펙트럼적 정확 분석 및 단백질 구조 새발견을 제한하고 있다.

연구팀은 먼저 300K 온도에서 분자동역학적 시뮬레이션 및 양자화학적 연산을 통해 5만 개 서로 다른 구조의 펩티드결합 분자모형을 획득했다. 다음 기계학습 알고리즘으로 결합길이 및 결합각을 선별하고 이면각과 전하정보를 기술자(descriptor)로 함과 아울러 신경망을 통해 펩티드결합 기저상태 구조 및 들뜬상태 성질 간 구조-활성 상관관계를 구축했다. 그 다음 훈련된 기계학습모델에 기반해 펩티드결합의 기저상태 쌍극자모멘트 및 들뜬상태 성질을 예측했다. 마지막으로 펩티드결합의 자외선흡수스펙트럼을 예측했다. 기계학습모델의 강건성(Robustness)을 검증하기 위해 연구팀은 또다시 300K 온도에서 획득한 기계학습모델에 기반해 200K 및 400K 온도에서의 펩티드결합 자외선흡수스펙트럼을 예측한 결과 시간-밀도범함수이론 연산 결과와 매우 일치했다.

이는 인공지능기술이 최초로 이론적 연산을 통한 단백질 스펙트럼 예측 연구에 이용된 사례이다. 이론적 연산으로 획득한 대량 데이터를 인공지능으로 훈련시킨 후, 단백질 펩티드결합 골격 자외선흡수스펙트럼에 있어 기계학습 시뮬레이션의 타당성 및 장점을 확립했다. 따라서 단백질의 “광학지문” 해석은 보다 효과적이고 쉬워질 전망이다.