연세대학교 의과대학 김형범 교수가 이달의 과학기술인상 5월 수상자로 선정됐다.

과학기술정보통신부와 한국연구재단은 김 교수가 인공지능으로 유전자 가위의 효율을 정확하게 예측하는 방법을 개발해 생명과학 발전에 기여한 공로를 선정 배경으로 설명했다.

‘크리스퍼(CRISPR) 유전자가위’는 동식물의 유전자에 결합하여 특정 부위를 절단해 유전자를 원하는 형태로 교정하는 인공효소다. 유전자를 자르는 절단효소 부분과, 유전자의 특정 부위만을 표적하게 하는 안내자 ‘가이드RNA’ 부분으로 구성된다.

가이드RNA(guide RNA, gRNA)란 RNA(핵산의 일종으로, 유전정보의 전달 등 다양한 생명활동에 관여함)와 DNA의 염기서열이 상보적일 때 서로 결합하는 특성을 이용해, 절단하려는 DNA의 특정 부위로 유전자가위를 안내하는 역할을 한다.

유전자가위는 유전자의 어떤 부위를 표적으로 삼는지에 따라 절단 효율이 현저히 달라지기 때문에 절단 효율이 높은 부위를 표적하도록 안내자(가이드RNA) 부분을 선정하는 것이 중요하다. 하지만 기존 유전자가위 효율 예측방법들은 정확도가 낮아 연구자들이 직접 수많은 유전자가위를 제작하고 실험을 통해 일일이 효율을 측정하는 과정에 막대한 시간과 노력, 비용이 낭비됐다.

김 교수는 방대한 자료를 스스로 학습하고 그 속에서 일정한 규칙성을 찾는 인공지능에서 유전자가위 효율성 예측의 해법을 찾았다.

개발한 인공지능 프로그램으로 15,000개의 CRISPR-Cpf1의 효율을 측정했다. 대량의 유전자가위의 활성 데이터를 이용해 딥러닝 모델을 학습시킴으로써, 기존에 연구자들이 직접 유의미한 패턴을 찾던 방식에서 벗어나 빅데이터 기반으로 유전자가위 효율 예측에 유의미한 특징들을 찾아냈다.

김 교수는 유전자가위 효율을 측정한 대량의 자료를 이용해 인공지능이 스스로 학습하게 했다. 연구자들이 직접 유의미한 경향을 찾던 기존 방법의 한계를 극복하고 유전자가위의 효율 예측에 유의미한 특징들을 찾아냈다.

유전자가위가 표적 부위에 구조적으로 잘 접근할 수 있도록 표적 부위의 염기서열뿐만 아니라 염색질 접근성까지 고려해 유전자가위의 효율 예측 정확도를 획기적으로 높였다.

Y축은 다수의 유전자가위 효과를 실제 실험으로 검증한 값이며, X축은 개발한 인공지능 프로그램으로 예측한 값의 분포이다. 검증된 값과 인공지능의 예측의 상관관계가 1에 수렴되는 것을 볼 수 있다.

유전자가위 활성에 대한 인공지능의 예측과 실제 실험 결과를 비교해보면 상관관계가 1에 가까운 0.87로 수렴돼 높은 신뢰도를 확보하며 유전체 교정 연구의 속도를 높일 핵심기술로 인정받았다. 연구 내용은 ‘네이처 바이오테크놀로지(Nature Biotechnology)’에 2018년 1월 게재됐다.

김 교수는 “더 많은 유전자가위 효율 정보를 추가적으로 인공지능에 학습시킬수록 정확도와 신뢰도를 높일 수 있다”라며 “유전자가위의 효율성을 높여 차세대 유전자 치료법 개발 등 다양한 생명공학 분야의 연구 발전에 기여할 수 있도록 후속 연구를 진행하겠다”라고 수상 소감을 밝혔다.

‘이달의 과학기술인상’은 우수한 연구개발 성과로 과학기술 발전에 공헌한 연구개발자를 매월 1명씩 선정하여 과기정통부 장관상과 상금 1천만 원을 수여하는 시상이다.