국내연구진이 인공지능 딥러닝(Deep Learning)기법을 이용해 점돌연변이 교정을 위한 유전자가위의 안전성을 높일 수 있는 실마리를 찾아냈다.

한국연구재단은 김형범 교수(연세대 약리학교실) 연구팀이 염기교정 유전자가위의 염기교정 효율과 교정결과를 예측할 수 있는 인공지능(AI) 프로그램을 개발했다고 밝혔다.

연구팀에 따르면 염기교정 유전자가위는 크리스퍼 유전자가위에서 유래된 새로운 타입의 유전자가위이다. 염기교정 유전자가위는 DNA의 이중가닥을 절단하지 않고, 특정 염기를 치환할 수 있다는 점에서 유용하다. 염기교정 유전자 가위는 아데닌(A; Adenine)을 구아닌(G; Guanine)으로 치환할 수 있는 아데닌 염기교정 유전자가위와 사이토신(C; Cytosine)을 티민(T; Thymine)으로 치환할 수 있는 사이토신 염기교정 유전자가위가 있다.

염기교정 유전자가위는 크리스퍼 유전자가위에서 유래되었기 때문에 기본 적인 특징(예, 가이드RNA)들은 유사하다. 하지만 유전자교정을 일으키는 효소는 서로 다르기 때문에 동일 가이드RNA을 사용하여도 염기교정 유전자가위와 크리스퍼 유전자가위의 활성이 다를 수 있다.

또 하나의 특징은 가이드RNA가 표적하는 20개의 위치 중 약 4~7개의 위치에서 염기교정이 일어나며, 이러한 염기교정 범위를 윈도우(window)라 칭한다. 윈도우 내에 표적염기가 여러 개 존재할 경우, 다양한 염기교정 결과가 나타날 수 있으며, 이런 염기교정 결과 중 일부는 단백질의 아미노산을 바꿀 수 있어 또 다른 변이 단백질을 만들 수 있다.

이런 문제를 극복하려면 염기교정 유전자가위에 적합한 가이드RNA를 선별하고, 선별된 유전자가위가 만들 수 있는 다양한 염기교정 결과물들의 빈도를 예측하는 프로그램이 필요하다.


DeepBaseEditor 예측 프로그램의 개략도.
교정을 원하는 염기서열을 넣으면 두 가지 예측모델이 각각 염기교정 효율과 가능한 교정결과들의 빈도를 수치화. 이후 두 모델을 결합하여 염기교정 유전자가위가 만들 수 있는 모든 결과물들에 대한 예측을 수행함. 출처 : 김형범 교수.

이에 연구팀은 다양한 염기교정 유전자가위를 만들고, 각각의 효율과 결과물의 빈도에 대한 빅데이터를 확보, 딥러닝으로 분석해 염기교정 결과예측 프로그램(DeepBaseEditor)을 개발했다.

이 프로그램을 이용해 2만3479개의 점돌연변이 유전질환 가운데 염기교정 범위 내 표적염기가 1개이면서 효율(5%이상)이 높을 것으로 예상되어 염기교정 유전자가위로 유전자편집을 시도해볼 수 있는 질환으로, 낭포성 섬유증(cystic fibrosis) 등 3,058개 가량의 점돌연변이 유전질환을 1차적으로 선별해냈다.


간 점돌연변이 질환에 대한 염기교정 유전자가위 효율 예측.
인간 점돌연변이 질환에 대해 염기교정 유전자가위의 염기교정 효율을 예측하여 효율에 따른 분포도. 특히, 예측 프로그램은 진한 빨간 부분(효율 5% 이상, 염기교정 범위 내 2개 이상 A 혹은 C)에 대한 질환에 대한 사용 가능성을 제시, 옅은 파랑(효율 5% 미만, 염기교정 범위 내 단일 A 혹은 C)에 해당하는 질환에는 사용이 어려울 것으로 예측함으로써 염기교정 유전자가위의 대상 질환에 대한 1차적인 선별이 가능함. 출처 : 김형범 교수.

점돌연변이 유전질환 가운데 상당수(약 19,505개)가 염기교정이 일어날 수 있는 범위에 동일 염기(아데닌 또는 시토신)가 2개 이상 자리하고 있어, 원하지 않는 위치에서의 편집확률을 미리 예측하는 것이 중요했다.

연구팀은 이들 19,505개의 유전질환 중 약 4,274개의 유전자에 대해 효율(5%이상)이 높으면서, 다른 염기의 변이가 잘 일어나지 않을 것으로 예측하였다. 선별된 유전질환들은 표적염기가 2개 이상으로 추가적인 변이가 발생할 수 있어 사용이 어려웠던 유전질환들이었다. 본 연구를 통해 위 질환들은 추가적인 변이 가능성이 낮을 것으로 예상되어 염기교정 유전자가위를 사용이 가능할 것으로 기대된다.

연구팀은 향후 본 예측 프로그램을 이용해 선별된 유전자가위를 활용, 질환 동물모델 수립연구를 추진할 계획이다.

과학기술정보통신부와 한국연구재단이 추진하는 중견연구지원사업, 바이오의료기술개발사업, 선도연구센터지원사업 등의 지원으로 수행된 이번 연구성과는 생명공학 분야 국제학술지 네이처바이오 테크놀로지(Nature Biotechnology)에 7월 7일(한국시간)에 게재됐다.

*용어설명

점돌연변이(point mutation) : 아데닌(A), 구아닌(G), 시토신(C), 티민(T) 등 네 종류의 염기가 특정한 순서로 늘어선 서열, 즉 유전자에 따라 다양한 생물학적 특성이 결정된다. 이 때 특정 위치의 염기 하나에 변이가 일어나면 유전질환으로 연결될 수 있는데 우리 유전질환의 절반 이상이 이러한 점돌연변이 때문인 것으로 알려져 있다.

크리스퍼 유전자가위 : 박테리아의 면역시스템에서 유래된 유전자가위로 게놈상의 특정 위치를 정해주는 단일가닥 RNA(single guide RNA;sgRNA)와 DNA를 절단하는 효소인 Cas9 단백질로 이루어진 유전자가위

염기교정 유전자가위(BASE EDITOR) : 기존 유전자가위와 달리 DNA 이중 나선을 절단하지 않고 특정 염기를 치환할 수 있는 유전자가위로 2016년 미국 하버드대학교 연구진이 처음 소개

가이드RNA : 크리스퍼 유전자가위나 염기교정 유전자가위가 특정 위치에 달라 붙게 가이드 역할을 해주는 RNA.