RNA전사체 모두 분석

기초과학연구원 RNA 연구단 김빛내리 단장・장혜식 연구위원 연구팀은 질병관리본부 국립보건연구원과의 공동 연구를 통해 코로나바이러스감염증-19의 원인인 사스코로나바이러스-2(SARS-CoV-2)의 고해상도 유전자 지도를 완성했다.

연구팀은 두 종류의 차세대 염기서열 분석법(나노포어 직접 RNA 시퀀싱, 나노볼 DNA 시퀀싱)을 활용해 사스코로나바이러스-2가 숙주세포 내에서 생산되는 RNA전사체를 모두 분석했다. 이 분석에서 바이러스 유전자의 정확한 위치를 찾아내는 한편, 기존 분석법으로는 확인되지 않았던 RNA들을 찾고, 바이러스의 RNA에 화학적 변형(최소 41곳)이 일어남을 발견했다.

이를 통해 바이러스 전사체가 어떻게 구성됐는지 이해하고, 바이러스 유전자들이 유전체 상의 어디에 위치하는지를 정확히 파악할 수 있게 됐다. 사스코로나바이러스-2 유전자의 복잡하면서도 숨겨진 비밀들을 풀 수 있는 지도를 확보할 수 있게 된 것이다. 또한, 유전체와 전사체에 대한 빅데이터를 생산하여 후속 연구를 위한 다양한 정보도 제공하고 있다.

사스코로나바이러스-2는 DNA가 아니라 RNA 형태의 유전자를 지니고 있다. 바이러스는 숙주세포에 침투해 유전정보가 담긴 RNA(유전체 RNA·genomic RNA)를 복제하는 한편 유전체RNA를 바탕으로 다양한‘하위유전체 RNA(subgemomic RNA)’를 생산(전사)한다. 이 하위유전체는 바이러스 입자구조를 구성하는 여러 단백질(스파이크, 외피 등)을 합성하며 복제된 유전자와 함께 숙주세포 안에서 바이러스 완성체를 이룬다. 이후 세포를 탈출하여 새로운 세포를 감염시킨다. 숙주세포 안에서 생산된 RNA의 총합을‘전사체(Transcriptome)’라 한다.

기존 연구에서 사스코로나바이러스-2의 유전체 정보가 보고되었지만, 유전체RNA정보를 기반으로 유전자의 위치를 예측하는 수준에 머물렀다. 김 단장 연구팀은 이번 연구에서 유전체RNA로부터 생산되는 하위유전체RNA를 실험적으로 규명하는 한편, 각 전사체의 염기서열(유전정보)을 모두 분석하여 유전체RNA 상에 유전자들이 어디에 위치하는지 정확하게 찾아냈다.

기존에는 하위유전체RNA 10개가 있다고 알려져 있었지만, 이번 실험으로 그중 9개의 하위유전체RNA만 실제로 존재함을 확인했다. 나머지 하위유전체RNA 1개에 대한 기존 예측과 다르게 실제로는 존재하지 않는 것으로 확인되었다. 연구팀은 세포 내에서 생산되는 RNA 수십여 종을 추가로 발견했다. 또 융합, 삭제 등 다양한 형태의 하위유전체 RNA 재조합도 빈번하게 일어남을 확인했다.

사스코로나바이러스-2(SARS-CoV-2)의 유전체RNA 및 하위유전체RNA 구성.
바이러스 입자 구조의 모식도. 사스코로나바이러스-2의 유전체RNA는 ORF1a, ORF1b, ORFS, ORFE, ORFM, ORFN, ORF3a, ORF6, ORF7a, ORF7b, ORF8, ORF10으로 구성된다고 알려져 있다. 이번 연구에서는 ORF10을 제외한 모든 유전체RNA의 구성을 실험적으로 증명했다. ORF10의 기존 예측은 틀린 것으로 보인다. 유전체RNA로부터 전사된 하위유전체RNA는 크게 9개(S, E, M, N, 3a, 6, 7a, 7b, 8)이다. 이 중 S, E, M, N는 각각 바이러스 입자 구조를 이루는 단백질(S:스파이크단백질, E:외피단백질, M:막단백질, N:뉴클레오캡시드단백질)로 번역된다.

이와 함께, 연구팀은 바이러스 RNA에서 메틸화와 같은 화학적 변형을 발견했다. DNA 메틸화처럼 DNA 수준에서 벌어지는 여러 생화학적 변화를 통칭하여 후성유전체(Epigenome)라 부르는 것처럼, 전사 후 RNA에서 벌어지는 다양한 생화학적 변화는 후성전사체(Epitranscriptome)라 한다. 전사 이후 변형된 RNA들은 기존에 알려지지 않은 새로운 특성을 가질 수 있으므로, 이번에 발견한 변형은 사스코로나바이러스-2의 생활사와 병원성을 이해하는 데 도움이 될 것으로 보인다.

김빛내리 단장은“새로 발견한 RNA들이 바이러스 복제와 숙주의 면역 반응을 조절하는 단백질로 작용하는지 확인해볼 필요가 있다. 또 RNA의 화학적 변형은 바이러스 생존 및 면역 반응과 관련이 있을 것으로 보인다”며“이 RNA들과 RNA 변형은 바이러스 치료제를 개발할 때 새롭게 표적으로 삼을만한 후보군”이라고 말했다. 이어 “이번에 사스코로나바이러스-2 각 전사체의 정량을 정확하게 파악했으며, 이를 토대로 진단용 유전자증폭기술(PCR)을 개선할 수 있을 것”이라고 설명했다.

연구팀은 질병관리본부 국립보건연구원에서 숙주세포에 배양한 바이러스를 불활화한 후, 두 가지 차세대 염기서열 분석법을 함께 적용하여 새로운 사실을 찾아냈다. 특히 연구팀이 국내 최초로 도입한 ‘나노포어 직접 RNA 염기분석법’을 활용하면 사스코로나바이러스-2의 매우 긴 RNA 염기서열을 절단하지 않고 통째로 직접 분석할 수 있다. 일반적으로 RNA 염기서열 분석은 DNA로 변환한 뒤 분석하지만, 이 분석법은 RNA 염기를 변환과정 없이 그대로 읽어 분석할 수 있다. 즉, 원어를 번역하지 않고 직독 직해하는 것과 같다. 반면, ‘DNA 나노볼 염기분석법’은 염기서열을 한 번에 분석할 수는 없지만 높은 정확도와 대용량으로 분석할 수 있는 장점이 있어, 정확도가 낮고 적은 용량을 분석하는 나노포어 직접 RNA 염기분석법을 보완할 수 있다.

김 단장은“이번 연구는 사스코로나바이러스-2 유전자에 대한 풍부한 정보와 세밀한 지도를 제시함으로써 바이러스의 증식원리를 이해하고 새로운 치료전략을 개발하는 데 기여할 것”이라고 말했다.

※ 논문 정보

– 제목 : The architecture of SARS-CoV-2 transcriptome

– 저자 : 김동완(IBS/서울대), 이주연(질병관리본부), 양정선(질병관리본부), 김준원(질병관리본부), 김빛내리(IBS/서울대), 장혜식(IBS/서울대)