DNA 정보저장 기술은 계속해서 향상되고 있다. 확장 가능한 분자 라이브러리는 미래의 정보 저장을 위한 안정적이고, 에너지도 필요 없다.

정보를 저장하는 새로운 방법은 수백만 년 동안 안정적으로 데이터를 보관하고 해킹 가능한 인터넷 외부에 저장, 한번 저장하면 아무런 에너지도 사용하지 않을 수 있다. 화학자, 값싼 분자, 귀중한 정보만 있으면 된다.

하버드대 조지 화이트사이드(George Whitesides) 랩의 우드포드( Woodford L.) 그리고 엔(Ann A.) 플라워스 교수 연구실 박사후연구원인 논문의 1저자 브라이언 케퍼티(Brian Cafferty)는 새로운 DNA 정보저장 기술을 뉴욕 공공 도서관을 티스푼 분량 단백질에 저장하는 것에 비유했다.

연구는 노스웨스턴대(Northwestern University) 밀란 메치(Milan Mrksich) 연구팀과 공동으로 수행했다.

케퍼티는 “적어도 현재 단계에서 이 방법이 기존의 데이터 저장 방법과 경쟁하는 것으로 생각하기는 어렵다”며 “대신 이 기술을 이러한 기술에 보완적인 것으로 간주하고 초기 목표로 장기 보관 데이터 저장에 적합하다”고 말했다.

파일링 시스템은 DNA와 같은 생물학적 저장 도구에 대한 매력적인 대안을 제공한다. 최근에 과학자들은 시각 색 그 이상을 부호화하기 위해 DNA를 조작하는 방법을 발견했다. 연구원은 이제 고양이 비디오, 다이어트 트렌드 및 요리 자습서를 포함한 모든 정보를 기록하기 위해 DNA 가닥을 합성 할 수 있다.

합성된 DNA는 컴퓨터 칩에 비해 작지만, 분자 규모에서는 거대 분자다. DNA 합성에는 숙련되고 종종 반복적 인 노동이 필요하다. 각 메시지를 처음부터 고안해야하는 경우 고분자 저장 장치가 길고 값 비싼 작업이 될 수 있다.

DNA를 이용한 새로운 화학적 저장방법. credit:harvard.

연구팀은 생물학 대신 유기 화학 및 분석 화학에서 공통적으로 사용하는 기술을 활용해 정보를 암호화하기 위해 낮은 중량 분자를 사용하는 접근 방식을 개발했다.

한 번의 합성으로 한꺼번에 여러 개의 고양이 비디오를 인코딩 할 수있는 충분한 작은 분자를 생산할 수 있어 이 방법은 DNA를 기반으로하는 것보다 노동 집약적이고 비용이 적게 든다. 저중량 분자으로 올리고펩타이드(oligopeptides, 두 개 이상의 펩타이드가 함께 결합)를 선택했다. 이는 안정적이며 DNA, RNA 또는 단백질보다 작다.

올리고 펩타이드는 아미노산의 종류와 수에 따라 질량이 다르다. 함께 섞여있는 그들은 알파벳 문자들 같이 서로 구별이 가능하다. 문자에서 단어를 만드는 것은 약간 복잡하다. 384개의 구멍이있는 소형 구멍인 마이크로웰 (microwell)에는 질량이 다른 올리고펩타이드가 들어 있다. 페이지에 잉크가 흡수되는 것처럼 올리고펩타이드 혼합물은 금속 표면에 모아져 저장된다. 저장한 내용을 다시 읽고 싶다면 질량 분석기를 통해 구명중 하나를 살펴보고 질량으로 분자를 분류한다. 이는 어떤 올리고펩타이드가 존재하는지 또는 존재하지 않는지를 알려준다.

그런 다음 분자의 혼란을 글자와 단어로 번역하기 위해 이진 코드를 상용한다. 예를들어, “M”은 8개의 가능한 올리고펩타이드 중 4개를 사용하며, 각각 다른 질량을 가지고 있다. 마이크로웰에 떠다니는 4개는 “1”을, 누락 된 4 개는 “0”을 나타낸다. 분자 – 이진 코드는 해당 문자를 가리키며, 정보가 이미지이면 해당 픽셀을 나타낸다.

이 방법으로, 8개의 올리고 펩타이드 혼합물은 1바이트 정보를 저장할 수있다. 32는 4바이트를 저장할 수 있다.

케퍼티 연구팀은 물리학자 리차드 파인만(Richard Feynman)의 유명한 강연을 ‘쓰고’, 저장, ‘독해’했다. 정보 이론의 아버지로 알려진 클로드 세넌(Claude Shannon)사진도 시도했다.

전세계 디지털 아카이브는 2020년까지 44조 기가바이트로 2013년의 10배에 이를 것으로 예상된다. 현재 팀은 저장된 작품들을 99.9 %의 정확도로 검색 할 수 있다. 그들의 “쓰는”평균은 초당 8비트이고 “읽기”는 초당 평균 20비트다. “쓰기”는 합성 DNA로, ‘읽기’는 거대 분자로 더 빠르고 더 저렴해질 수 있다.

기술 발달은 가속도를 높인다. 예를 들어, 잉크젯 프린터는 초당 1,000 회의 속도로 방울을 생성할 수 있으며 더 작은 영역에 더 많은 정보를 추가 할 수 있다. 또한 향상된 질량분석기는 한 번에 훨씬 많은 정보를 수집 할 수 있다.

팀은 또한 분자의 종류에 따라 분자 저장의 안정성, 가격 및 용량을 향상시킬 수 있다. 올리고펩타이드는 맞춤형이며 따라서 더 비싸다. 그러나 장래의 도서관 제작자들은 저렴한 분자(alkanethiols)를 활용할 수 있는데, 이는 1억 비트의 정보를 기록하는데 단지 1센트에 불과할 것이다.

하나의 특정 분자에 의존하는 다른 분자 정보 저장 시스템과 달리, 이 접근법은 구별 가능한 비트로 조작 될 수 있는 한 모든 분자를 사용할 수 있다.

책은 화재에 취약하고, 컴퓨터는 해킹 위험이 있다. DVD는 기능이 저하된다. 데이터 붐이 계속 호황을 누리면서 점점 더 많은 정보가 점점 더 적은 공간에 정리된다. 클라우드 조차도 결국에는 공간이 부족할 것이다. 해커 공격을 막을 수 없으며 에너지를 계속 소모하게 될 것이다.

올리고 펩티드는 적절한 조건 하에서 수 백년의 안정성을 가지고있다. 강건한 분자는 고열 및 가뭄에서 빛 또는 산소 없이 견딜 수 있다. 또한 해커가 액세스 할 수있는 클라우드와 달리 분자 저장소는 직접 액세스 할 수 있다. 도둑이 데이터 숨김을 발견하더라도 코드를 검색하려면 약간의 화학 지식이 필요하다.

이번 연구는 DARPA(Defense Advanced Research Projects Agency) 의 지원으로 수행, 학술지 ‘ACS Central Science’에 게재됐다.