본문 바로가기
Coffee Genetics

Helicos BioSciences True Single-Molecule Sequencing - 3세대 시퀀싱

by mjcafe 2024. 7. 16.

 

 

고속, 고감도 True Single Molecule Sequencing (tSMS) 분야의 선구자, 비증폭 단일 분자 기반 기술 (Non-Amplified Single Molecule-Based Technology)을 사용하여 최초의 성공적인 M13 시퀀싱 수행

고속 시퀀싱 분야에서 최초로 달성한 성과로, Helicos BioSciences는 오늘 (2005.12.20) SimplePrep genome preparation technique과 함께 non-amplified True Single Molecule Sequencing (tSMS) technology를 활용하여 M13 게놈을 성공적으로 시퀀싱했다고 발표했다. 

M13의 시퀀싱은 소위 호모폴리머 시퀀스를 포함한 전체 게놈에서 수행되었다.

"이것은 전례 없는 성과입니다." Helicos BioSciences의 사장 겸 CEO인 Stanley N. Lapidus가 말했다. 

"Helicos는 tSMS 기술을 사용하여 게놈을 성공적으로 시퀀싱한 유일한 기관입니다. 우리는 이 성과를 이루기 위해 열심히 노력했습니다."

그는 "게놈 DNA에서 직접 작업하고 증폭을 제거하는 tSMS의 단순성은 연구자들에게 비교할 수 없는 이점을 제공하며, 잠재적으로 단일 유리 기판에서 전체 인간 게놈을 표현하고 수년이 아닌 단 하루 만에 시퀀싱할 수 있게 해줍니다."라고 덧붙였다.

 

 

 

매사추세츠주 케임브리지에 있는 Helicos BioSciences 사무실 구석에 거대한 냉장고처럼 생긴 것의 표면에 있는 화면에 카운트다운이 깜빡인다. 주입된 모든 DNA의 시퀀스를 읽는 것을 마칠 때까지 10일, 5시간, 51분이 남았다. 


튜브, 레이저, 화학물질로 구성된 복잡한 구성의 이 고성능 기계에는 각각 25개의 마이크로유체 채널이 새겨진 두 개의 플레이트가 있다. 각 채널은 별도의 DNA 샘플을 보관하고 시퀀싱할 수 있다. 샘플을 병렬로 시퀀싱하는 이 기계는 DNA 가닥을 구성하는 A, C, T, G로 알려진 13억 개의 화학적 "염기"를 읽는 데 불과 1시간이 걸린다. 

 

 

HeliScope라고 불리는 이 기기는 단일 가닥의 시퀀스를 직접 읽을 수 있는 최초의 상용 기기로, 이 기능을 통해 전례 없는 속도를 낼 수 있는 잠재력을 제공한다. 실제로 2003년에 이 회사를 공동 창립한 스탠포드 대학의 생명공학자인 Stephen Quake는 Helicos가 "기본적으로 세계에서 가장 빠른 DNA 시퀀서를 구축했다"고 말한다. 이 기기가 경쟁 시스템보다 더 빠르게 완전한 시퀀스를 생성할지는 확실하지 않지만(시퀀싱 기기에서 생성된 데이터는 여전히 분석하고 연결해야 하며, 계산 집약적인 작업임), Quake는 이것이 "완전히 새로운 연구 분야를 개척하고 있다"고 말한다.

올해 초에 소개된 HeliScope는 더 빠르고 저렴한 시퀀싱 기술을 위한 치열한 경쟁에 합류하고 있다. 인간 게놈 시퀀싱 가격은 최근 몇 년 동안 떨어졌는데, 인간 게놈 프로젝트가 첫 번째 초안에 사용한 3억 달러에서 10만 달러 미만으로 떨어졌다. 저렴한 시퀀싱의 적용 분야는 질병 진단에서 바이오 연료나 의약품을 생산하도록 설계된 미생물을 생산할 수 있는 연구에 이르기까지 거의 무한하다.

 

Illumina, Applied Biosystems, 454 Life Sciences (작년에 Roche에 인수됨)를 포함한 현재 사용 중인 다른 고급 시퀀싱 기술에서 시퀀싱할 DNA는 증폭되거나 여러 번 복사되어야 한다. 그런 다음 각 DNA 문자의 위치를 ​​나타내는 형광 신호를 더 쉽게 감지할 수 있도록 사본을 동시에 읽는다. 싱글 분자 시퀀싱은 복사 단계를 건너뛰므로 훨씬 더 많은 고유한 샘플을 단일 시퀀싱 실험에 넣을 수 있다.

또한 싱글 분자 시퀀싱은 게놈에 대한 보다 완전한 그림을 생성할 수 있다. 그 이유는 DNA가 증폭될 때 일부 스트링은 다른 스트링보다 성공적으로 복제될 가능성이 더 높기 때문에 최종 시퀀스에 표현될 가능성이 더 높기 때문이다. 마찬가지로 희귀한 유전자 돌연변이는 복제되지 않기 때문에 표현되지 않을 수 있다. 세인트루이스에 있는 워싱턴 대학교 게놈 센터의 공동 책임자인 엘레인 R. 마르디스는 "결국 단일 DNA 스트랜드를 플랫폼에 올려놓고 직접 시퀀싱할 수 있다면 엄청난 이점입니다."라고 말한다.

 

HeliScope는 여러 번 복사된 DNA가 아닌 단일 DNA를 시퀀싱하는 최초의 상업용 기계이다. 각 "플로우 셀"(사진)에는 25개의 채널이 있으며, 각각 시퀀싱을 위해 1,600만 개의 DNA 가닥을 보관할 수 있다. 셀 표면의 코팅으로 반응 사이에 깨끗이 세척할 수 있다.

 

시퀀싱 프로세스를 시작하기 위해, 멀티팁 피펫을 사용하여 플로우 셀에 DNA 샘플들을 주입

 

플로우 셀을 복잡한 광학 시스템과 4개의 디지털 카메라가 포함된 HeliScope에 로드한다. 사진 상단에 가로 줄무늬로 보이는 화강암 판이 장비의 진동을 방지한다.

 

DNA 염기(A, C, T, G)와 DNA 중합효소(시퀀싱 반응을 촉매하는 효소)는 정확한 시간 간격으로 복잡한 유체 시스템을 통해 플로우 셀에 공급된다.

 

저전력 레이저가 디지털 카메라에 의해 기록되는 시퀀싱 반응을 조명한다.
카메라에 의해 기록된 데이터는 이미지를 일련의 DNA 문자로 변환하는 처리 센터로 전송된다. 특수한 알고리즘이 겹치는 조각을 더 긴 DNA 서열로 조립한다.

 


Awake at Night
Helicos 기술을 사용하면 시퀀싱할 DNA를 먼저 약 200개의 염기 길이의 짧은 조각으로 자르고 특수 유리 슬라이드인 플로우 셀에 주입한다. 플로우 셀은 떠다니는 단편을 잡아서 제자리에 고정하도록 설계된 작은 DNA 조각으로 코팅된다. 고정된 DNA 조각은 형광으로 표지되어 형광 현미경 아래에서 카메라로 위치를 기록할 수 있다. 다른 기술의 경우 약 400,000~5,000만 개에 비해 싱글  시퀀싱 실험에서 거의 10억 개의 DNA 조각을 분석할 수 있다.

그런 다음 플로우 셀은 HeliScope에 자리 잡고, 현미경은 400파운드의 버몬트 화강암에 안치되어 있다. 추가된 무게는 진동이 장치가 감지해야 하는 신호를 방해하지 못하게 한다. 복잡한 광학 시스템과 얽힌 튜브가 현미경을 둘러싸고 있으며, 특수 제작 화학 물질 병으로 가득 찬 미니어처 냉장고처럼 보이는 곳에 연결된다.

과학자가 기계를 작동시키면, 정확하게 안무된 유체의 춤이 시작된다. DNA 중합효소라는 효소와 형광으로 표지된 단일 유형의 염기(예: A)가 세포로 흘러 들어간다. 이 효소는 이러한 A가 샘플의 가닥에 상보적인 성장하는 DNA 가닥에서 자리를 잡도록 한다. (4개의 염기는 각각 다른 염기와만 짝을 이룰 수 있으므로 추가된 A는 기존 T와 마주보게 정렬되어야 하고, C는 G와 마주보게 정렬되어야 한다.) 형광으로 표지된 염기가 새로운 가닥에 통합되면 HeliScope의 카메라는 방출되는 빛을 발견할 수 있다. Helicos의 사장인 Steve Lombardi는 "이미저는 단일 [염기]가 단일 DNA 가닥에 통합되면서 200나노미터의 원뿔 모양의 빛 기둥을 감지합니다."라고 말한다.

 

다른 고급 시퀀싱 방법은 sequencing by synthesis이라고 알려진 유사한 접근 방식을 사용한다. 그러나 이러한 기술과 달리 HeliScope는 성장하는 DNA 가닥에서 자리를 잡는 단일 염기의 증폭되지 않은 형광 신호를 구별할 수 있다. 이러한 능력의 핵심 중 하나는 회사에서 개발한 비접착성 소재로, 플로우 셀의 표면을 코팅하여 반응 사이에 깨끗이 세척할 수 있다. 잔류 형광 염기는 개별 시퀀싱 반응을 정확하게 감지하기 어렵게 만든다. Helicos의 최고 과학 책임자인 Patrice Milos는 "표면에 여분의 염기 분자가 달라붙지 않도록 해야 합니다."라고 말한다. "이것은 가장 큰 초기 과제 중 하나였습니다." 각 사이클 후에 형광 마커는 새로 통합된 염기에서 잘라내고 나머지 화학 물질은 씻어낸다. 이 프로세스는 4개의 염기 각각에 대해 순차적으로 반복된다.

HeliScope는 매초 엄청난 양의 원시 데이터를 생성한다. 두 개의 플로우 셀에 로드할 수 있는 모든 DNA를 읽는 데 5~10일이 걸린다. 시퀀싱의 경우 셀당 4억 개의 DNA 가닥이 필요하며, 200억 개의 염기에 해당하는 사용 가능한 시퀀스를 생성할 수 있다. 과학자들은 기계를 로드하고, 기계 앞면에 있는 버튼을 누르고 떠난다. 하지만 시퀀싱에 집착하는 사람들은 인터넷을 사용하여 한밤중에 기계의 진행 상황을 확인할 수 있는데, 이는 Helicos에서 흔히 볼 수 있는 일이다.

HeliScope가 일련의 형광 사진을 만들면, 수반되는 데이터 처리 센터가 이를 문자열로 변환한다. 소프트웨어는 이러한 조각들을 붙여 더 긴 시퀀스를 형성한다.

Missing Mutations
올해 초 Science에 발표된 논문에서 과학자들은 HeliScope를 사용하여 M13 바이러스의 유전체를 시퀀싱한 것에 대해 보고했다. 이는 싱글 분자 시퀀싱을 사용하여 완전한 유전체의 시퀀스를 읽고 조립할 수 있다는 중요한 증거이다. (약 7,000개의 염기쌍 길이의 M13 바이러스의 유전체는 매우 작다. 인간의 약 백만분의 1 크기이다.)  이 기술은 너무 새롭기 때문에 어떤 응용 분야에 가장 적합할지 아직 명확하지 않다. 그러나 일부 과학자들은 싱글 분자 시퀀싱이 유전적 변이가 질병에 어떻게 기여하는지 이해하는 데 특히 중요할 수 있다고 믿는다. 결국 질병과 관련된 일부 희귀 돌연변이는 증폭 과정에서 복사되지 않았기 때문에 이전 유전체 연구에서 놓쳤을 수 있다. 

Helicos는 여전히 기술을 손보고 있으며, 시퀀싱 반응 속도를 높이고 더 많은 DNA 조각을 유동 셀에 고정할 수 있는 화학을 개발하고 있다. 이 분야의 다른 주요 기업과 함께 이 회사는 1,000달러에 완전한 게놈 시퀀스를 제공하기를 바라고 있다. 이는 의학에서 완전히 새로운 것의 시작을 알리는 업적이다. 개인이 자신의 게놈 정보에 접근할 수 있는 능력이다. 

 

 

3세대 시퀀싱 방법론들에는 싱글 핵산 분자들을 분석할 수 있고 (예전의 증폭 단계가 있는 경우도 있고 없는 경우도 있음), 매우 높은 쓰루풋 결과를 생성하는 최신의 전략들이 포함된다. 이 방법론들은 또한 출현 당시 ‘next-next-generation’ 시퀀싱이라고도 알려졌었다 (von Bubnoff, 2008). Single-molecule sequencing 어푸로치들은 인간 게놈의 리시퀀싱 비용을 1000달러 ((Milos, 2008) 그리고 심지어 최근에는 100달러에도 할 수 있게 한다. 


Helicos BioSciences의 true Single-Molecule Sequencing (tSMS)은 이전의 증폭 단계들 없이 단일 핵산 분자를 시퀀싱할 수 있는 일련의 기술 중 첫 번째이다 (Harris et al., 2008).

분무화(nebulization)에 의해 DNA가 무작위로 절단된 후, 생성된 단편이 변성된다.
형광 폴리(fluorescent poly)(A) 꼬리가 3’-OH end에 추가되어 poly(T) primers가 있는 고체 지지체(solid support)에 표지된 ssDNA를 고정할 수 있다.

형광 라벨은 검출기에 의해 위치가 파악하고 절단되어(cleaved) 제거된다.
그런 다음 형광 dNTP가 하나씩 추가된다.

DNA 중합효소가 형광 dNTP를 통합하면 발광이 발생하고 이어서 형광 라벨이 절단 및 제거된다. 
이러한 반응은 플로우 셀에서 수백만 개의 병렬 반응으로 수행된다.

결과 판독은 생물정보학 도구에 의해 콘티그, 염색체 및 게놈으로 조립된다 (Figure 7).

게다가, tSMS는 이전의 증폭, 결찰 또는 상보성 DNA(cDNA) 합성이 없이 개별 RNA 분자의 Direct RNA Sequencing (DRS)도 할 수 있게 해주므로, RNA의 cDNA로의 전통적인 역전사(retrotranscription), 증폭 및 시퀀싱(또는 더 정확한 cDNA-seq 대신 오히려 오해의 소지가 있는 이름인 RNA-seq을 사용함)의 바이어스를 제거할 수 있게 해준다 (Ozsolak et al., 2009).

 

 

 

 INTRODUCTION

 

HelicosTM Genetic Analysis System은 통합적 시스템으로서 함께 작동하는 복수의 구성요소들로 이뤄져 있다. 
시퀀싱을 목표로 하는 DNA 분자들은 1회용 유리 플로우 셀 위에서 혼성체화된다 (hybridized). 
샘플들은 최적의 혼성체화(hybridization)를 위해 온도가 조정될 수 있는 Helicos Sample Loader를 사용하여 플로우 셀들로 로딩된다. 하나의 표준 플로우 셀 상의 25개 채널들 각각이 샘플과 그리고 샘플 준비 단계를 요하는 어떠한 다른 것의 추가 시 개별적으로 주소지정이 될 수 있다.


일단, 플로우 셀들에 샘플이 적절하게 로딩되면, 그들은 합성과 이미징에 의한 시퀀싱을 위해 필요한 모든 시약들과 함께  HeliScopeTM Sequencing System에 삽입된다. 그러면, 그 Sequencing System은 HeliScope Analysis Engine에 의해 실시간으로 처리되는 이미지들로 필요한만큼 시퀀스할 수 있게 된다. 그 Analysis Engine은 각 물리적 위치로부터의 이미지들을 처리하고, 그 이미지들로부터 시퀀스 리드들을 구축한다. 
실행이 완료되고, 그 이미지들이 처리되며, 가닥 형성이 완성되면, 그 데이터는 레퍼런스 배열이나 필요한 어셈블리를 위해 compute cluster로 다운로드된다. 

3가지 프로토콜들이 본 unit에 기술된다 (Fig. 7.10.1). 
Basic Protocol 1은 genomic DNA를 shearing하여 tailing을 준비하도록 하기 위한 것이다. 
Basic Protocol 2는 샘플들을 tailing하고 blocking하여, 시퀀싱 플로우 셀으로 혼성화되고 제대로 시퀀싱할 수 있도록 하기 위함이다. 
샘플을 핵심적인 시퀀싱 장비에 공급할 때, 샘플들은 일반적으로 이 단계에서 또는 장비에 따라 적정 샘플 농도 결정 후에 제공된다. 실제적인 시퀀싱 프로세스는 Basic Protocol 3에 상세하게 나와 있다. 

 



 BASIC PROTOCOL 1: 
 SHEARING AND PURIFICATION OF DNA
 IN PREPARATION FOR TAILING

Helicos Genetic Analysis System (http://www.helicosbio.com/)은몇 개의 뉴클레이티드들에서부터 수천개의 뉴클레오티드들까지 매우 넓은 범위의 템플릿 길이들에 대해, 대부분의 상황들에서 사이즈 선택 필요 없이, 핵산을 시퀀스할 수 있다. 


그러나, yield of sequences per unit mass는 3’ end hydroxyl groups의 수에 따라 다르며, 따라서 시퀀싱할 템플릿이 긴 경우보다 상대적으로 짧은 템플릿들의 경우가 더 효율적이다. 1000 nt 이상으로 긴 핵산으로 시작한다면, 평균 길이를 100에서 200 nt로 절단하여, 더 많은 시퀀스 정보가 동일한 질량의 핵산들로부터 생성될 수 있도록 하는 것이 권고될 수 있다. 


Double-stranded DNA의 경우에, shearing을 위한 표준 Helicos 프로토콜은 Covaris Adaptive Focused Acoustic 장비를 이용하는데, 이는 fragments size에 대한 컨트롤이 좋고, 권고되는 파워 세팅들에서 사용되면, 3’ end가 terminal transferase tailing과 잘 화합할 수 있다 (see Basic Protocol 2). 


모든 sonicators (초음파 발생기)가 동등한 결과를 제공하지는 않으며, 따라서 대체 장비를 이용한 shearing은 결과적인 DNA가 지나치게 손상되지 않도록 파일롯 테스팅을 한 후에 이뤄져야 한다. 


추가적으로, 상업적으로 이용가능한 효소적 shearing 어푸로치들이 있으며, 이들도 Nextera system (Epicentre) 및 NEBNext dsDNA Fragmentase enzyme (New England Biolabs)과 같은 표준적인 샘플 준비 기법들과 잘 어울린다. 
일부 활용의 경우에, shearing이 아니라, 제한 엔도뉴클레아제 (restriction endonucleases) 또는 여타 특정 커터들로 cleave하는 것이 바람직할 수도 있다. 


또 다른 경우에는, 배부분의 ChIP, FFPE, 그리고 고대 또는 분해된 샘플들의 DNA와 같이, 이미 충분히 짧아서 추가적인 cleavages가 유익하지 않은 경우도 있다. 


대부분의 경우에, 사용 가능한 3’ ends를 증가시키는 과정에서 생성되는 이득은 샘플 청소 후 재료 손실로 인해 상쇄되므로, end repair은 불필요하다. 마이크로코칼 뉴클레아제(micrococcal nuclease)와 같이, 3’ end가 차단되거나(blocked) 손상된(damaged) 절단 방법의 경우 end repair가 필요하지만 일반적으로 이러한 방법은 피할 수 있다.

 

 BASIC PROTOCOL 2:  
 dA-TAILING OF DNA MOLECULES BY 
 BY TERMINAL TRANSFERASE

 

DNA 및 RNA 샘플은 시퀀싱을 위해 플로우 셀에 고정된 프라이머에 혼성화되므로 일반적으로 해당 표면에 혼성화할 수 있는 end를 가진 핵산을 생성해야 한다.
플로우 셀 표면에 부착된 타겟 시퀀스는 이론적으로 합성될 수 있는 임의의 시퀀스일 수 있지만, 실제로 상업적으로 이용 가능한 표준 플로우 셀은 oligo(dT)50이다.
관심 있는 핵산 분자에 특정 태그가 있는 경우에는, 다른 시퀀스들이 성공적으로 사용되었다.
현재 수행되고 있는 대부분의 작업은 oligo(dT) 표면을 가지고 하기 때문에, 여기서는 단순화를 위해 논의를 해당 유형의 플로우 셀로 제한한다.


플로우 셀 표면의 oligo(dT)50 프라이머와 호환되려면, 시퀀스되어야 할 분자의 3' 말단에서 최소 50nt의 poly(dA) [또는 poly(rA)] 테일을 생성해야 한다. 
Fill 그리고 lock 단계 (Fig. 7.10.1 참조)는 과잉 A’s를 채우지만 과잉 T’s는 채우지 않기 때문에, A tail이 적어도 표면의 oligo(dT)만큼 긴 것이 바람직하다.
fill-and-lock step의 적절한 충전(filling)이나 플로우 셀 표면과의 물리적 거리와 관련하여 문제가 되기 전에, A-tail이 얼마나 오래 걸릴 수 있는지는 확실하지 않으므로 일반적으로 꼬리를 200nt 미만으로 유지하는 것이 좋다.
Internal Poly(dA) stretch가 있는 분자가 표면 결합된 oligo(dT)50에 혼성화하는 것이 가능하지만, 이 과정은 들어오는 분자의 unbound 3’ end와 그 glass surface 간의 간섭으로 인해 훨씬 ​​느리고 에너지적으로 덜 선호된다. 
안정적으로 혼성화될 만큼 긴 internal A-stretch를 포함하는 천연 시퀀스는 거의 없다.

 

3’ poly(dA) 또는 poly(rA) tail의 생성은 다양한 여러 리가제들 또는 폴리머라제들로 이뤄질 수 있다. 

만일 DNA 또는 RNA에 적절한 리가제 (ligase)와 잘 맞는 3’ end가 있는 경우라면, 원하는 tail (바코드와 같은 다른 관심 시퀀스들로 잠재적으로)를 시퀀스되어야 할 분자 집단에 결찰할 수 있다.
이는 때때로 ligation과 잘 맞는 3’ end를 생성하기 위해, 포스파타제 (phosphatase), 폴리머라제 (polymerase) 또는 end-repair system을 사용하여 DNA 또는 RNA를 전처리 (pretreatment)해야 한다.

더욱이, 대부분의 리가제들은 다른 시퀀스들보다 일부 시퀀스들에서 결찰이 훨씬 더 효율적으로 발생하도록 할 수 있는 실질적인 시퀀스 특이성을 가지고 있다.
길이 의존성 또는 염기-조성 의존성이 있을 수 있지만, 어떤 경우에도 차등 결찰(differential ligation)로 인해 관찰된 시퀀스에 바이어스가 발생할 수 있다.

따라서 poly(dA) tail의 결찰은 때때로 쉽게 달성될 수 있지만, 매우 정량적인 결과가 필요한 응용 분야에는 리가아제의 사용이 권장되지 않는다.

 

DNA 분자의 경우, terminal transferase는 free 3' hydroxyl group으로 가장 바이어스가 없는 분자 테일링을 생성한다.
Terminal transferase는 blunt end에 비해 single=stranded ends를 선호하며, recessed 3' ends에는 아주 부실하게만 꼬리를 달므로, 오목한 말단(recessed ends)이 있는 경우에는, tailing 전에 DNA 중합효소로 채워야 할 수도 있다.

테일링 전에 DNA가 변성되고 급속 냉각(snap cooled)되지만, 샘플의 복잡성과 분자 내 접힘(intramolecular folding)에 따라 일부 테일링 바이어스가 발생할 수 있다.

질량과 평균 길이를 모두 측정할 수 있는 충분한 DNA가 있는 경우, 90~200개 뉴클레오티드 길이의 poly(dA) tails를 생성하기 위해 추가할 dATP의 적절한 양을 결정하는 것이 가능하다. 이 길이의 꼬리를 생성하려면 먼저 샘플에 3’ end가 몇 개 있는지 추정한 다음, DNA, dATP 그리고 terminal transferase의 올바른 비율을 사용하여 꼬리의 최적 크기 범위를 얻어야 한다. 질량과 길이를 결정하기 위한 표본이 부족한 경우, 적절한 길이의 꼬리를 생성하는 데 사용할 수 있는 저-표본 질량 기술(Goren et al., 2010)이 있다.

만일, 시퀀싱 목표인 꼬리를 단 DNA가 tailing 후에 플로우 셀이 직접적으로 혼성화되면, 그것은 마치 surface-bound primer처럼 시퀀싱 반응에서 확장될 수 있는 free 3’ hydroxyl을 가지고 있는 것일 수 있으며, 잠재적으로 시퀀스 결정을 혼란하게 할 수 있다. 


따라서, 시퀀싱 전에, 서열 분석되어야 할 시퀀스의 3’ end를 차단하는 것이 필요하다. 
그 분자를 확장에 적합하지 않게 만드는 어떠한 3’ end 처치라도 사용될 수 있다.
전형적으로, 꼬리 부착 분자들은 terminal transferase와 dideoxynucleotide를 사용하여 차단되지만, 3’ phosphate을 남기거나 또는 확장을 방지하는 기타 변화를 가져오는 어떠한 처치하도 비슷하게 효과적일 수 있다. 

 

 BASIC PROTOCOL 3:  
 DNA SEQUENCING USING
 THE HeliScope GENETIC ANALYSIS SYSTEM

 

Basic principles 

Helicos Single Molecule Sequencing은 동일하거나 다른 샘플에 대해 25개 채널이 있는 유리 플로우 셀에서 수행된다.
시스템은 한 번에 하나 또는 두 개의 플로우 셀을 사용하여 실행할 수 있다. 표준 구성에서 각 채널은 동일하며 약 8μl를 수용한다. 샘플은 일반적으로 플로우 셀 길이에 따라 균일한 혼성화를 보장하기 위해 더 높은 용량(보통 20μl 이상)으로 로드된다.


샘플은 전체 시스템에 포함된 샘플 로더를 통해 플로우 셀에 삽입된다.
각 채널은 개별적으로 주소를 지정할 수 있으며 샘플은 진공을 사용하여 적용된다.
플로우 셀에 대한 혼성화는 일반적으로 55°C에서 1시간 동안 수행된다.
일반적으로 시퀀싱을 위한 샘플은 플로우 셀 표면의 poly(A) tail이 oligo(dT)50 보다 길어지는 방식으로 준비된다.
짝을 이루지 않은 A 잔기의 시퀀싱을 방지하기 위해 샘플 로더 또는 HeliScope 시퀀싱 시스템에서 fill and lock 프로토콜이 수행된다.
혼성화 후 온도를 37℃로 낮추고 DNA 중합효소와 함께 dATP, dCTP, dGTP에 해당하는 dTTP 및 Virtual TerminatorTM 뉴클레오티드 (Bowers et al., 2009)를 첨가한다.


Virtual Terminator nucleotides는 상보적 염기(complementary base) 반대편에 통합되고 뉴클레오티드에 부착된 화학 구조로 인해 추가 통합을 방지한다. 따라서 poly(A) tail에 존재하는 모든 unpaired dAs는 dTTP로 채워진다.
중합효소가 첫 번째 non-A 잔기를 만나 적절한 가상 터미네이터 뉴클레오티드를 삽입하면 혼성화된 분자가 제자리에 고정된다.

 

oligo(dT)50 대신 특정 시퀀스가 있는 플로우 셀을 사용하는 경우, 충전 단계가 생략되고 4개의 가상 터미네이터 뉴클레오티드가 모두 사용되어 각 혼성화된 DNA가 제자리에 고정되고 표지된다.
HeliScope Sequencing System에 아직 로드되지 않은 경우, 플로우 셀이 삽입되고 첫 번째 템플릿 사진이 촬영된다.
이제 모든 DNA 분자에는 염료가 부착되어 있어야 하므로, 이미지에는 뉴클레오티드 통합이 가능한 모든 분자가 포함된다.
또한 라벨은 모든 염기에 해당할 수 있으므로 이 단계에서는 서열 정보를 얻을 수 없다.
이 과정은 일반적으로 80% ~ 90% 효율적이지만, 특히 첫 번째 A가 아닌 염기가 T이거나 첫 번째 염기 바로 뒤에 As가 있는 경우 DNA 분자의 작은 부분이 하나의 염기만큼 부족하거나 과도하게 채워진다. 따라서 대부분의 분자에서 시퀀싱은 원래 분자의 두 번째 염기부터 시작된다.


Sequencing

Hybridized DNAs의 서열을 분석하기 위해서는 먼저 가상 터미네이터 뉴클레오티드에 존재하는 형광 염료 및 터미네이터 부분을 절단해야 한다.
현행 뉴클레오티드의 생성은 신속하고 완전하게 절단될 수 있는 이황화물 결합(disulfide linkage)으로 합성된다.
절단 후 분리된 형광 염료는 세척되어 제거되고 새로운 중합효소와 단일 형광 뉴클레오티드가 추가된다.
시스템 레이저에 의해 형광 부분이 여기된 후, 또 다른 이미지가 촬영되고 표준 시퀀싱 실행에서 이 순환 프로세스가 120회 반복된다.
시퀀싱 사이클 수는 사용자가 조정할 수 있으며, run time 및 리드 길이에 대한 사용자 요구에 따라 수정될 수 있다.

 

표준 실행 중에는, 2개의 25채널 플로우 셀이 사용되며, 각 플로우 셀은 화학 사이클 (이전 사이클의 염료/터미네이터 절단, 헹굼, 다음 염기 통합, 헹굼)와 이미징 주기를 번갈아 가며 사용한다.

이미징 프로세스 동안 4개의 레이저는 공초점 현미경(confocal microscope)을 통해 4개의 CCD 카메라로 촬영한 사진과 함께 채널당 1100 시야각(FOV, Fields of View)을 비춘다 (Figure 7.10.2 참조).

단일 분자가 시각화되더라도, 각 분자에 대해 복수의 여러 광자 방출들이 등록되며, 각 FOV에서 소요되는 시간은 특정 뉴클레오티드의 염료 휘도(brightness)와 카메라 속도(camera speed) 및 감지 효율성(detection efficiency)에 따라 달라진다.
현재, 이미징 프로세스는 rate-determining step이며, 채널당 FOV 수를 줄이면 처리량을 희생하여 실행 시간을 줄일 수 있다. 마찬가지로, 카메라 기술이 향상되거나 염료가 개선되면, 각 이미지에 소요되는 시간이 줄어들어 실행 시간이 단축될 수 있다. 스펙트럼의 반대쪽 끝에서는 채널당 최대 2200 FOV가 가능하므로 출력 증가가 가능하지만 실행 시간이 늘어나는 대가가 따른다.

 

 

댓글