본문 바로가기
Coffee Genetics

Illumina Sequencing Technology - 2세대 DNA 시퀀싱

by mjcafe 2024. 7. 11.

 

2006년에 Illumina라는 회사는 동시에 많은 수의 DNA 가닥을 동시에 서열 분석할 수 있는 DNA 서열 분석의 획기적인 발전을 발표했다. 이러한 빠른 속도 덕분에 전체 인간 게놈의 서열을 하루도 채 안 되는 시간에 분석할 수 있었다. 이 방법은 체인 종결(chain termination)에 의존하지 않는다는 점에서 이전 시퀀싱 방법과 다르다.  대신, 이 새로운 방법에서는 복제 DNA 가닥 (replicating DNA strand)에 새로운 염기가 추가될 때마다 해당 형광 신호가 방출되어 실시간으로 감지된다. 


NGS (Next-Generation Sequencing)에서는 많은 DNA 가닥이 세포에서 제거되어 더 작은 조각으로 잘린다. 그런 다음 이러한 단편을 반응 혼합물이 포함된 플로우 셀이라는 플레이트에 배치하여 시퀀싱을 위한 준비가 완료된다. 시퀀서는 여러 가지 화학 반응을 수행하고 새로운 염기가 추가될 때마다 플로우 셀에서 방출되는 형광색을 식별하여 DNA 염기 서열을 읽는다. 이러한 신호는 소프트웨어로 해석되어 원본 DNA 서열의 디지털 사본을 구축할 수 있다. 이제 과학자들은 이 데이터를 사용하여 암과 같은 질병을 일으킬 수 있는 유전자의 변화를 찾을 수 있다.

 

 

 

 

 Illumina Sequencing

 

Illumina reversible-terminator sequencing은

더 짧은 리드(35-150b)에도 불구하고 훨씬 더 큰 게놈 범위를 생성한다 (Bentley, 2006).

이 절차에는 

분무(nebulization)에 의한 무작위 dsDNA 단편 생성,

두 개의 특수 'Y' 어댑터를 끝 부분에 결찰 (ligation),

고체 지지체(solid support)에 부착된 프라이머와의 혼성화 등이 포함된다.

고정된 DNA는 확장되고 생성된 dsDNA는 추가로 변성되며, 

이후 고체 지지체에 부착된 프라이머와의 혼성화를 거친다.
추가 확장은 PCR 증폭 DNA 클러스터를 생성한다.
포획된 ssDNA 클러스터들은 가역적 터미네이터가 있는 형광 뉴클레오티드(fluorescent nucleotides)를 사용하여

가역적 터미네이터 서열 분석(reversible-terminator sequencing)을 거친다.

DNA 폴리머라제에 의한 확장은 플로우 셀의 수억 개의 병렬 반응에서 감지되는 빛 방출을 생성한다.
마지막으로, 생물정보학 도구를 사용하여 리드들을 콘티그로 조립하고 이를 염색체와 게놈으로 조립한다 (Figure 4).

Illumina의 reversible-terminator sequencing 접근 방식은 resequencing에 특히 유용하다.
또한 상대적으로 저렴한 비용으로 높은 적용 범위(예: 30×)로 인해 새로운 시퀀싱에도 사용할 수 있다. 

때로는 앞서 설명한 Roche 454 Life Sciences와 같은 다른 2세대 방법론의 보완 기술로 하이브리드 어셈블리를 생산하는 경우도 있다.
리드 길이를 늘리고 추가 생물정보학 어셈블리를 최적화하는 최신 개발로 인해 이 기술은 일부 게놈 프로젝트에서 선택되는 시퀀싱 플랫폼이 되었다.

 

 

 

 Illumina Sequencing Technology : Overview

 

 

1. 게놈 DNA 샘플을 준비한다.
    게놈 DNA를 무작위로 단편화하고, 그 단편들의 양쪽 끝에 어댑터들이 붙는다(결찰한다).

2. DNA를 표면에 붙인다. 
    싱글 가닥 단편들이 플로우 셀 채널의 내부 표면에 무작위로 결합한다 (bind).

3. Bridge Amplification

    표지 되지 않은 뉴클레오티드들을 더해주고, 고체 상태의 브릿지 증폭을 시작하도록 효소를 추가한다. 

 

 

4. 단편들이 이중 가닥이 됨. 

    효소가 뉴클레오티드들을 혼입시켜 고체 상태 기판 위에서 이중 가닥 브릿지를 만들게 한다. 
5. 이중 가닥 분자들의 변성

    변성 결과로 싱글 가닥의 템플릿들이 그 기판에 부착 된다 (anchored). 
6. 증폭의 완료

    수백만개의 조밀한 이중 가닥 DNA의 클러스터들이 플로우 셀의 각 채널에서 생성된다. 

 


7. 첫번째 염기의 결정

    4개의 표지된 가역적 터미네이터들과, 프라이머들, 그리고 DNA 중합효소들을 더해주어,

    첫번째 시퀀싱 사이클이 시작된다. 
8. 첫번째 염기의 이미지화
    레이저 勵起 후에, 각 클러스터로부터 발생된 형광물질이 포착되고, 첫번째 염기가 결정된다. 
9. 두번째 염기의 결정

    그 다음 사이클이 4가지 표지된 가역적 터미네이터들, 프라이머들, 그리고 DNA 중합효소들의 통합을 반복한다. 

 

 

10. 두번째 화학 사이클의 이미지화

      레이저 勵起 후, 앞서처럼 이미지가 캡처되고, 그 두번째 염기의 정체가 기록된다. 
11. 복수의 화학 사이클에 걸친 시퀀싱

      시퀀싱 사이클들이 반복되어 한 번에 한 염기 씩, 단편에 있는 염기의 서열을 결정한다. 
12. 데이터 정렬. 

      데이터가 정렬되고, 레퍼런스와 비교되며, 시퀀싱 차이들이 식별된다. 

 

 Illumina Sequencing Platforms

 

 

 

 Illumina Sequencing Technology : Steps

 

Illumina 시퀀싱은 한번에 단 하나의 dNTP type만 더해질 수 있다는 pyrosequencing method의 주요 단점을 해결했다. 

Illumina 시퀀싱은 수백만 개의 DNA 단편을 병렬로 시퀀싱하는데 사용되는 합성 방법이다. 표준 Illumina 프로토콜의 경우 DNA 샘플을 단편화(fragmenting), 정제(purifying) 및 증폭(amplifying)하여 라이브러리를 준비한다. 그런 다음 각 단편의 시퀀스를 동시에 결정하고 'normal reference' 게놈에 대해 컴퓨터로 정렬한다.

표준 Illumina 시퀀싱은 다음 단계로 나눌 수 있다.

(1) DNA fragmentation 단편화

(2) 프라이머 결합 부위 및 캡처 시퀀스의 추가

(3) DNA denaturation (변성)

(4) DNA immobilization (고정)

(5) DNA amplification (증폭)

(6) DNA sequencing

처음 세 단계는 일반적으로 라이브러리 준비 (library preparation)라고 하며, DNA 샘플을 Illumina 시퀀싱 기계에서 처리할 수 있는 단편 라이브러리 (library of fragments)로 변환한다. 처리량이 적은 실험실에서는 이러한 단계를 수작업으로 수행하거나 라이브러리 준비를 위해 소형 자동화 벤치탑 장치 (small automated benchtop device)를 사용할 수 있는 반면, 처리량이 많은 실험실에서는 일반적으로 대형 액체 취급 로봇 (large liquid handling robots)을 사용한다.

1단계: 먼저 물리적 또는 효소적 단편화 방법을 사용하여 DNA 샘플을 작은 조각으로 단편화해야 한다.

2단계: 그런 다음 DNA 서열을 양쪽 끝의 어댑터 서열(adapter sequences)로 늘려야 한다 (elongation). 

안쪽의 어댑터 시퀀스(inner adapter sequences)는 나중에 시퀀싱 반응에 사용되는 프라이머 결합 부위(primer binding sites)이고 바깥쪽의 어댑터 시퀀스(outer adapter sequences)는 고정화 단계(immobilization step)에 필요한 캡처 시퀀스(capture sequences)이다.

어댑터 시퀀스는 효소 반응을 사용하여 추가되므로 (시약, 어댑터 시퀀스 및 효소가 과잉으로 추가된다), 사용되지 않은 반응 성분들로부터 DNA 단편들을 분리하려면 후속 정제 단계 (purification steps)가 필요하다.

 

3단계: 어댑터 시퀀스들을 샘플에 더해주었으면, 그 시퀀스들을 변성시켜 두 가닥을 서로 분리한다.

4단계: 그런 다음 샘플을 Illumina 플로우 셀(flow cell)에 추가한다. 

플로우 셀에는 DNA 샘플에 부착된 캡처 시퀀스들에 상보적인 짧은 DNA 시퀀스 (oligonucleotides 또는 oligos)이 미리 지정(고정)되어 있으며 (pre-spotted), 결과적으로 샘플 시퀀스와 결합한다 (bind). 즉, 어댑터가 붙어 있는 단편들을 플로우 셀에 고루 퍼지게 하면, 각 단편들은 여기저기에 달라붙게 된다. 


샘플 시퀀스가 ​​플로우 셀에 연결되면 단일 PCR 사이클을 수행하여 그것들을 복사할 수 있다 . 이 단계 후, 그 시퀀스들을 변성시키고 샘플 DNA 가닥을 씻어내어 (wash out), 새로 합성된 가닥들이 ​​플로우 셀에 고정되도록 한다. 

 

5단계: 이러한 고정된 서열(immobilized sequences)은 DNA 시퀀싱 전에 증폭되어야 하며, 이 단계는 클러스터 생성 (cluster generation)이라고도 한다. 

이렇게 하려면, 여러 PCR 사이클을 수행한다.

플로우 셀 상의 캡처 시퀀스들(capture sequences)는 프라이머로 사용된다.

이는 고정된 시퀀스들은 어닐링 단계 (annealing phase) 동안 그것들을 어닐링하는 브리지(bridge)를 형성한다는 것을 의미한다.

확장 단계 (extension phase)에서는 브리지가 복사되고,

변성 단계(denaturation phase)에서는 두 시퀀스들이 ​​서로 분리된다.

한 클러스터에 각 시퀀스의 복사본이 약 1,000개 있으면, 프라이머 중 하나를 잘라서 정방향 또는 역방향 가닥만 남도록 한다.

 

6단계: 이제 시퀀스 프로세스를 시작할 수 있다. 

프라이머 결합 부위 어댑터 (primer binding site adapter)에 상보적인 시퀀싱 프라이머 (sequencing primer)를 플로우 셀에 추가한다.

이후의 시퀀싱 프로세스는 Sanger 시퀀싱과 유사하다. 중합효소는 템플릿 가닥(template strand)을 복사하여 첫 번째 염기를 첨가한다. 이 염기에는 하이드록실기(hydroxyl group)가 없기 때문에 반응이 멈추고, 어떤 염기가 추가되었는지 확인하기 위해 녹색, 검정색, 파란색, 빨간색의 4개 이미지를 촬영할 시간이 제공된다.

그러나 Sanger 시퀀싱과 달리 누락된 하이드록실기(hydroxyl group)는 이후에 화학 물질을 사용하여 재생될 수 있다. 이러한 화학 물질은 또한 통합된 염기로부터 형광 염료를 제거한다. 하이드록실기가 재생되자마자 중합효소는 다음 염기를 추가하고, 그리고 다음 이미징 및 하이드록실기 재생 단계가 일어날 수 있다. 

 

 

 Illumina Sequencing : Flow Cell

Illumina sequencing에서 사용되는 핵심 부품 중 하나가 플로우 셀이다. 플로우 셀은 두가지 타입이 있다.

 

일루미나의 플로우 셀들

 

 Illumina Sequencing : Bridge Amplification

Illumina sequencing은 브릿지 증폭이라는 테크닉에 기반하는데, DNA 분자들이 상보적 올리고 뉴클레이티드들을 함유하고 있는 글래스 플로우 셀에서 복제된다. 

  • Step #1: 글래스 플로우 셀이 두 가지 타입의 올리고 뉴클레오티드들로 코팅되어 있다. 
  • Step #2: DNA가 단편화되고, 어댑터들이 그 가닥의 각 끝에 붙는다.
                 이 어댑터들은 플로우 셀의 올리고 뉴클레오티드들의 하나와 상보적이다. 
  • Step #3: DNA 단편들이 플로우셀에 더해지고,
                 플로우셀 표면에 있는 올리고뉴클레오티드들 중 하나와 합체한다. 
  • Step #4: DNA 중합효소가 그 가닥을 따라 움직이고 그것을 복제한다. 
  • Step #5: 이중 가닥의 단편이 변성되어 오리지널 가닥은 씻겨 나간다. 
  • Stpe #6: 새로운 남아 있는 가닥이 구부러져서,
                 그 어댑터가 플로우 셀 표면에 있는 두번째 타입의 올리고뉴클레오티드에 붙는다. 
  • Step #7: DNA 중합효소가 이 단편을 복제하여 이중 가닥의 브릿지를 형성한다. 
  • Step #8: 그 브릿지가 변성되어, 플로우 셀에 정착된 DNA의 싱글 가닥 복사본 2개로 만든다.
  • Step #9: 이 과정이 원하는 양의 DNA에 달할 때까지 반복된다. 

 

 

 Illumina Reversible-Terminator sequencing

 

전통적인 Sanger method는 디데옥시뉴클레오티드 (dideoxynucleotide)를 사용하여 불가역적으로 프라이머 확장을 종결시키는 대신, Illumina reversible-terminator sequencing은 변형된 뉴클레이티드들이 가역적 종결 (reversible termination)에 사용된다는 점에서 생어 시퀀싱 방법과 다르다.

 
많은 다른 테크닉들은 DNA library fragments를 증폭시키기 위해 emulsion PCR을 사용하는 반면,

reversible termination은 bridge PCR를 사용하여, 프로세스의 이 단계의 효율성을 향상시킨다. 

지난 10년 동안의 개발로 인해 여러 가지 리버서블 터미네이터가 생산되었다. 가역적 차단 기 (reversible blocking groups)의 차이에 따라 Reversible terminators는 2가지 유형으로 분류될 수 있다 : 

    ■ 3'-O-blocked reversible terminators

    ■ 3’-unblocked reversible terminators.

 

 

한 가지 유형은 3’-O-blocked reversible terminators이다. 위의 그림 <Figure 1B>에 표시된 대로 blocking group –OR [reversible terminating (capping) group]은 오탄당(pentose)의 3’-OH의 산소 원자에 연결되어 있는 반면, 형광 표지는 염기에 연결되어 있는데, 이는 리포터 역할을 하고, 쪼개질 수 있다. 

다른 유형은 위의 그림 <Figure 1C>에 표시된 대로 3’-unblocked reversible terminators이다.

이 경우에는, reversible termination group가 염기 뿐만 아니라 형광기(florescence group)에도 연결되는데, 이는 리포터일 뿐만 아니라 프라이머 연장의 종결을 위한 가역적 종결기(reversible terminating group)의 일부로서 기능도 한다. 

Reversible terminators의 이러한 두 가지 유형들은 장점과 단점이 있다:

3’-O blocked reversible terminator에는 3’ reversible blocking group이 포함되어 있어, 더 나은 종료 효과를 제공할 것이다. 반면에 3’-unblocked reversible terminator는 3’-OH에서 변형된 부분이 없기 때문에 DNA 중합효소에 의해 더 쉽게 받아들여진다.

첫 번째 유형의 경우, 3'-OH에 blocking group이 있는 시중에서 판매되는 reversible terminators가 3개 있다 (위의 그림 Figure 2A-C에 표시된 구조) :

⊙ FfAME (Foundation for Applied Molecular Evolution)의 Steven A. Benner 박사와 동료들이 개발한
    3'-ONH2 reversible terminator;

콜롬비아 대학교의 Jingyue Ju와 그의 동료들이 개발한 3'-O-allyl reversible terminator;

Illumina Solexa가 개발하여 사용하는 3'-O-azidomethy reversible terminator이다.

세 가지 상용 reversible terminators 모두 가역적 종결 기능에서 우수한 성능을 보이는 것으로 보고되었다. 즉, 거의 100%에 가까운 3'-O blocking efficiency와 프라이머 확장 종결 후 florescent label group cleavage를  달성한다.

두 번째 유형의 경우 지금까지 ‘‘virtual terminator’’라는 이름의 상업용 3’-OH unblocked reversible terminator 하나만 있는데, 이는 Helicos BioSciences Corporation (그림 2D)에서 개발하고, 등장하고 있는 3세대 DNA 시퀀싱 플랫폼에서 시장에 나오는 최초의 “single molecule” 시퀀서에서 채택된 것이다. 
또한 최근 Michael L. Metzker 그룹이 개발한 “Lightning terminator”도 3'-OH unblocked reversible terminator (Figure 2E의 하단 패널)에 속하며, UV 광을 사용하여 형광 기를 절단한다는 점에서 독특하다.

 

 

3'-O-blocked reversible terminators

 

이 메커니즘은 프라이머를 단계적인 방식으로 신장시키는(elongating) sequencing by synthesis approach를 사용한다. 
먼저, 시퀀싱 프라이머들과 템플릿들이 고체 지지체(solid support)에 고정된다. 
이 지지체는 3’-O-azidomethyl group에 더하여 붙어있는 서로 다른 형광물질을 가지고 있는 4가지 DNA bases 각각에 노출된다. 【 3’-O-azidomethyl-dNTPs (3’-N3-dNTPs) 】

 

 

정확한 base만이 그 타겟에 어닐하고(anneals), 이어서 그 프라이머에 결찰된다 (ligated). 
그런 다음 그 고체 지지체(solid support)는 imaged되고, 통합되지 않은 뉴클레이티드들은 씻겨 나가며, 

형광물질의 브랜치는 TCEP (tris(2-carboxyethyl)phosphine)를 사용하여 쪼개진다 (cleaved). 
TCEP는 또한 3’-O-azidomethyl group를 제거하며, 3’-OH를 다시 생성하고, 사이클이 반복될 수 있다.

   (아래 그림 Figure 2). 

 

 

3’-unblocked reversible terminators

3'-unblocked reversible terminators의 가역적 종결 기(reversible termination group)는 염기 및 형광 그룹 모두에 연결되어 있으며, 이는 이제 종결 그룹의 일부이자 리포터 역할을 한다. 

이 방법은 세 가지 측면에서 앞서 언급한 3'-O blocked reversible terminators 방법과 다르다. 

첫째, 3’-position이 차단되지 않는다 (즉, 염기에 free 3'-OH가 있음).;

둘째, 형광단 (fluorophore)은 네 가지 염기 모두에 대해 동일하다;

셋째, 각각의 변형된 염기는 동시에 유입되기보다는 순차적으로 유입된다.

이러한 기술의 가장 큰 단점은 두 가지 현상 중 하나로 인해 발생할 수 있는 리드 길이가 길지 않다는 것이다. 어느 한 단계에서 두 개의 뉴클레오티드가 통합되는 것을 방지하기 위해, 블록이 제자리에 배치되지만, 합성 불량(poor synthesis)으로 인해 블록을 추가하지 못하는 경우, 가닥들(strands)이 이 위상이 어긋나 노이즈가 발생하여 리드  길이를 제한할 수 있다. 형광단이 성공적으로 부착되거나 제거되지 않은 경우에도 노이즈가 발생할 수 있다. 
이러한 문제는 다른 시퀀싱 방법에서 흔히 발생하며 리드 길이를 제한하는 주요 요인이다.

이 기술은 Illumina가 HiSeq 및 MiSeq 플랫폼을 통해 개척했다. 
HiSeq은 백만 염기당 0.02달러의 비용으로 2세대 시퀀서 중 가장 저렴하다. 
또한 실행당 600Gb의 높은 데이터 출력을 제공하며 완료하는 데 약 8일이 걸린다.

 

 

댓글