본문 바로가기
Coffee Genetics

Ion Semiconductor Sequencing

by mjcafe 2024. 7. 15.

 

아이온 반도체 시퀀싱 (Ion semiconductor sequencing)은 MPS에 대한 대체 접근 방식이며 중합 (polymerization) 또는 새로운 DNA 가닥의 합성 (synthesis of new DNA strands) 중에 방출되는 수소 이온의 검출(detection of hydrogen ions released)에 의존한다 (Rothberg et al., 2011; Merriman et al., 2012). 

이 방법은 또한 주형 가닥의 서열(sequence of a template strand)을 사용하여 만들어진 상보적 가닥 (complementary strand)을 포함한다. ePCR 후, 클론 증폭된 주형 DNA가 포함된 비드는 수백만 개의 마이크로웰이 포함된 칩 위에서 세척된다. 


각 마이크로웰에는 하나의 비드만 들어갈 수 있다. 

주형 DNA가 들어 있는 마이크로웰에는 단일 유형의 deoxyribonucleotide triphosphate (dNTP, dATP, dTTP, dCTP 또는 dGTP)이 가득 차 있다. 

마이크로웰에 존재하는 dNTP가 주형 가닥의 선두 뉴클레오티드에 상보적인 경우, dNTP는 성장하는 상보 가닥에 통합된다. dNTP가 성공적으로 통합되면 수소 이온이 방출되어 장비의 ISFET (ion-sensitive field-effect transistor, 이온 감지 전계 효과 트랜지스터) 센서를 트리거하는 pH 변화가 발생한다. 이온 방출과 그에 따른 pH 변화의 감지는 반응이 발생했다는 신호이다. 

CMOS (complementary metal-oxide-semiconductor 상보성 금속 산화물 반도체) 시퀀싱 칩은 여러 층으로 구성된다. 

마이크로웰 층 아래에는 이온에 민감한 층이 있으며, 그 아래에는 개별 반응을 감지하는 ISFET 이온 센서가 있다. 
주형 시퀀스가 호모폴리머 스트레치(즉, 다중 반복 뉴클레오티드)와 함께 제공되는 경우, 다중 dNTP 분자(호모폴리머 스트레치의 반복 수와 일치)가 단일 사이클 동안 통합됩니다. 

 

결과적으로, 상응하는 수의 수소 이온이 방출되어 기기에 의해 감지되는 비례적인 전자 신호가 발생한다. 
부착되지 않은 dNTP 분자는 다음 사이클 (즉, 다른 dNTP 유형이 도입되는 경우) 이전에 세척된다. 
이 과정은 전체 DNA 주형의 서열이 결정될 때까지 반복된다. 

아이온 반도체 시퀀싱 기술은 변형된 뉴클레오티드(즉, reversible terminator sequences) 또는 광학(형광)을 사용하지 않는다는 점에서 다른 SBS 기술과 다르다 (Rothberg et al., 2011; Merriman et al., 2012). 

 

아이온 반도체 시퀀싱은 일반적으로

📌Ion Torrent sequencing,

📌pH-mediated sequencing,

📌silicon sequencing, 또는  

📌semiconductor sequencing이라고 하며

현재 Thermo Fisher Scientific社에서 제조하고 있다.

 

 

 

이온 반도체 시퀀싱(Ion semiconductor sequencing)의 주요 이점은 빠른 시퀀싱 속도(형광 기반 SBS 시스템과 비교)와 낮은 초기 비용 및 운영 비용이다.
또한 이 기술은 천연 중합효소 매개 뉴클레오티드 통합 이벤트를 기록하여 실시간으로 서열 분석이 발생하고 감지될 수 있도록 한다 (Rothberg et al., 2011).
이온 반도체 시퀀싱 속도는 주로 시스템을 통한 기질 뉴클레오티드(A, T, C 및 G)의 순환에 의해 제한된다.
이온 반도체 시퀀싱 기술 제조업체는 각 통합 이벤트가 4초가 소요되는 반면, 각 시퀀싱 실행은 100~200개의 뉴클레오티드가 시퀀싱 되는 동안 1시간 내에 완료될 수 있다고 주장했다.
반도체 칩과 전체 SBS 화학이 개선됨에 따라 칩당(따라서 실행당) 리드 수가 계속 증가할 가능성이 높다.

이러한 시퀀싱 접근 방식에는 잘 문서화된 몇 가지 제한 사항이 있다 (Rothberg et al., 2011; Seo et al., 2013; Feng et al., 2016).
동일한 뉴클레오티드(예: AAAAAAAA)의 단일 중합체 반복(homopolymer repeats)이 주형 가닥에 존재하는 경우, 결과로 생성된 상보 가닥은 여러 개의 동일한(상보적) 뉴클레오티드를 포함하고 단일 주기 동안 비례적인 수의 수소 이온이 방출된다. 이로 인해 pH 변화가 더 커지고 이에 비례하여 전자 신호도 더 커진다. 그러나 각 순차적 반복 뉴클레오티드 통합으로 인해 신호의 일정 비율이 손실될 수 있는 긴 반복을 열거하는 것이 어려워질 수 있다. 즉, 감지된 pH 변화는 반응당 방출되는 수소 이온 수에 대해 1:1 비율로 확실하게 변환되지 않는다.

반도체 시퀀싱에만 국한되는 것은 아니지만(즉, 이 현상은 파이로시퀀싱에서도 관찰될 수 있음), 단독 중합체 스트레치(즉, 높은 수로 반복되는 뉴클레오티드)에서 생성된 신호는, 유사하지만 다른 수의 반복(예: , 7개 뉴클레오티드의 단일중합체 반복은 8개 뉴클레오티드의 단일중합체 반복)과 구별하기 어렵다 (Rothberg et al., 2011; Seo et al., 2013; Feng et al., 2016).

이온 반도체 시퀀싱 기술의 또 다른 한계는 다른 시퀀싱 방법(예: Sanger 시퀀싱 또는 파이로시퀀싱)에 비해 리드 길이가 짧다는 것(리드당 ~   400 뉴클레오티드)이다.

 

아이온 토렌트 시퀀싱 프로세스

 

 

 

 

Life Technologies Ion Torrent Chip Sequencing은 핵산의 중합 반응 (polymerization reactions)에서 생성된 양성자의 검출 (detection of the protons)을 기반으로 한다 (Rothberg et al., 2011).

따라서 ion-torrent 장비는 실제로 실리콘 칩에 내장된 가장 작은 pH-meter이다. 

즉, dsDNA는 분무화(nebulization)에 의해 무작위로 단편화되고, 특수 어댑터들이 끝 부분에 결찰되며, 그 중 하나는 5’ end 부분에 비오틴을 함유한다.

Streptavidin-coated beads는 비오틴으로 표지된 dsDNA를 캡처하는 데 사용되며, 이 dsDNA는 변성되어(denatured) 비오틴화 되지 않은 ssDNA를 분리할 수 있다.

그런 다음 primer-coated beads를 사용하여 비드 당 ssDNA 분자 하나를 캡처하고, emPCR 증폭이 비오티닐화된 프라이머 (biotinylated primers)를 사용하여 수행되어, 원래 ssDNA 분자의 약 백만 개의 클론 복사본을 생성한다.

dsDNA는 변성되고, ssDNA가 부착된 비드는 회수되어 피코웰(picowells)에 포획된다.
DNA 중합효소(polymerase)에 의한 일대일 dNTP 플러시 확장(one-by-one dNTP-flush extension)은 고체 반도체 칩 pH-meter로 작동하는 펨토웰(femtowells)에서 수백만 개의 병렬 반응에서 감지되는 양성자를 생성한다.

그런 다음 판독 값들은 생물정보학 도구를 통해 콘티그와 게놈으로 조립된다 (Figure 6).

 

 

 

DNA 시퀀싱과 최근에는 대규모 병렬 DNA 시퀀싱 (massively parallel DNA sequencing) [1-4]이 연구와 의학에 지대한 영향을 미쳤다. DNA 서열 생성을 위한 비용과 시간의 감소로 인해 암 [5,6], 인간 유전학 [7], 전염병 [8] 및 개인 게놈 연구 [9-11]에서 다양한 새로운 서열 분석 응용이 가능해졌다. 생태학 [12,13]과 고대 DNA 연구 [14,15]와 같은 다양한 분야에서도 마찬가지이다.

de novo sequencing 비용이 크게 감소했지만 반도체 업계의 무어의 법칙 [16]에 따라 기하급수적인 속도로 시퀀싱 비용을 계속 낮추고 더 저렴하고 빠르며 휴대성이 뛰어난 장치를 제공하려는 바람이 있다. 이는 $1,000 게놈에 도달하려는 욕구에 의해 조작되었다 [17].

현재까지 DNA 시퀀싱은 이미징 기술, 전자기 중간체 (X선 [18], 또는 빛 [19]) 및 특수 뉴클레오티드 또는 기타 시약 [20]에 대한 필요로 인하여 한계가 있었다. 이러한 한계를 극복하고 실천을 더욱 민주화하기 위해 시퀀싱은 새로 개발된 집적회로에 대한 비광학 시퀀싱을 기반으로 한 패러다임 전환을 추구했다. 확장성과 저전력 요구 사항으로 인해 CMOS 공정은 현대 집적 회로 제조에서 지배적이다 [21]. 컴퓨터, 디지털 카메라 및 휴대폰의 유비쿼터스 특성은 CMOS 집적 회로의 저렴한 생산을 통해 가능해졌다.

 

이미징 분야의 발전을 활용하여 - 광 이미징(photonic imaging)을 위한 대규모의 빠른 어레이를 생산 [22] - 우리는 광자(photons) 감지용으로 설계된 센서와 다르게, 합성에 의한 시퀀싱 (sequencing by synthesis) 중에 DNA 중합효소에 의해 방출되는 수소 이온을 감지하기 위한 집적 회로 구성을 위한 적합한 전자 센서를 찾아왔다. 

전기화학적 검출 방법이 연구되었지만 [24,25], 이온 감응형 전계 효과 트랜지스터 (ion-sensitive field-effect  transistor,  ISFET) [26,27]가 수소 이온에 대한 민감성과 CMOS 프로세스 [28-31]와의 호환성으로 인해 우리의 화학 및 스케일링 요구 사항에 가장 적합했다. Single-nucleotide polymorphisms (SNPs) [32]와 DNA synthesis [33] 모두를 검출하려는 시도들 뿐만 아니라 DNA를 전자적으로 시퀀스하려는 시도들[34]도 이뤄져 왔다. 

그러나 이들 중 어느 것도 새로운 DNA 서열(de novo DNA sequence)을 생성하지 못했으며, 주형 DNA를 센서에 전달하는 문제를 해결하거나 대규모 어레이로 확장하지도 못했다. 또한 ISFET에서의 선행 노력은 어레이당 센서 수, 독립적인 센서 작동 수율 및 판독 속도[35,36]에서 제한되었으며, 전자 장치를 보호하면서 센서를 유체에 노출시키는 데 어려움을 겪었다 [37].

여기서 우리는 전자적 검출 (electronic detection)의 이전 한계를 극복하고, 빠르고 균일하며 작동하는 다수의 센서를 가진 칩 생산을 가능하게 한다. 우리는 수백만에서 수십억 개의 염기가 필요한 응용 분야에 대해 새로운 DNA 시퀀싱을 가능하게 하는 데 필요한 장비 및 소프트웨어를 지원하는 생화학적 방법 뿐만 아니라 이러한 이온 칩의 개발에 중점을 두었다 (Supplementary Fig. 1).

120만 개의 센서가 있는 이온 칩을 사용하여 일반적인 2시간 실행하면 약 2,500만 개의 염기가 생성된다. 이온 칩과 전체 시퀀싱 플랫폼의 성능은 세 가지 박테리아 게놈의 전체 게놈 시퀀싱(whole-genome sequencing)을 통해 입증된다.

우리 칩 아키텍처의 확장성은 최대 10배의 센서 수를 갖춘 칩을 생산하고 무어의 법칙의 저자인 고든 무어 (Gordon Moore) 게놈의 낮은 적용 범위 시퀀스(low-coverage sequence)를 생성함으로써 입증된다 [16].

 

 

 

 

 A CMOS integrated circuit for sequencing


우리는 최신 CMOS 이미저에서 흔히 사용되는 전자 어드레싱을 사용하여 간단하고 확장 가능한 ISFET 센서 아키텍처를 개발했다 (Supplementary Fig. 2).

우리의 집적 회로는

각각 기본 ISFET에 연결된 싱글 플로팅 게이트가 있는 다양한 센서 요소 어레이 (large array of sensor elements)로 구성된다 (Figure 1a).

시퀀스를 가두기 위해(for sequence confinement), 

우리는 전자 장치 위에 3mm 두께의 誘電體 층(dielectric layer)을 추가하고 센서 플레이트에 에칭(etching )하여 형성된 3.5mm 직경의 웰을 사용한다 (Fig. 1b).
탄탈륨 산화물 층(tantalum oxide layer)이 양성자 감도(proton sensitivity) (58mvpH21; ref. 38)를 제공한다.


고속 어드레싱 및 판독은 센서 어레이와 통합된 반도체 전자 장치를 통해 수행된다 (Fig. 1c).

 

센서와 기본 전자 장치는 통합 이벤트(incorporation event)에서 전자 신호로의 직접적인 변환을 제공한다.
광 기반 시퀀싱 기술과 달리, 우리는 광자를 수집하고 염기의 통합을 검출하기 위해 더 큰 이미지를 형성하는데 어레이의 요소들을 사용하지 않는다. 대신 우리는 각 센서를 사용하여 뉴클레오티드 통합 중에 방출되는 수소 이온을 독립적으로 직접 모니터링한다.

 

 

이온 칩은 웨이퍼(Fig. 2a)에서 제조되고 개별 금형(die)로 절단되며 (Fig. 2b), 센서 어레이 위의 영역들로, 그리고 편리한 샘플 로딩을 제공하는 서포팅 전자장치 뿐만 아니라, 시퀀싱 장비로의 전자적 그리고 유체적 인터페이스들로부터, 유체들을 분리(isolate)하는 일회용 폴리카보네이트 플로우셀(polycarbonate flow cell)로 로봇 방식으로 포장된다 (Fig. 2c).

 


칩은 1.5M, 7.2M 및 13M ISFET로 설계 및 제작되었다 (Supplementary Fig. 3).
센서 어레이의 플로우 셀 배치를 기반으로 1.2M, 6.1M 및 11M 웰과 센서가 유체에 노출되며, 센서의 99.9%가 pH에 민감하고 DNA 시퀀싱에 사용할 수 있다 (Supplementary Fig. 4).
칩당 센서 수를 늘리는 방법은 먼저 금형(die) 면적을 10.6mm × 310.9mm에서 17.5mm × 317.5mm로 늘린 다음, 센서당 트랜지스터 수를 3개에서 2개로 줄여 센서 밀도를 높이는 방식으로 이루어졌다.
칩 밀도는 CMOS 노드 (node) 선택과 감지 요소당 트랜지스터(transistors) 수에 따라 제한된다.
0.35mm CMOS 노드를 사용하면 3개 트랜지스터 센서의 최소 간격은 5.1mm이고, 2개 트랜지스터 센서의 경우 3.8mm이다 (Supplementary Fig. 5).
밀도에 대한 한계를 더 이해하기 위해 1.3mm 웰이 쉽게 제조되고, 센서에 정렬될 수 있으며, 고품질 시퀀스 생성이 가능하고(Supplementary Fig. 6), 그리고 110nm 노드를 사용하여 1.68 mm만큼 작은 간격을 두고 제작될 수 있음을 보여준다 (Supplementary Fig. 7).

 

 

 Sequencing on a semiconductor device

 

이온 칩이 사용하는 전자 감지 시스템 (all-electronic detection system)은 시퀀싱 장비를 단순화하고 원가를 크게 줄인다 (Supplementary Fig. 8).

이 기기에는 광학 구성 요소가 없으며 주로 칩과 ​​인터페이스하는 전자 리더 보드, 신호 처리용 마이크로프로세서 및 칩 위의 시약 흐름을 제어하는 ​​유체 시스템 (fluidics system)으로 구성된다 (Supplementary Fig. 9).

Supplementary Methods에 설명된 대로 시퀀싱을 위해 게놈 DNA를 준비한다.
간단히 말하면, DNA는 단편화되어 어댑터에 결찰되고, 어댑터-결찰된 라이브러리는 비드에서 클론 증폭된다.
템플릿-함유 비드는 마그네틱 비드-기반 프로세스를 통해 강화된다(enriched).
그런 다음 시퀀싱 프라이머(Sequencing primers)와 DNA 중합효소(DNA polymerase)가 템플릿에 결합되어,

칩의 로딩 포트로 피펫으로 이동된다.
데스크탑 원심분리기에서 칩을 회전시켜 개별 비드들이 개별 센서 웰들에 로드된다.
높은 signal-to-noise ratio (SNR)(800 K copies, SNR, 10; Supplementary Methods and Supplementary Fig. 10)를 달성하기 위해 충분한 템플릿 복사본을 센서에 전달하기 위해 2mm 아크릴아미드 비드(acrylamide bead)가 선택되었고, 웰 깊이는 단일 비드만 웰을 차지할 수 있도록 선택되었다.

 

Ion sequencing에서는, 4개의 모든 뉴클레오티드들이 자동 실행 중에 단계적인 방식으로 제공된다 (Supplementary Methods). 

그 흐름의 뉴클레오티드가 시퀀싱 프라이머 바로 하류의 템플릿 염기에 상보적이면, 그 뉴클레오티드는 결합된 폴리머라제(bound polymerase)에 의해 초기 가닥(nascent strand)에 통합된다.

이는 시퀀싱 프라이머(sequencing primer)의 길이를 한 염기만큼(또는 homopolymer stretch가 프라이머의 바로 하류에 있는 경우 그 이상) 증가시키고, 들어오는 뉴클레오티드 삼인산염 (triphosphate)의 가수분해 (hydrolysis)를 초래하여, 그 흐름 중에 통합된 각 뉴클레오티드에 대한 단일 양성자 (single proton)의 순 유리(net liberation)를 유발한다. 

양성자의 방출(release of the proton)은 그 플로우에 통합된 뉴클레오티드들의 수에 비례하여 주변 용액의 pH 변화를 생성한다 (싱글 염기 통합당 0.02 pH 단위). 

이는 각 웰 바닥에 있는 센서에 의해 감지되어 전압으로 변환되고 오프칩 전자 장치에 의해 디지털화된다 (Fig. 3).
신호 생성 및 감지는 4초에 걸쳐 발생한다 (Fig. 3b).

각 뉴클레오티드의 흐름 후, 뉴클레오티드가 웰에 남아 있지 않도록 wash를 사용한다.
웰의 크기가 작기 때문에 1/10초 정도에 웰 안팎으로 확산(diffusion)이 가능하며, 시약들을 효소적으로 제거할 필요가 없다.

 

 

 Signal processing and base calling

 

원시 전압(raw voltages)을 염기 호출(base calls)로 바꾸기 위해 신호 처리 소프트웨어는 물리적 모델을 사용하여 원시 데이터를 연속적인 각 뉴클레오티드 흐름에 대한 각 웰의 통합 측정값(measurements of incorporation)으로 변환한다.


통합 신호의 시간(time of the incorporation signal)에 비해 높은 주파수에서 신호를 샘플링하면, 신호 평균화(signal averaging)를 통해 SNR을 향상시킬 수 있다.

 

물리적 모델은 확산 속도(diffusion rates), 완충 효과(buffering effects) 및 중합효소 속도(polymerase rates)를 고려한다 (Supplementary Fig. 11). 모델은 각 웰로부터의 원시 트레이스(raw trace)에 적용되고 맞춰지며, 통합 신호 (incorporation signals)가 추출된다.


염기 호출부(base caller)는 위상 신호(signals for phase) 및 신호 손실(signal loss)을 수정하고, 키(key)에 정규화하고, 각 웰의 각 플로우에 대해 수정된 염기 호출(base calls)을 생성하여 시퀀싱 리드들을 만들어낸다 (Fig. 3cSupplementary Fig. 12).

다음으로, 각 리드는 두 개의 신호-기반 필터들을 순차적으로 통과한다. 정확도가 낮은 리드들을 제외하는 필터이다.
첫 번째 필터는 통합 이벤트가 측정된 흐름의 비율(fraction of flows)을 측정한다.
이 값이 비정상적으로 큰 경우(처음 60개 흐름의 60% 초과) 그 리드는 복제되지 않는다.
두 번째 필터는 관찰된 신호 값들이 위상 모델(phasing model)에 의해 예측된 값과 일치하는 정도를 측정한다.
둘 사이의 일치도가 낮을 ​​경우(처음 60개 흐름에 대해 절대 차이 중앙값이 0.06 이상) 오류율이 더 높다.


마지막으로, 위상 모델 예측(phasing model predictions)과 관찰된 신호 간의 일치성을 정량화하는 Phred method [39]을 적용하여, 염기별 품질 값들(per-base quality values)을 예측한다.
이러한 ab initio 점수는 정렬 후 파생된 품질 점수와 밀접하게 추적되며, 한 리드의 39번째 end로부터 낮은 품질의 시퀀스를 잘라내는데 사용된다 (Supplementary Fig.  13).

 

 

 

 

 References



댓글