新一代測序

發布日期:2016-10-14 18:11:23

內容

介紹

人類基因組測序于2003年完成,經過13年的國際合作和三十億美元的投資。人類基因組計劃中使用桑格測序(盡管大量優化),自20世紀70年代發明的DNA測序的主要方法。

今天,用于測序的需求呈幾何級數增長,與需要大量的基因組DNA進行快速分析,廉價地和準確。多虧統稱為下一代測序新的測序技術,現在有可能在幾個小時內測序整個人基因組。

Sanger測序和新一代測序

后面下一代測序(NGS)的原理是類似的的Sanger測序,這依賴于毛細管電泳。基因組鏈被分段,并且在每個片段的堿基被發射的信號來識別時的片段針對模板鏈連接。
需要用于測序單獨的步驟,分離(通過電泳)和檢測該Sanger法,這使得它難以自動化樣品制備,它是在通過量,可擴展性和分辨率的限制。該NGS方法使用結合在Sanger測序開發來處理百萬反應平行,導致非常高的速度,并可以通過在降低成本的技術的基于陣列的測序。那花了很多年,桑格方法的基因組測序項目,現在可以在NGS小時內完成,雖然較短讀長(那在時間序列堿基數),少的準確性。

DNA測序的新一代方法有三個基本步驟:

  • 文庫制備:庫使用DNA的隨機片段創建,接著用自定義接頭結扎
  • 放大:該庫是用克隆擴增的方法和擴增PCR
  • 測序:DNA被使用幾種不同方法之一進行測序

圖書館準備

首先,DNA被兩種酶或通過超聲處理(激勵用超聲波),以創建更小股線分段。然后適配器(合成DNA的短雙鏈件)被連接到這些片段用DNA連接酶的幫助下,聯接的DNA鏈的酶。適配器使序列成為結合到互補配對。

適配器被合成,使一端是“粘性”,而另一種是'鈍'(非粘性),以期加入鈍端的鈍端DNA。這可能導致分子,因此形成二聚體之間的堿基配對的潛在的問題。為了防止這種情況,DNA的化學結構被利用,因為結扎開出的3'-OH和5'-P結束之間進行。通過從適配器的粘性末端除去磷酸鹽和因此建立一個5'-OH端相反,DNA連接酶是無法形成兩個末端之間的橋(圖1)。

新一代測序文庫制備

圖1 | 新一代測序文庫制備

為了測序是成功的,該文庫片段需要在PCR菌落或'polonies“,因為它們是公知的,它包括一個特定的文庫片段的許多拷貝的在空間上聚集。由于這些polonies附著在一個平面方式,所述陣列的特征可以酶促并行操縱。文庫構建的這種方法比菌落采摘和大腸桿菌克隆的用于分離和擴增DNA為Sanger測序先前勞動密集型過程快得多,但是,這是在片段的讀出長度為代價。

放大

文庫擴增是必需的,以便從音序接收的信號是強到足以精確地檢測。用酶擴增,可發生導致某些文庫片段的優先擴增的現象,如“偏置”和“復制”。相反,有幾種類型的擴增過程的其中使用的PCR來創建大量的DNA簇。

乳液PCR

乳液油,珠,PCR混合物和文庫DNA混合以形成這導致微孔(形成的乳液圖2)。

乳液PCR

圖2 | 乳液PCR

為了使測序過程是成功的,每個微井應包含一胎圈與DNA的一條鏈(微井的約15%是該組合物的)。在PCR然后變性的文庫片段領先兩個單獨的鏈,其中(反向鏈)之一退火至珠粒。退火的DNA通過聚合酶從朝向引物位點的珠開始擴增。原始反向鏈然后變性,并從胎圈只有重新退火釋放到珠,得到兩個分開的鏈。這些都被擴增,得到附著在胎圈兩條DNA鏈。該處理然后在30-60個循環導致DNA的簇重復。這種技術已經被批評為耗時的性質,因為它需要很多步驟(成型和破乳,PCR擴增,濃縮等),盡管它在許多的NGS平臺的廣泛使用。這也是相對低效的,因為只有兩個周圍三分之二乳液的微反應器實際上將包含一個珠子。因此,一個額外的步驟是必需的空系統,從而導致更多的潛在不準確分離。

大橋PCR

流動池的表面上密集地涂覆有對附著在DNA文庫片段(引物互補的引物如圖3)。然后將DNA連接到隨機的細胞的表面上,其中它暴露于試劑用于基于聚合酶延伸。在加入核苷酸和酶,DNA的單鏈的自由端附著在經由互補的引物的細胞的表面上,形成橋接結構。酶,然后用橋相互作用,使它們的雙鏈,這樣,當變性發生時,兩個單鏈DNA片段連接到在靠近表面。這一過程的重復導致局部相同鏈的克隆簇。為了優化集群密度,試劑濃度必須密切監控,以避免過度擁擠。

橋接PCR

圖3 | 橋接PCR

測序

新一代測序的幾個競爭方法已經由不同的公司開發的。

454焦磷酸測序

焦磷酸測序是基于“測序通過合成”的原則,在互補鏈在聚合酶(的存在下合成的圖4)。相反,使用雙脫氧核苷酸終止鏈的擴增(如在Sanger測序),焦磷酸測序代替檢測何時核苷酸加到DNA鏈焦磷酸的釋放。它最初使用乳液PCR技術來構建用于測序所需的polonies并移除互補鏈。接著,將單鏈DNA的測序引物雜交到鏈(引物結合區)的端部,則四種不同的dNTP,然后依次制成在polonies進出井流動。當正確的dNTP被酶納入鏈,它會導致焦磷酸鹽的釋放。在ATP硫酸和腺苷的存在下,將焦磷酸轉化為ATP。這項ATP分子用于熒光素熒光素酶催化轉化為氧化螢光素,它產生可與相機被檢測的光。光的相對強度正比于加入的堿的量(即兩倍的強度的峰值表示兩個相同的堿基相繼增加了)。

454焦磷酸測序

圖4 | 454焦磷酸測序

焦磷酸測序,由454生命科學公司研制,是新一代測序的早期成功之一; 的確,454生命科學公司生產的第一個商用的下一代音序器。然而,該方法是由其他技術黯然失色,并在2013年,新業主羅氏宣布454生命科學的關閉和454焦磷酸測序平臺停產。

離子洪流半導體測序

離子洪流測序采用了“測序通過合成”的方式,在一個新的DNA鏈,目標鏈互補,在一次合成一個堿基。一種半導體芯片檢測的DNA聚合(期間產生的氫離子圖5)。

以下使用乳液PCR聚合酶群落的形成,DNA文庫片段被順序地充斥各三磷酸核苷(的dNTP),如焦磷酸測序。則的dNTP摻入新鏈如果互補的靶鏈的核苷酸。每個成功添加的核苷酸的時候,氫離子被釋放出來,并且它由定序器的pH傳感器檢測到。如在焦磷酸測序方法中,如果被加入相同的核苷酸的一個以上,在pH值/信號強度的變化是相應較大。

離子洪流半導體測序

圖5 | 離子洪流半導體測序

離子洪流測序是第一個商業化的技術不使用熒光和攝像頭掃描; 它因此比許多其他方法更快和更便宜。不幸的是,它可能難以枚舉加入相同的堿基數連續。例如,可能難以區分pH變化為長度9的homorepeat長度10的一個,使得難以重復序列進行解碼。

通過連接測序(固體)

固體為測序的酶方法,使用DNA連接酶,在生物技術廣泛用于其結扎雙鏈DNA鏈的能力(一種酶圖6)。乳液PCR用于以固定/放大已上的珠子結合到靶序列(即是序列待測序)一個單鏈DNA引物結合區(稱為適配器)。然后,這些珠粒沉積到玻璃表面-珠的高密度,可以實現這反過來,增加了該技術的吞吐量。

一旦珠沉積發生,長度為N的引物雜交到適配器,則珠粒暴露于具有在5種不同的熒光染料'端和3羥基'端8聚體探針的文庫。基地1和2是對核苷酸互補,而堿基3-5待測序是簡并堿基6-8是肌苷堿基。只有一個互補的探針將雜交到靶序列鄰近于引物。DNA連接酶是隨后使用的8聚體探針加入到引物。堿基5和6之間的硫代磷酸酯連接允許熒光染料從使用銀離子的片段被裂解。這個裂解允許測量熒光(四種不同的熒光染料的使用,所有這些都具有不同的發射光譜),并還產生可經歷進一步結扎5'-磷酸基。一旦第一輪測序完成,延伸產物被熔化掉,然后進行第二輪測序是perfomed與長度為N-1的引物。測序的多輪使用較短的引物各時間(即N-2,N-3等),并測量熒光確保目標被測序。

由于兩堿基測序方法(因為每個基被有效地測序兩次),固體技術是高度準確的(在含有第六底漆99.999%,這是最精確的第二代平臺),也便宜。它可以在7天的時間可以產生數據的30 GB完成一次運行。不幸的是,它的主要缺點是,讀取長度短,使得它不適合于許多應用。

測序結扎

圖6 | 測序結扎

可逆終止子測序(Illumina公司)

可逆終止子測序從在傳統的Sanger法的不同,而不是終止不可逆地使用雙脫氧核苷酸的引物延伸,修飾的核苷酸在可逆終止使用。而許多其它技術使用乳液PCR來擴增該DNA文庫片段,可逆終止使用橋的PCR,提高該工藝階段的效率。

可逆的終止子可分為兩類:3'-O-阻斷可逆終止子和3'-暢通可逆終止子。

3'-O-阻斷可逆終止子

該機構通過合成方法使用測序,拉長以逐步的方式的引物。首先,測序引物和模板固定于固體支持物。支撐暴露于四個DNA堿基,其具有除了一個3'-O-疊氮基連接(到含氮堿)不同的熒光團(的圖7)。

在Illumina的測序中使用熒光標記的dNTP結構

圖7 | 在Illumina的測序使用結構熒光標記的dNTP

只有正確的堿基退火至目標,并隨后連接到引物。然后將固體載體進行成像并且尚未摻入的核苷酸被沖走和熒光分支使用的TCEP(三(2-羧乙基)膦)裂解。TCEP還刪除3'-O-疊氮基,再生的3'-OH,循環可以重復(圖8)。

可逆終止子測序

圖8 | 可逆終止測序

3'-暢通可逆終止

的3'-暢通可逆終止子的可逆終止基團連接到基極和熒光基團,它現在作為終止基團的一部分,以及作為記者兩者。此方法從3'-O-阻斷可逆終止子方法的不同之處有三種:第一,3'-位沒有被阻塞(即基座具有游離的3'-OH); 熒光團是所有四種堿基相同; 和每個修改堿的順序,而不是在同一時間流。

這些技術的主要缺點在于它們的差讀出長度,這可以通過兩個現象之一引起的。為了防止兩個核苷酸的摻入在一個單一的工序中,一個塊到位,但在沒有嵌段加成的情況下,由于差的合成,股線可以成為相創建這限制了讀出長度的噪聲進行。如果熒光團沒有被成功連接或移除噪聲也可以被創建。這些問題是在其他測序方法盛行,并且是主要限制因素讀取長度。

該技術是由Illumina公司首創,用自己的HiSeq和MiSeq平臺。HiSeq是最便宜的為每百萬個堿基0.02 $成本的第二代測序儀的。它還具有600 GB的每個輸出高位運行數據需要大約8天的時間完成。

第三代測序

技術的新世代以來一直使用單分子測序和單實時測序的發展,消除對克隆擴增的需要。這減少了由PCR錯誤,簡化了庫制劑,以及最重要的是,使用更高的吞吐量平臺高得多的讀出長度。實例包括太平洋Biosciences的平臺,它使用SMRT(單分子實時)測序,得到一個約一千個堿基和Helicos Biosciences公司利用單分子測序,因此并不要求事先測序擴增讀長。牛津納米孔技術目前正在開發其受到改變作為DNA穿過孔的電流硅基納米孔。這預計是DNA測序的高通量快速的方法,盡管如通過孔減緩交通問題必須首先解決。

 

測序表觀遺傳修飾

正如新一代測序使基因測序大規模,現在已經很清楚最近,遺傳密碼不包含有機物所需的所有信息。表觀遺傳修飾的DNA堿基,特別是5-甲基胞嘧啶,也傳達重要信息。

所有的第二代測序平臺依賴,如Sanger測序,PCR的,因此無法序列修飾的DNA堿基。實際上,無論是5-甲基胞嘧啶和5-羥甲基被視為由參與的PCR酶胞嘧啶; 因此,表觀遺傳信息測序過程中丟失。

亞硫酸鹽測序

亞硫酸鹽測序利用了胞嘧啶和5-甲基胞嘧啶相對于亞硫酸氫鹽的反應性的差異:胞嘧啶亞硫酸氫脫氨,形成尿嘧啶(測序時,其內容為T),而5-甲基胞嘧啶是反應性(即讀為C)。如果兩個測序運行并行,一個有亞硫酸氫鹽處理和一個沒有,完成了兩次運行的輸出之間的差異表明,在原始序列甲基化的胞嘧啶。這種技術還可以用于雙鏈DNA,因為用亞硫酸氫處理后的鏈不再互補,并且可以被視為單鏈DNA。

5-羥甲基,另一個重要的表觀遺傳修飾,反應用亞硫酸氫形成胞嘧啶-5-甲基磺酸鹽(為C測序時其內容)。這有點復雜事務,并且意味著亞硫酸氫鹽測序不能用作甲基化的本身就是一個真實指示器。

氧化亞硫酸氫鹽測序

氧化亞硫酸氫鹽測序添加化學氧化步驟,其中使用氫過釕酸銨,KRuO4,亞硫酸氫鹽處理前5-羥甲基轉化為5- formylcytosine。5- Formylcytosine被deformylated和脫氨基,以形成由亞硫酸氫鹽處理尿嘧啶。現在,三個獨立的測序運行是必要區分胞嘧啶,5-甲基胞嘧啶和5-羥甲基(參見圖9)。

用亞硫酸氫鹽測序表觀遺傳修飾

圖9 | 利用測序表觀遺傳修飾的亞硫酸氫

新一代測序中的應用

新一代測序已使研究人員能夠收集數量龐大的基因測序數據。這種技術具有的應用,如過多:診斷和了解復雜疾病; 全基因組測序; 表觀遺傳修飾的分析; 線粒體測序; 轉錄組測序 - 了解基因變異如何表達改變影響到一個有機體; 和外顯子測序 - 在外顯子組突變被認為含有高達90%的突變在人類基因組,從而導致疾病。DNA技術已被用于鑒定和分離負責某些疾病的基因,并且提供被稱為“基因療法”有缺陷的基因的正確副本。

在基因治療中大焦點區域是癌癥治療-一種可能的方法是引進的反義RNA(其特異性地防止靶蛋白的合成)向癌基因,這是觸發以形成腫瘤細胞。另一種方法被命名為“自殺基因療法”它引入基因來殺死癌細胞選擇性。毒性的蛋白質和酶的許多遺傳密碼是已知的,和引入這些基因進入腫瘤細胞會導致細胞死亡。在此方法的困難在于確保非常精確的遞送系統,以防止殺死健康細胞。
這些方法成為可能通過測序來分析腫瘤的基因組,從而使醫學專家能夠更有效地定制化療和其它癌癥的治療,以病人的獨特遺傳組成,徹底改變個性化醫療的診斷階段。

隨著DNA測序成本下降,這將變得更加普遍,這帶來了一些問題。測序產生大量數據,并且有與處理和存儲的數據相關聯的許多計算挑戰。也有倫理問題,諸如個人的DNA的所有權時,DNA被測序。DNA測序數據必須安全地存儲,因為有一些保險集團,抵押貸款經紀人和雇主可以使用這些數據來修改保險報價或候選人區分的擔憂。測序也可能有助于找出個體是否具有增加的風險的特定疾病,但病人是否被通知或者如果有這種疾病的治療是另一個問題完全。