的測(cè)序儀—包括ABI的Ion Torrent PGM和Illumina的Miseq—使得普通的實(shí)驗(yàn)室也有能力進(jìn)行下一代測(cè)序。而Pacific Biosciences因?yàn)榻庾x了肆虐海地的病原體Vibrio cholerae的基因組而備受矚目。[1]同時(shí),在臨床上人類基因組以近乎枯燥的規(guī)律而被闡明。正如Erika Check Hayden在《Nature》雜志上所報(bào)告,人類基因組測(cè)序中心的Richard Gibbs估計(jì)“在今年(2011年)有5,000人的基因組完成測(cè)序,明年預(yù)計(jì)為30,000人。”
“今年,基因組測(cè)序從名人測(cè)序轉(zhuǎn)向了臨床研究,”專攻基因組學(xué)的英國(guó)博士后Daniel MacArthur說道。去年,搖滾歌手Ozzy Osbourne對(duì)他的基因組進(jìn)行了測(cè)序。今年(2011年),Gibbs和同事們報(bào)告稱,由一對(duì)14歲的患有多巴反應(yīng)性肌張力障礙的異卵雙胞胎全基因組測(cè)序結(jié)果鑒定出了這種疾病的分子病因, 從而改進(jìn)了治療策略。[3]一位患有無從解釋的腸道疾病的小孩讓報(bào)道其感人故事的《密爾瓦基新聞衛(wèi)報(bào)》(Milwaukee Journal Sentinel)獲得了普利策獎(jiǎng)。這名小孩患有的醫(yī)學(xué)罕見的遺傳畸變,該疾病后通過外顯子測(cè)序得到了解答,這是一場(chǎng)花費(fèi)了75,000美元。在Walter Isaacson撰寫的蘋果創(chuàng)始人Steve Jobs傳記中,我們知道Jobs在自己被診斷患有胰腺癌后,他對(duì)自己的癌癥基因組進(jìn)行了“部分測(cè)序”,試圖找出一種進(jìn)行“靶向治療”的方法。[5]
通量提高,成本降低
Isaacson 寫道,Jobs的測(cè)序花費(fèi)了大約100,000美金。自那之后,測(cè)序價(jià)格陡降了兩個(gè)數(shù)量級(jí)。在(2011年)二月份,Kevin Davies在《Bio-IT World》報(bào)道中稱全基因組測(cè)序服務(wù)商Complete Genomics Inc.(以下簡(jiǎn)稱CGI)的測(cè)序價(jià)格為每人9,500美元,8個(gè)基因組起測(cè)。[6]據(jù)CGI的CEO Clifford Reid稱,該公司現(xiàn)在的報(bào)價(jià)是每個(gè)基因組4,000美元,一個(gè)月可完成750個(gè)基因組,到2012年初可實(shí)現(xiàn)每月1,000個(gè)。
以一個(gè)月完成750多個(gè)基因組的速度計(jì)算,CGI一年可以完成大約10,000個(gè)人類基因組測(cè)序。不過,Reid說得益于更多攝像機(jī)和DNA芯片的更利用,CGI將要配備的一種新儀器將使公司的產(chǎn)能提高到每年100,000個(gè)基因組。而超越性的下一代升級(jí)—有了更好的光學(xué)技術(shù)及更高密度的樣品空間的支持—將使上面說的數(shù)字提高到另一個(gè)數(shù)量級(jí),到2015年實(shí)現(xiàn)每年測(cè)出1百萬個(gè)基因組,Reid說道。
更長(zhǎng)的序列讀長(zhǎng)可以做到線性拼接
同時(shí),CGI公司正在開發(fā)一種新的技術(shù)LFR(long-fragment reads 長(zhǎng)片段序列),通過此技術(shù)可以使公司依靠生物信息學(xué)工具將測(cè)得的序列通過拼接,達(dá)到100,000個(gè)堿基長(zhǎng)度的片段。Reid說,以此長(zhǎng)度序列,公司可以解決遺傳學(xué)上的“潛藏問題”,即將不同的DNA鏈進(jìn)行區(qū)分。
當(dāng)然,人類是雙倍體,攜帶了兩套染色體。目前的問題是,如果一個(gè)個(gè)體在一個(gè)基因上出現(xiàn)兩個(gè)突變,那這兩個(gè)突變是位于其中一個(gè)染色體拷貝上,還是兩個(gè)拷貝上各有一個(gè)錯(cuò)誤? “醫(yī)生當(dāng)然必須知道這些信息以便做出正確的診斷,”Reid說。他解釋說,現(xiàn)有的技術(shù)無法做到,因?yàn)檫@些技術(shù)使基因組發(fā)生了重新裝配,使得無法將一個(gè)特定的突變定位到某個(gè)特定染色體。在這類系統(tǒng)中,“相位”(phase)信息—就是說基因組片段之間物理上互相連接的位置信息—丟失了。
CGI使用的是基于化學(xué)連接技術(shù)的短序列測(cè)序技術(shù),每次大約測(cè)70個(gè)堿基。不過通過將片段標(biāo)上標(biāo)簽,依片段的不同分子來源而進(jìn)行標(biāo)記,LFR技術(shù)則可以規(guī)避該問題。Reid補(bǔ)充說,LFR的另一個(gè)好處是能將公司的測(cè)序精度從10-5提高到10-7,或者說從每個(gè)二倍體基因組上60,000個(gè)錯(cuò)誤降低到600個(gè)。
據(jù)公司的一位發(fā)言人透露,CGI在2011年底進(jìn)行LFR服務(wù)試點(diǎn),正式啟動(dòng)定于2012年。“我預(yù)計(jì),這會(huì)是一筆大生意,”CGI科學(xué)顧問委員會(huì)成員、哈佛醫(yī)學(xué)院遺傳學(xué)家George Church如是說。
個(gè)人化NGS系統(tǒng)
Illumina公司
在NGS領(lǐng)域,其他一些新技術(shù)的發(fā)展,使一些不是從事人類全基因組研究的人員獲益匪淺。例如,Illumina推出的MiSeq,這是一種新的測(cè)序設(shè)備,可在不必要使用該公司的HiSeq測(cè)序儀的時(shí)候使用。
“很多的應(yīng)用只需要測(cè)到數(shù)百萬或者數(shù)十億個(gè)堿基,”Illumina公司的信息產(chǎn)品市場(chǎng)副總監(jiān)Jordan Stockton說,例如那些對(duì)細(xì)菌基因組的測(cè)序,或特定人類等位基因的靶向重測(cè)。
MiSeq采用了與HiSeq相同的邊合成邊測(cè)序的方法,這就意味著研究人員可以在MiSeq與HiSeq之間實(shí)現(xiàn)無縫切換,而無需再去學(xué)習(xí)的操作手冊(cè)。售價(jià)125,000美元的MiSeq平臺(tái)可在一次運(yùn)行中產(chǎn)生小于2G的數(shù)據(jù)量,雙端讀長(zhǎng)可以達(dá)到150bp,the Broad Institute顯示MiSeq單端測(cè)序可以達(dá)到300bp,MacArthur說,這也就是說雙端測(cè)序就可能達(dá)到500bp,因?yàn)橹虚g會(huì)包含一些重疊區(qū),“這讓人印象非常深刻,”(HiSeq目前大能實(shí)現(xiàn)125bp的雙端讀長(zhǎng),主要是因?yàn)閮煞N設(shè)備在循環(huán)次數(shù)上存在差異。)
據(jù)Stockton的說法,Illumina近還宣稱開發(fā)了三種新的用于NGS的工具。一種是TrueSeq Amplicon Kit,可同時(shí)針對(duì)96個(gè)樣品實(shí)現(xiàn)每個(gè)樣品384個(gè)目標(biāo)的測(cè)序。第二種是簡(jiǎn)化的文庫(kù)制備試劑盒,可以將“一天或兩天”的操作簡(jiǎn)化至90分鐘。后一種是BaseSpace,該公司推出的云端生物信息學(xué)系統(tǒng)。
Stockton說,BaseSpace由5個(gè)工作流組成:細(xì)菌全基因組測(cè)序、靶向測(cè)序、宏基因組學(xué)、小RNA表達(dá)譜以及文庫(kù)質(zhì)量控制(為那些想在測(cè)序前進(jìn)行文庫(kù)質(zhì)量驗(yàn)證的人)。不過“這種云技術(shù)的真正美妙之處就是,它非常易于為使用者增加新的功能”,他說道。事實(shí)上,Illumina計(jì)劃推出BaseSpace的“應(yīng)用商店”,這樣用戶可以將新的算法加入到自己的數(shù)據(jù)分析流程中。
Life Technologies公司
Life Technologies公司去年(2010年)憑借其每臺(tái)50,000美元的Ion Torrent PGM進(jìn)入低價(jià)臺(tái)式個(gè)人測(cè)序儀市場(chǎng)。該設(shè)備本質(zhì)上是將半導(dǎo)體芯片轉(zhuǎn)換成了超高密度pH計(jì)。推出之時(shí),PGM采用稱為“314”的芯片,在兩個(gè)小時(shí)內(nèi)可產(chǎn)生1,000萬個(gè)堿基,每個(gè)讀長(zhǎng)為100個(gè)堿基,花費(fèi)500美元。后來改用“316”芯片,產(chǎn)能提高了10倍。目前試用用戶可用到的“318”芯片又提高了輸出能力,一次運(yùn)行可產(chǎn)生10億堿基的數(shù)據(jù)。
Life Technologies的半導(dǎo)體測(cè)序芯片
ABI公司副總裁Mark Gardner解釋說,一次運(yùn)行產(chǎn)生10億堿基數(shù)據(jù)得益于兩個(gè)方面,一是芯片上傳感器數(shù)量增加,314上傳感器數(shù)為140萬,現(xiàn)在是1130萬,可產(chǎn)生至少500萬個(gè)讀長(zhǎng);二是讀長(zhǎng)增大,現(xiàn)在增長(zhǎng)到了200堿基。Gardner說,到2012年某個(gè)時(shí)候,讀長(zhǎng)將增加到400堿基,意味著318芯片理論上每次運(yùn)行可以產(chǎn)出20億堿基的數(shù)據(jù),而價(jià)格仍是500美元。他說:“在美國(guó)人類遺傳學(xué)協(xié)會(huì)年會(huì)上,我們展示了525個(gè)堿基對(duì)的讀長(zhǎng)。”
Gardner說,Life Technologies的5500系列遺傳分析系統(tǒng)也預(yù)計(jì)在2012年進(jìn)行升級(jí)。彼時(shí),該系統(tǒng)將可運(yùn)行Wildfire chemistry,將在實(shí)驗(yàn)臺(tái)上進(jìn)行的模板制備(包括費(fèi)時(shí)費(fèi)錢的乳劑PCR步驟)工作轉(zhuǎn)到了儀器中進(jìn)行。這降低了樣品制備的費(fèi)用,提高了讀取密度及一致性,Gardner說。通過使點(diǎn)樣更為緊湊并從頭尾雙向同時(shí)進(jìn)行讀取,Wildfire將成像特征數(shù)量提到了5倍。Gardner說這就足夠“在一次運(yùn)行中完成10個(gè)基因組。”(目前5500x1系列遺傳分析系統(tǒng)每個(gè)運(yùn)行產(chǎn)生大約2個(gè)人類基因組的數(shù)據(jù)量。)
454 Life Sciences
Roche Life Sciences的454 Life Sciences也升級(jí)了它的測(cè)序平臺(tái)。454 GS FLX+結(jié)合該公司的新的GS FLX Titanium Sequencing Kit XL+升級(jí)到GS FLX,將其讀長(zhǎng)提高到了每個(gè)運(yùn)行1000個(gè)堿基。“利用該系統(tǒng)可以獲取高質(zhì)量、高通量、與Sanger測(cè)序法相似長(zhǎng)度的測(cè)序結(jié)果。”市場(chǎng)Mike Catalano說道,并且補(bǔ)充說到每運(yùn)行一次可以產(chǎn)生700M的數(shù)據(jù)。454還為靶向測(cè)序提供了引物試劑盒,包括人類HLA區(qū)域擴(kuò)增及白血病相關(guān)基因分析試劑盒(2012年推出)。
第三代測(cè)序
過去的一年還見證了稱為第三代測(cè)序技術(shù)的成果。其中的一件就是Pacific Bioscience的PacBio PR的正式推出。該平臺(tái)采用單分子熒光測(cè)序技術(shù),在解決海底霍亂流行及德國(guó) E. coli 爆發(fā)中發(fā)揮了重大作用。
據(jù)Pacific Biosciences的CTO Stephen Turner稱,PacBio RS的讀長(zhǎng)平均為2,500-3,000堿基,某些還長(zhǎng)達(dá)22,000堿基,這使得該設(shè)備盡管與競(jìng)爭(zhēng)技術(shù)相比每讀長(zhǎng)的精度要低(85%-89%的精度),但特別適于解決基因組結(jié)構(gòu)問題。
Tuiner說,PacBio初是專注于一些小的常規(guī)應(yīng)用,包括細(xì)菌的從頭測(cè)序、病原體測(cè)序、病毒測(cè)序及目標(biāo)基因測(cè)序。不過,該技術(shù)*性地實(shí)現(xiàn)了一些新應(yīng)用,包括基于如5-甲基胞嘧啶及5-羥甲基胞嘧啶對(duì)用于讀取序列的聚合酶動(dòng)力學(xué)影響而直接鑒定此類DNA修飾。
“這些化學(xué)修飾就像是高速路上的減速帶,當(dāng)聚合酶對(duì)其進(jìn)行驅(qū)動(dòng)時(shí),使得DNA的延伸變慢,或者有時(shí)候會(huì)變快,這取決于特定環(huán)境。那些模式產(chǎn)生特異信號(hào)從而可以檢測(cè)到它們。”Turner說。
納米孔技術(shù)
Oxford Nanopore公司正在開發(fā)兩種納米孔測(cè)序方法(“鏈條法”及“核酸外切酶法”,并已就后者同Illumina達(dá)成了商業(yè)化協(xié)議),公司拒絕評(píng)論其項(xiàng)目的進(jìn)展?fàn)顟B(tài),但一些在線信息顯示此系統(tǒng)由一系列的可以相互通訊的測(cè)序節(jié)點(diǎn)形成一個(gè)網(wǎng)絡(luò)結(jié)構(gòu),每個(gè)節(jié)點(diǎn)配置一個(gè)耗材倉(cāng)庫(kù)。每個(gè)GridION節(jié)點(diǎn)可獨(dú)立運(yùn)行,或通過網(wǎng)絡(luò)與其他節(jié)點(diǎn)通訊達(dá)到更大的測(cè)序效果,該架構(gòu)可實(shí)現(xiàn)多功能工作流。
不過,該公司在2011年10月20號(hào)公開的職位招聘列表包含一個(gè)“試用合作,DNA測(cè)序”職位,職責(zé)包括“管理與的基因組研究機(jī)構(gòu)中的重點(diǎn)客戶進(jìn)行的技術(shù)開發(fā)合作”,Oxford在不久的將來可能會(huì)褪去其神秘外紗并啟動(dòng)試用程序。
另一個(gè)專注于納米孔的公司Genia也邁出了它們商業(yè)化的*步。據(jù)該公司CEO Stefan Roever稱,Genia正在開發(fā)一種使用生物孔和集成電路(相同的技術(shù)正驅(qū)動(dòng)著計(jì)算機(jī)工業(yè)發(fā)展)的納米系統(tǒng)。Roever解釋說,該系統(tǒng)“運(yùn)用的電子學(xué),并將其應(yīng)用到信號(hào)處理過程中非常棘手的問題,”也就是說,對(duì)單個(gè)DNA堿基通過納米孔時(shí)產(chǎn)生的微弱的電子順序信號(hào)進(jìn)行捕捉。
Roever說,Genia的系統(tǒng)的核心是活性芯片,能夠?qū)Ω鱾€(gè)孔進(jìn)行獨(dú)立讀取和控制。[8]芯片“通電”之后,研究人員可以對(duì)納米孔陣列進(jìn)行動(dòng)態(tài)組裝,向納米孔中添加DNA樣并實(shí)施測(cè)序,同時(shí)可以依需要將這些DNA分子排出納米孔。盡管實(shí)驗(yàn)表明其可以區(qū)分四種堿基并控制DNA的運(yùn)動(dòng),但該技術(shù)目前還處在研發(fā)中,Roever說道。“我們希望2012年*季度能夠推出帶有幾百個(gè)傳感器的這種芯片的α版本。”
這種芯片如何與Oxford及其他的測(cè)序界大牛過招還需拭目以待。不過當(dāng)下還有一位大牛沒有參與到競(jìng)爭(zhēng)中來,那就是第三代單分子測(cè)序公司Helicos BioSciences。據(jù)GenomeWeb Daily News報(bào)道,Helicos在11月14號(hào)宣稱2011年第三季度的收入增長(zhǎng),“但要小心因?yàn)槿狈ΜF(xiàn)金注入而不得不在年底關(guān)門大吉。