專利名稱:高通量測(cè)序文庫的構(gòu)建方法及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及生物技術(shù)領(lǐng)域。具體地,涉及DNA甲基化檢測(cè)技術(shù),特別是涉及基因組特定區(qū)域的甲基化檢測(cè)。更具體地,本發(fā)明提供了一種構(gòu)建高通量測(cè)序文庫的方法、一種確定樣本的基因組特定區(qū)域的甲基化信息的方法、一種用于確定樣本的基因組特定區(qū)域的甲基化信息的裝置以及一種用于構(gòu)建樣本的基因組特定區(qū)域高通量測(cè)序文庫的試劑盒。
背景技術(shù):
DNA甲基化是研究最為深入的表觀遺傳學(xué)機(jī)制,DNA甲基化在維持正常細(xì)胞功能、抑制寄生DNA成分對(duì)基因組完整性的損害、染色質(zhì)結(jié)構(gòu)修飾、X染色體失活、基因組印記、胚胎發(fā)育以及人類腫瘤發(fā)生中起著重要作用,是目前新的研究熱點(diǎn)之一。然而,目前對(duì)基因組特定區(qū)域如啟動(dòng)子區(qū)域、CpG島區(qū)域、CpG島外區(qū)域以及印記基因區(qū)域的甲基化檢測(cè)的研究,仍有待改進(jìn)。
發(fā)明內(nèi)容
本發(fā)明旨在解決現(xiàn)有技術(shù)問題的至少之一。由此,為了代表性檢測(cè)基因組上特定區(qū)域的甲基化信息,本發(fā)明提供了高通量測(cè)序文庫的構(gòu)建方法及其應(yīng)用。根據(jù)本發(fā)明的一個(gè)方面,本發(fā)明提供了一種構(gòu)建高通量測(cè)序文庫的方法。根據(jù)本發(fā)明的實(shí)施例,該方法包括以下步驟:將基因組DNA片段化,以便獲得DNA片段;將所述DNA片段進(jìn)行末端修復(fù),以便獲得經(jīng)過末端修復(fù)的DNA片段;在所述經(jīng)過末端修復(fù)的DNA片段的3’末端添加堿基A,以便獲得具有粘性末端A的DNA片段;將所述具有粘性末端A的DNA片段與甲基化接頭相連,以便獲得連接產(chǎn)物;利用特異性探針對(duì)所述連接產(chǎn)物進(jìn)行雜交捕獲,以便獲得目的片段;將所述目的片段進(jìn)行重亞硫酸鹽處理,以便將所述目的片段中非甲基化的胞嘧啶轉(zhuǎn)換為尿 嘧啶,獲得經(jīng)過轉(zhuǎn)換的目的片段;將所述經(jīng)過轉(zhuǎn)換的目的片段進(jìn)行PCR擴(kuò)增,以便獲得擴(kuò)增產(chǎn)物;以及分離純化所述擴(kuò)增產(chǎn)物,所述擴(kuò)增產(chǎn)物構(gòu)成所述高通量測(cè)序文庫。利用根據(jù)本發(fā)明實(shí)施例的構(gòu)建高通量測(cè)序文庫的方法,能夠有效地構(gòu)建基因組DNA樣品的高通量測(cè)序文庫,特別是能夠有效地構(gòu)建基因組DNA樣品的已知甲基化位點(diǎn)的特定區(qū)域的高通量測(cè)序文庫,從而能夠有效、充分地應(yīng)用于高通量測(cè)序技術(shù),通過對(duì)文庫的測(cè)序,然后基于對(duì)測(cè)序結(jié)果的數(shù)據(jù)分析,能夠有效地獲得基因組特定區(qū)域的甲基化位點(diǎn)信息,實(shí)現(xiàn)對(duì)基因組DNA樣品的基因組特定區(qū)域的甲基化檢測(cè)。根據(jù)本發(fā)明的另一方面,本發(fā)明提供了一種確定樣本的基因組特定區(qū)域的甲基化信息的方法。根據(jù)本發(fā)明的實(shí)施例,該方法包括下列步驟:根據(jù)前面所述構(gòu)建高通量測(cè)序文庫的方法,構(gòu)建所述樣本的基因組特定區(qū)域的高通量測(cè)序文庫;對(duì)所述樣本的基因組特定區(qū)域的高通量測(cè)序文庫進(jìn)行測(cè)序,以便得到測(cè)序結(jié)果;以及對(duì)所述測(cè)序結(jié)果進(jìn)行數(shù)據(jù)分析,以便確定所述樣本的基因組特定區(qū)域的甲基化信息。利用根據(jù)本發(fā)明實(shí)施例的確定樣本的基因組特定區(qū)域的甲基化信息的方法,能夠準(zhǔn)確地確定樣本的基因組特定區(qū)域的甲基化信息,從而實(shí)現(xiàn)對(duì)樣本的基因組特定區(qū)域的甲基化檢測(cè)。根據(jù)本發(fā)明的再一方面,本發(fā)明提供了一種用于確定樣本的基因組特定區(qū)域的甲基化信息的裝置。根據(jù)本發(fā)明的實(shí)施例,該裝置包括:文庫制備單元,所述文庫制備單元用于制備樣本的基因組特定區(qū)域的高通量測(cè)序文庫,所述文庫制備單元內(nèi)設(shè)置有特異性探針;測(cè)序單元,所述測(cè)序單元與所述文庫制備單元相連,并且從所述文庫制備單元接收所述樣本的基因組特定區(qū)域的高通量測(cè)序文庫,以便用于對(duì)所述樣本的基因組特定區(qū)域的高通量測(cè)序文庫進(jìn)行測(cè)序,獲得測(cè)序結(jié)果;以及數(shù)據(jù)分析單元,所述數(shù)據(jù)分析單元與所述測(cè)序單元相連,并且從所述測(cè)序單元接收所述測(cè)序結(jié)果,以便對(duì)所述測(cè)序結(jié)果進(jìn)行數(shù)據(jù)分析,確定所述樣本的基因組特定區(qū)域的甲基化信息。利用根據(jù)本發(fā)明實(shí)施例的用于確定樣本的基因組特定區(qū)域的甲基化信息的裝置,能夠方便準(zhǔn)確地確定樣本的基因組特定區(qū)域的甲基化信息,可以應(yīng)用于多種針對(duì)基因組特定區(qū)域的甲基化的研究。根據(jù)本發(fā)明的又一方面,本發(fā)明提供了一種用于構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫的試劑盒。根據(jù)本發(fā)明的實(shí)施例,該試劑盒包括:特異性探針,所述特異性探針是對(duì)已知甲基化位點(diǎn)特異性的。利用根據(jù)本發(fā)明實(shí)施例的用于構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫的試劑盒,能夠方便有效地構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫。本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1:顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的構(gòu)建高通量測(cè)序文庫的方法的流程示意圖;圖2:顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的方法確定基因組特定區(qū)域甲基化信息時(shí),在不同覆蓋深度下(覆蓋深度> I及覆蓋深度> 5),每條染色質(zhì)上的捕獲區(qū)域占探針靶區(qū)域的百分比圖。圖3:顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的方法確定基因組特定區(qū)域甲基化信息時(shí),在不同覆蓋深度下,各條染色質(zhì)中檢測(cè)到甲基化信息的啟動(dòng)子占該染色質(zhì)的總啟動(dòng)子的百分比圖。圖4:顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的方法確定基因組特定區(qū)域甲基化信息時(shí),基因組上啟動(dòng)子區(qū)域、CpG島、CpG島外(在本文中指為CGI shore)及印記基因區(qū)域的甲基化水平分布結(jié)果。(a)顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的確定的樣本的基因組CpG島、CGI shore區(qū)域的甲基化水平分布圖。(b)顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的確定的樣本的基因組啟動(dòng)子區(qū)域的甲基化水平分布圖。
(c)顯示了樣本的基因組特定區(qū)域的原始分布和根據(jù)本發(fā)明一個(gè)實(shí)施例的確定的樣本的基因組特定區(qū)域的高通量測(cè)序文庫的reads分布及啟動(dòng)子、CpG島區(qū)域的甲基化水平分布圖。圖5:顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的用于確定樣本的基因組特定區(qū)域的甲基化信息的裝置的示意圖。
具體實(shí)施例方式下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。構(gòu)建高通量測(cè)序文庫的方法根據(jù)本發(fā)明的一個(gè)方面,本發(fā)明提供了一種構(gòu)建高通量測(cè)序文庫的方法。參考圖1,根據(jù)本發(fā)明的實(shí)施例,該方法包括以下步驟:首先,將基因組DNA片段化,以便獲得DNA片段。在本發(fā)明中所使用的術(shù)語“DNA”可以是任何包含脫氧核糖核苷酸的聚合物,包括但不限于經(jīng)過修飾的或者未經(jīng)修飾的DNA。本領(lǐng)域的技術(shù)人員可以理解,基因組DNA的來源不受特別限制,可以從任何可能的途徑獲得,可以是通過市售直接獲得,也可以是從其他實(shí)驗(yàn)室直接獲取,還可以是直接從樣本中提取。根據(jù)本發(fā)明的實(shí)施例,可以從樣本中提取獲得基因組DNA。根據(jù)本發(fā)明的一個(gè)實(shí)施例,構(gòu)建高通量測(cè)序文庫的方法可以進(jìn)一步包括從樣本中提取基因組DNA的步驟。根據(jù)本發(fā)明的一些具體示例,樣本可以來源于哺乳動(dòng)物、植物、和微生物的至少一種。根據(jù)本發(fā)明的一些實(shí)施例,哺乳動(dòng)物可以為人和小鼠的至少一種。根據(jù)本發(fā)明的一個(gè)實(shí)施例,基因組DNA可以為人類全血基因組DNA,優(yōu)選為外周血單核細(xì)胞基因組DNA。發(fā)明人發(fā)現(xiàn),當(dāng)采用YH cell基因組DNA構(gòu)建高通量測(cè)序文庫時(shí),從樣本中提取基因組DNA的操作方便易行,且獲得的DNA質(zhì)量好、甲基化信息完整,由其構(gòu)建的樣本的基因組特定區(qū)域的高通量測(cè)序文庫能夠方便地應(yīng)用于高通量測(cè)序技術(shù),從而基于對(duì)測(cè)序結(jié)果的數(shù)據(jù)分析就能方便有效地獲得樣本的基因組特定區(qū)域的甲基化信息。根據(jù)本發(fā)明的實(shí)施例,基因組DNA的量不受特別限制,根據(jù)本發(fā)明的具體示例,優(yōu)選基因組DNA的量為2 μ g。發(fā)明人驚奇地發(fā)現(xiàn),當(dāng)基因組DNA的量為2μ g時(shí),根據(jù)本發(fā)明實(shí)施例的構(gòu)建高通量測(cè)序文庫的方法構(gòu)建的樣本的基因組特定區(qū)域的高通量測(cè)序文庫,能夠非常方便地應(yīng)用于高通量測(cè)序技術(shù),如Solexa測(cè)序技術(shù),且文庫測(cè)序結(jié)果準(zhǔn)確,可重復(fù)性好,包含的特定區(qū)域的甲基化信息準(zhǔn)確、甲基化位點(diǎn)覆蓋率高。其次,將DNA片段進(jìn)行末端修復(fù),以便獲得經(jīng)過末端修復(fù)的DNA片段。根據(jù)本發(fā)明的一個(gè)實(shí)施例,在將DNA片段進(jìn)行末端修復(fù)前,可以進(jìn)一步包括純化DNA片段的步驟,由此,使得后續(xù)的末端修復(fù)易于進(jìn)行。根據(jù)本發(fā)明的實(shí)施例,將DNA片段進(jìn)行末端修復(fù)可以利用Klenow片段、T4 DNA聚合酶和T4多核苷酸激酶進(jìn)行,其中,所述Klenow片段具有5’ 一3’聚合酶活性和3’ — 5’聚合酶活性,但缺少5’ — 3’外切酶活性。由此,能夠方便準(zhǔn)確地對(duì)DNA片段進(jìn)行末端修復(fù)。根據(jù)本發(fā)明的實(shí)施例,還可以進(jìn)一步包括對(duì)經(jīng)過末端修復(fù)的DNA片段進(jìn)行純化的步驟,由此能夠方便地進(jìn)行后續(xù)處理。接下來, 在經(jīng)過末端修復(fù)的DNA片段的3’末端添加堿基A,以便獲得具有粘性末端A的DNA片段。根據(jù)本發(fā)明的一個(gè)實(shí)施例,可以利用Klenow(3’ -5’ exo-),即具有3’ 一5’外切酶活性的Klenow,在經(jīng)過末端修復(fù)的DNA片段的3’末端添加堿基A。由此,能夠方便準(zhǔn)確地將堿基A添加到經(jīng)過末端修復(fù)的DNA片段的3’末端。根據(jù)本發(fā)明的實(shí)施例,還可以進(jìn)一步包括對(duì)具有粘性末端A的DNA片段進(jìn)行純化的步驟,由此能夠方便地進(jìn)行后續(xù)處理。接著,將具有粘性末端A的DNA片段與甲基化接頭相連,以便獲得連接產(chǎn)物。本發(fā)明中所使用的術(shù)語“甲基化接頭”是指這樣的一種接頭,在其核苷酸序列中,所有C位點(diǎn)均被甲基化修飾。根據(jù)本發(fā)明的一個(gè)實(shí)施例,在將具有粘性末端A的DNA片段與甲基化接頭相連前,可以進(jìn)一步包括對(duì)常規(guī)測(cè)序所使用的接頭進(jìn)行甲基化的步驟。由此,能夠有效避免測(cè)序接頭對(duì)后續(xù)重亞硫酸鹽處理等操作的干擾。本領(lǐng)域的技術(shù)人員可以理解,對(duì)接頭進(jìn)行甲基化的方法不受特別限制,可以利用本領(lǐng)域已知的任何方法對(duì)測(cè)序接頭進(jìn)行甲基化。根據(jù)本發(fā)明 的一些實(shí)施例,甲基化接頭中還可以進(jìn)一步包含標(biāo)簽,由此可以方便地同時(shí)構(gòu)建多種樣本的基因組特定區(qū)域的高通量測(cè)序文庫,并能夠有效地應(yīng)用于高通量測(cè)序平臺(tái),從而在對(duì)測(cè)序結(jié)果進(jìn)行數(shù)據(jù)分析后,基于標(biāo)簽的序列信息,就能夠準(zhǔn)確地區(qū)分多種樣本的基因組特定區(qū)域的高通量測(cè)序文庫的序列信息以及樣本的基因組特定區(qū)域的甲基化信息,由此,能夠充分地利用高通量測(cè)序平臺(tái),且能夠節(jié)省時(shí)間、降低成本。根據(jù)本發(fā)明的一個(gè)實(shí)施例,將具有粘性末端A的DNA片段與甲基化接頭相連是利用T4DNA連接酶進(jìn)行的,由此可以方便地獲得連接產(chǎn)物。根據(jù)本發(fā)明的實(shí)施例,還可以進(jìn)一步包括對(duì)連接產(chǎn)物進(jìn)行純化的步驟,由此能夠方便地進(jìn)行后續(xù)處理。然后,利用特異性探針對(duì)所述連接產(chǎn)物進(jìn)行雜交捕獲,以便獲得目的片段。根據(jù)本發(fā)明的實(shí)施例,這里的術(shù)語“特異性探針”是指探針是對(duì)已知甲基化位點(diǎn)特異性的。根據(jù)本發(fā)明的具體示例,特異性探針是基于采用人類基因組作為參考序列,并且采用基因組上已知具有甲基化位點(diǎn)的特定基因區(qū)域作為靶序列而設(shè)計(jì)的,具體地,已知具有甲基化位點(diǎn)的基因區(qū)域包括選自啟動(dòng)子區(qū)域、CpG島區(qū)域、CpG島外區(qū)域以及印記基因區(qū)域的至少一種,由此,利用根據(jù)本發(fā)明實(shí)施例的特異性探針進(jìn)行雜交捕獲,能夠有效地捕獲樣本中與靶序列互補(bǔ)的序列,即樣本中已知具有甲基化位點(diǎn)的基因區(qū)域(在本說明書中,有時(shí)也稱為“基因組特定區(qū)域”)。此外,根據(jù)本發(fā)明的一個(gè)實(shí)施例,在雜交捕獲前,可以進(jìn)一步包括利用諸如c0t-lDNA和接頭封閉序列的單鏈寡核苷酸對(duì)連接產(chǎn)物(尤其是連接產(chǎn)物的基因組序列中的重復(fù)區(qū)域)和連接產(chǎn)物上的甲基化接頭進(jìn)行雜交封閉的步驟。發(fā)明人驚奇地發(fā)現(xiàn),當(dāng)使用^t-1DNA和接頭封閉序列分別對(duì)連接產(chǎn)物(尤其是連接產(chǎn)物的基因組序列中的重復(fù)區(qū)域)和連接產(chǎn)物上的甲基化接頭進(jìn)行雜交封閉后,能夠顯著地增強(qiáng)對(duì)連接產(chǎn)物的雜交捕獲。根據(jù)本發(fā)明的實(shí)施例,Cj-1DNA的使用量不受特別限制,根據(jù)具體的示例,優(yōu)選采用過量的^t-1DNA對(duì)連接產(chǎn)物的基因組序列中的重復(fù)區(qū)域進(jìn)行雜交封閉。其中,這里所使用的術(shù)語“過量”是指qt-lDNA的量遠(yuǎn)大于待進(jìn)行雜交捕獲的連接產(chǎn)物的量,即采用qt-lDNA的量可以是待進(jìn)行雜交捕獲的連接產(chǎn)物的量的2倍以上。根據(jù)本發(fā)明的具體示例,優(yōu)選,采用^t-1DNA的量為待進(jìn)行雜交捕獲的連接產(chǎn)物的量的5倍。根據(jù)本發(fā)明的一些實(shí)施例,采用^t-1DNA的量小于待進(jìn)行雜交捕獲的連接產(chǎn)物的量的5倍,則封閉雜交不徹底,重復(fù)序列的非特異性強(qiáng)雜交背景信號(hào)干擾強(qiáng)烈,嚴(yán)重影響核酸雜交的效率;而采用^t-1DNA的量大于待進(jìn)行雜交捕獲的連接產(chǎn)物的量的5倍,則過多的^t-1DNA會(huì)影響探針與連接產(chǎn)物的結(jié)合,同樣會(huì)影響核酸雜交的效率。由此,采用待進(jìn)行雜交捕獲的連接產(chǎn)物的量的5倍的c0t-lDNA對(duì)連接產(chǎn)物的基因組區(qū)域重復(fù)序列進(jìn)行雜交封閉,能夠方便、有效地進(jìn)行封閉,以去掉重復(fù)序列DNA,從而在后續(xù)的核酸雜交過程中,能夠有效避免重復(fù)序列產(chǎn)生的非特異性強(qiáng)雜交背景信號(hào)的干擾,顯著提高核酸雜交的效率,增強(qiáng)雜交效果。根據(jù)本發(fā)明的實(shí)施例,接頭封閉序列包括選自Blockl和Block2的至少一種,由此,能夠有效地對(duì)連接產(chǎn)物上的甲基化接頭進(jìn)行封閉。根據(jù)本發(fā)明的實(shí)施例,可以采用Iug的連接產(chǎn)物進(jìn)行所述雜交捕獲,由此能夠提高雜交捕獲的效率。根據(jù)本發(fā)明的具體示例,利用特異性探針對(duì)所述連接產(chǎn)物進(jìn)行雜交捕獲,可以進(jìn)一步包括利用鏈霉素磁珠捕獲目的片段,由此,能夠高效地捕獲目的片段。接下來,將目的片段進(jìn)行重亞硫酸鹽處理,以便將目的片段中非甲基化的胞嘧啶轉(zhuǎn)換為尿嘧啶,獲得經(jīng)過轉(zhuǎn)換的目的片段。根據(jù)本發(fā)明的實(shí)施例,在將目的片段進(jìn)行重亞硫酸鹽處理之前,可以進(jìn)一步包括將目的片段與片段化的λ-DNA混合。發(fā)明人發(fā)現(xiàn),通過添加外源DNA ( λ -DNA),即將目的片段與外源DNA混合,然后進(jìn)行重亞硫酸鹽高效共處理,對(duì)目標(biāo)DNA片段能夠起到保護(hù)作用,最大限度地降低重亞硫酸鹽對(duì)微量DNA的破壞,可以進(jìn)一步提高檢測(cè)精度,使得較少量的基因組DNA,甚至納克級(jí),例如50-150ng基因組的甲基化檢測(cè)成為現(xiàn)實(shí)。根據(jù)本發(fā)明的實(shí)施例,片段化的λ-DNA的添加量不受特別限制,根據(jù)具體的示例,優(yōu)選片段化的λ -DNA的量為200-400ng,更優(yōu)選為200ng。本領(lǐng)域技術(shù)人員能夠理解,可以通過本領(lǐng)域已知的任意方法制備這些片段化的λ -DNA,例如可以隨同前面的DNA片段化處理一起進(jìn)行制備。此外,將目的片段進(jìn)行重亞硫酸鹽處理,可以通過本領(lǐng)域已知的任何方法進(jìn)行,根據(jù)本發(fā)明的具體示例,可以采用商品化的試劑盒進(jìn)行,優(yōu)選地采用EZ DNAMe thy lation-Go IdK it (ZYMO)進(jìn)行。發(fā)明人驚奇地發(fā)現(xiàn),米用 EZ DNA Methylation-GoldKit (ZYMO)對(duì)目的片段進(jìn)行重亞硫酸鹽處理時(shí),方便快捷,且處理效果好,目的片段中非甲基化的胞嘧啶能夠高效準(zhǔn)確地轉(zhuǎn)換為`尿嘧啶,并且利于后續(xù)處理。然后,將經(jīng)過轉(zhuǎn)換的目的片段進(jìn)行PCR擴(kuò)增,以便獲得擴(kuò)增產(chǎn)物。根據(jù)本發(fā)明的實(shí)施例,可以使用熱啟動(dòng)taq DNA聚合酶對(duì)經(jīng)過轉(zhuǎn)換的目的片段進(jìn)行PCR擴(kuò)增。根據(jù)本發(fā)明的實(shí)施例,熱啟動(dòng)taq DNA聚合酶的種類不受特別限制,根據(jù)本發(fā)明的具體示例,熱啟動(dòng)taqDNA聚合酶可以為r_taq聚合酶,由此PCR擴(kuò)增效率高、用時(shí)少。最后,分離純化擴(kuò)增產(chǎn)物,所得到的擴(kuò)增產(chǎn)物構(gòu)成全基因組甲基化高通量測(cè)序文庫。根據(jù)本發(fā)明的實(shí)施例,分離純化擴(kuò)增產(chǎn)物的方法不受特別限制,根據(jù)本發(fā)明的具體示例,可以通過選自磁珠純化、純化柱純化和2%的瓊脂糖凝膠電泳的至少一種進(jìn)行,優(yōu)選通過2%的瓊脂糖凝膠電泳進(jìn)行。根據(jù)本發(fā)明的一些具體示例,高通量測(cè)序文庫的文庫片段長度為300-450bp,由此,高通量測(cè)序文庫能夠方便有效地應(yīng)用于高通量測(cè)序平臺(tái)如Solexa測(cè)序平臺(tái),且可重復(fù)性好,測(cè)序結(jié)果真實(shí)可靠,包含特異性探針?biāo)槍?duì)的基因組特定區(qū)域的甲基化信息較完整。利用根據(jù)本發(fā)明實(shí)施例的構(gòu)建高通量測(cè)序文庫的方法,能夠有效地構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫,從而能夠有效、充分地應(yīng)用于高通量測(cè)序技術(shù),通過對(duì)高通量測(cè)序文庫的測(cè)序,然后基于對(duì)測(cè)序結(jié)果的數(shù)據(jù)分析,就能夠有效地獲得樣本的基因組特定區(qū)域的甲基化信息,實(shí)現(xiàn)對(duì)樣本的基因組特定區(qū)域的甲基化檢測(cè)。確定樣本的基因組特定區(qū)域的甲基化信息的方法和裝置
根據(jù)本發(fā)明的另一方面,本發(fā)明提供了一種確定樣本的基因組特定區(qū)域的甲基化信息的方法。根據(jù)本發(fā)明的實(shí)施例,該方法包括下列步驟:根據(jù)本發(fā)明實(shí)施例的構(gòu)建高通量測(cè)序文庫的方法構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫;對(duì)該樣本的基因組特定區(qū)域的高通量測(cè)序文庫進(jìn)行測(cè)序,以便得到測(cè)序結(jié)果;以及對(duì)測(cè)序結(jié)果進(jìn)行數(shù)據(jù)分析,以便確定樣本的基因組特定區(qū)域的甲基化信息。根據(jù)本發(fā)明的一些實(shí)施例,測(cè)序是利用高通量測(cè)序技術(shù)進(jìn)行的。本領(lǐng)域的技術(shù)人員可以理解,可以通過本領(lǐng)域已知的任何高通量測(cè)序技術(shù)進(jìn)行測(cè)序,根據(jù)本發(fā)明的具體示例,優(yōu)選地利用Hiseq2000測(cè)序儀進(jìn)行測(cè)序。發(fā)明人發(fā)現(xiàn),利用Hiseq2000測(cè)序儀對(duì)樣本的基因組特定區(qū)域的高通量測(cè)序文庫進(jìn)行測(cè)序,能夠有效地獲得測(cè)序結(jié)果,且測(cè)序用時(shí)少、效率高、測(cè)序結(jié)果準(zhǔn)確,可重復(fù)性好。利用根據(jù)本發(fā)明實(shí)施例的確定樣本的基因組特定區(qū)域的甲基化信息的方法,能夠有效地構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫,并且能夠通過高通量測(cè)序技術(shù)如Solexa測(cè)序技術(shù)實(shí)現(xiàn)對(duì)文庫的準(zhǔn)確測(cè)序,基于對(duì)測(cè)序結(jié)果的數(shù)據(jù)分析,就能夠準(zhǔn)確地確定樣本的基因組特定區(qū)域的甲基化信息,從而實(shí)現(xiàn)對(duì)樣本的基因組特定區(qū)域的甲基化檢測(cè),且特定區(qū)域的甲基化位點(diǎn)覆蓋多,獲得甲基化信息完整。根據(jù)本發(fā)明的再一方面,本發(fā)明提供了一種用于確定樣本的基因組特定區(qū)域的甲基化信息的裝置1000。參考圖5,根據(jù)本發(fā)明的一個(gè)實(shí)施例,該裝置包括:文庫制備單元100、測(cè)序單元200以及數(shù)據(jù)分析單元300。根據(jù)本發(fā)明的實(shí)施例,文庫制備單元100用于制備樣本的基因組特定區(qū)域的高通量測(cè)序文庫,其中,文庫制備單元100內(nèi)設(shè)置有特異性探針。根據(jù)本發(fā)明的實(shí)施例,特異性探針是對(duì)已知甲基化位點(diǎn)特異性的。根據(jù)本發(fā)明的具體示例,特異性探針是基于采用人類基因組作為參考序列,并且采用基因組上已知具有甲基化位點(diǎn)的特定基因區(qū)域作為靶序列而設(shè)計(jì)的,具體地,已知具有甲基化位點(diǎn)的基因區(qū)域包括選自啟動(dòng)子區(qū)域、CpG島區(qū)域、CpG島外區(qū)域以及印記基因區(qū)域的至少一種,由此,利用根據(jù)本發(fā)明實(shí)施例的特異性探針進(jìn)行雜交捕獲,能夠有效地捕獲樣本中與靶序列互補(bǔ)的序列,即樣本中已知具有甲基化位點(diǎn)的基因區(qū)域。由此,文庫 制備單元100可以適于實(shí)施前面所述的高通量測(cè)序文庫構(gòu)建方法。測(cè)序單元200與文庫制備單元100相連,可以從文庫制備單元100接收所制備的樣本的基因組特定區(qū)域的高通量測(cè)序文庫,并對(duì)所接收的樣本的基因組特定區(qū)域的高通量測(cè)序文庫進(jìn)行測(cè)序,從而可以獲得測(cè)序結(jié)果。數(shù)據(jù)分析單元300與測(cè)序單元200相連,可以從測(cè)序單元200接收所獲得的測(cè)序結(jié)果,并且能夠進(jìn)一步對(duì)測(cè)序結(jié)果進(jìn)行數(shù)據(jù)分析,從而基于分析結(jié)果確定樣本的基因組特定區(qū)域的甲基化信息,最終實(shí)現(xiàn)對(duì)樣本的基因組特定區(qū)域的甲基化檢測(cè)。本領(lǐng)域技術(shù)人員能夠理解的是,可以采用本領(lǐng)域中已知的任何適于進(jìn)行上述操作的裝置作為上述各個(gè)單元的組成部件。在本文中所使用的術(shù)語“相連”應(yīng)作廣義理解,可以是直接相連,也可以通過中間媒介間接相連,對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù)具體情況理解上述術(shù)語的具體含義。利用根據(jù)本發(fā)明實(shí)施例的用于確定樣本的基因組特定區(qū)域的甲基化信息的裝置,能夠方便準(zhǔn)確地確定樣本的基因組特定區(qū)域的甲基化信息,從而可以應(yīng)用于多種針對(duì)基因組特定區(qū)域,如已知甲基化位點(diǎn)的基因組區(qū)域的甲基化的研究,例如可以用于對(duì)基因組特定區(qū)域的甲基化異常進(jìn)行檢測(cè)。試劑盒根據(jù)本發(fā)明的另一方面,本發(fā)明提供了一種用于構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫的試劑盒。根據(jù)本發(fā)明的實(shí)施例,該試劑盒包括:特異性探針,該特異性探針是對(duì)已知甲基化位點(diǎn)特異性的。根據(jù)本發(fā)明的一些具體示例,特異性探針是基于采用人類基因組作為參考序列,并且采用基因組上已知具有甲基化位點(diǎn)的特定基因區(qū)域作為靶序列而設(shè)計(jì)的,具體地,已知具有甲基化位點(diǎn)的基因區(qū)域包括選自啟動(dòng)子區(qū)域、CpG島區(qū)域、CpG島外區(qū)域以及印記基因區(qū)域的至少一種,由此,利用根據(jù)本發(fā)明實(shí)施例的特異性探針進(jìn)行雜交捕獲,能夠有效地捕獲樣本中與靶序列互補(bǔ)的序列,即樣本中已知具有甲基化位點(diǎn)的基因區(qū)域。本領(lǐng)域的技術(shù)人員可以理解,試劑盒中還可以進(jìn)一步包括構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫所需的任何其他組分,在此不再贅述。利用根據(jù)本發(fā)明實(shí)施例的用于構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫的試劑盒,能夠方便有效地構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫。需要說明的是,根據(jù)本發(fā)明實(shí)施例的構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫的方法及其應(yīng)用,是本申請(qǐng)的發(fā)明人經(jīng)過艱苦的創(chuàng)造性勞動(dòng)和優(yōu)化工作完成的。下面將結(jié)合實(shí)施例對(duì)本發(fā)明的實(shí)施方案進(jìn)行詳細(xì)描述,但是本領(lǐng)域技術(shù)人員將會(huì)理解,下列實(shí)施例僅用于說明本發(fā)明,而不應(yīng)視為限定本發(fā)明的范圍。實(shí)施例中未注明具體技術(shù)或條件的,按照本領(lǐng)域內(nèi)的文獻(xiàn)所描述的技術(shù)或條件(例如參考J.薩姆布魯克等著,黃培堂等譯的《分子克隆實(shí)驗(yàn)指南》,第三版,科學(xué)出版社)或者按照產(chǎn)品說明書進(jìn)行。所用試劑或儀器未注明生產(chǎn)廠商者,均為可以通過市購獲得的常規(guī)產(chǎn)品。實(shí)施例1:本實(shí)施例以2 μ g的人類外周血單核細(xì)胞基因組DNA為樣本,按照下列步驟實(shí)施。
`
一、基因組DNA片段化:利用C0VariS-S2打斷儀,按照下表設(shè)置的參數(shù),將樣本基因組DNA進(jìn)行片段化處理,以便獲得DNA片段。
處理I~ 負(fù)載比(%)| 10 ^5
循環(huán)/脈沖 200^
時(shí)間(s)50
處理2 時(shí)間(s)O
處理3 時(shí)間(s)O
處理4 時(shí)間(s)O
~lm3
將獲得的DNA片段進(jìn)行電泳檢測(cè),要求DNA片段主帶集中在150_300bp之間,無蛋白、RNA污染。利用QIAquick PCR純化試劑盒(Qiagen)或磁珠純化,將檢測(cè)合格的DNA片段純化回溶到32 μ I的洗脫緩沖液中,備用。用同樣的方法制備200_400ng的片段化的λ -DNA,其中λ -DNA為外源非甲基化的。二、末端修復(fù):I)將上一步獲得的DNA片段按照下表在1.5mL的離心管中配制末端修復(fù)反應(yīng)體系:
權(quán)利要求
1.一種構(gòu)建高通量測(cè)序文庫的方法,其特征在于,包括以下步驟: 將基因組DNA片段化,以便獲得DNA片段; 將所述DNA片段進(jìn)行末端修復(fù),以便獲得經(jīng)過末端修復(fù)的DNA片段; 在所述經(jīng)過末端修復(fù)的DNA片段的3’末端添加堿基A,以便獲得具有粘性末端A的DNA片段; 將所述具有粘性末端A的DNA片段與甲基化接頭相連,以便獲得連接產(chǎn)物; 利用特異性探針對(duì)所述連接產(chǎn)物進(jìn)行雜交捕獲,以便獲得目的片段; 將所述目的片段進(jìn)行重亞硫酸鹽處理,以便將所述目的片段中非甲基化的胞嘧啶轉(zhuǎn)換為尿嘧啶,獲得經(jīng)過轉(zhuǎn)換的目的片段; 將所述經(jīng)過轉(zhuǎn)換的目的片段進(jìn)行PCR擴(kuò)增,以便獲得擴(kuò)增產(chǎn)物;以及 分離純化所述擴(kuò)增產(chǎn)物,所述擴(kuò)增產(chǎn)物構(gòu)成所述高通量測(cè)序文庫, 其中, 任選地,進(jìn)一步包括從樣本中提取基因組DNA的步驟,優(yōu)選所述樣本來源于哺乳動(dòng)物、植物、和微生物的至少一種,更優(yōu)選所述哺乳動(dòng)物為人和小鼠的至少一種,優(yōu)選所述基因組DNA為人類全血基因組 DNA,更優(yōu)選所述基因組DNA為外周血單核細(xì)胞基因組DNA ; 優(yōu)選,所述基因組DNA的量為2 μ g ; 任選地,利用covariS-S2打斷儀將基因組DNA片段化; 任選地,所述DNA片段的長度為約150-300bp,優(yōu)選200_300bp ; 任選地,在將所述DNA片段進(jìn)行末端修復(fù)前,進(jìn)一步包括純化DNA片段的步驟; 任選地,將所述DNA片段進(jìn)行末端修復(fù)是利用Klenow片段、T4DNA聚合酶和T4多核苷酸激酶進(jìn)行的,其中,所述Klenow片段具有5’ 一 3’聚合酶活性和3’ 一 5’聚合酶活性,但缺少5’ 一 3’外切酶活性; 任選地,將所述經(jīng)過末端修復(fù)的DNA片段的3’末端添加堿基A是利用Klenow (3,-5’ exo_)進(jìn)行的; 任選地,所述甲基化接頭中包含標(biāo)簽; 任選地,將所述具有粘性末端A的DNA片段與甲基化接頭相連前,進(jìn)一步包括對(duì)接頭進(jìn)行甲基化的步驟; 任選地,將所述具有粘性末端A的DNA片段與甲基化接頭相連是利用T4DNA連接酶進(jìn)行的; 任選地,在獲得連接產(chǎn)物后,進(jìn)一步包括對(duì)連接產(chǎn)物進(jìn)行純化的步驟; 任選地,所述特異性探針是對(duì)已知甲基化位點(diǎn)特異性的,優(yōu)選所述特異性探針是基于采用人類基因組作為參考序列,并且采用已知具有甲基化位點(diǎn)的基因區(qū)域作為靶序列而設(shè)計(jì)的,可選地,所述已知具有甲基化位點(diǎn)的基因區(qū)域包括選自啟動(dòng)子區(qū)域、CpG島區(qū)域、CpG島外區(qū)域以及印記基因區(qū)域的至少一種; 任選地,在所述雜交捕獲前,進(jìn)一步包括利用^t-1DNA和接頭封閉序列分別對(duì)所述連接產(chǎn)物和所述連接產(chǎn)物上的甲基化接頭進(jìn)行雜交封閉的步驟,優(yōu)選采用過量的^t-1DNA對(duì)所述連接產(chǎn)物進(jìn)行雜交封閉,可選地,所述接頭封閉序列包括選自Blockl和Block2的至少一種; 任選地,采用I μ g的連接產(chǎn)物進(jìn)行所述雜交捕獲;任選地,利用特異性探針對(duì)所述連接產(chǎn)物進(jìn)行雜交捕獲進(jìn)一步包括利用鏈霉素磁珠捕獲所述目的片段; 任選地,在將所述目的片段進(jìn)行重亞硫酸鹽處理之前,進(jìn)一步包括將所述目的片段與片段化的λ -DNA混合,優(yōu)選所述片段化的λ -DNA的量為200-400ng,更優(yōu)選200ng ; 任選地,將所述目的片段進(jìn)行重亞硫酸鹽處理是采用EZ DNA Methylation-GoldKit (ZYMO)進(jìn)行的; 任選地,使用熱啟動(dòng)taq DNA聚合酶進(jìn)行所述PCR擴(kuò)增; 任選地,分離純化所述擴(kuò)增產(chǎn)物是通過選自磁珠純化、純化柱純化和2%的瓊脂糖凝膠電泳的至少一種進(jìn)行的,優(yōu)選通過2%的瓊脂糖凝膠電泳進(jìn)行; 任選地,所述高通量測(cè)序文庫的文庫片段長度為300-450bp。
2.一種確定樣本的基因組特定區(qū)域的甲基化信息的方法,其特征在于,包括下列步驟: 根據(jù)權(quán)利要求1所述的方法構(gòu)建所述樣本的基因組特定區(qū)域的高通量測(cè)序文庫; 對(duì)所述樣本的基因組特定區(qū)域的高通量測(cè)序文庫進(jìn)行測(cè)序,以便得到測(cè)序結(jié)果;以及 對(duì)所述測(cè)序結(jié)果進(jìn)行數(shù)據(jù)分析,以便確定所述樣本的基因組特定區(qū)域的甲基化信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述測(cè)序是利用高通量測(cè)序技術(shù)進(jìn)行的。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述測(cè)序是利用Hiseq2000測(cè)序儀進(jìn)行的。
5.一種用于確定樣本的基因組特定區(qū)域的甲基化信息的裝置,其特征在于,包括: 文庫制備單元,所述文庫制備單元用于制備樣本的基因組特定區(qū)域的高通量測(cè)序文庫,所述文庫制備單元內(nèi)設(shè)置有特異性探針; 測(cè)序單元,所述測(cè)序單元與所述文庫制備單元相連,并且從所述文庫制備單元接收所述樣本的基因組特定區(qū)域的高通量測(cè)序文庫,以便用于對(duì)所述樣本的基因組特定區(qū)域的高通量測(cè)序文庫進(jìn)行測(cè)序,獲得測(cè)序結(jié)果;以及 數(shù)據(jù)分析單元,所述數(shù)據(jù)分析單元與所述測(cè)序單元相連,并且從所述測(cè)序單元接收所述測(cè)序結(jié)果,以便對(duì)所述測(cè)序結(jié)果進(jìn)行數(shù)據(jù)分析,確定所述樣本的基因組特定區(qū)域的甲基化信息。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述特異性探針是對(duì)已知甲基化位點(diǎn)特異性的。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述特異性探針是基于采用人類基因組作為參考序列,并且采用已知具有甲基化位點(diǎn)的基因區(qū)域作為靶序列而設(shè)計(jì)的。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述已知具有甲基化位點(diǎn)的基因區(qū)域包括選自啟動(dòng)子區(qū)域、CpG島區(qū)域、CpG島外區(qū)域以及印記基因區(qū)域的至少一種。
9.一種用于構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫的試劑盒,其特征在于,包括: 特異性探針,所述特異性探針是對(duì)已知甲基化位點(diǎn)特異性的。
10.根據(jù)權(quán)利要求9所述的試劑盒,其特征在于,所述特異性探針是基于采用人類基因組作為參考序列,并且采用已知具有甲基化位點(diǎn)的基因區(qū)域作為靶序列而設(shè)計(jì)的,可選地,所述已知具有甲基化位點(diǎn)的基因區(qū)域包括選自啟動(dòng)子區(qū)域、CpG島區(qū)域、CpG島外區(qū)域以及印記基因區(qū)域的至少一種 。
全文摘要
提供了高通量測(cè)序文庫的構(gòu)建方法及其應(yīng)用。構(gòu)建高通量測(cè)序文庫的方法包括將基因組DNA片段化;將DNA片段進(jìn)行末端修復(fù);在經(jīng)過末端修復(fù)的DNA片段的3’末端添加堿基A;將具有粘性末端A的DNA片段與甲基化接頭相連;利用特異性探針對(duì)所述連接產(chǎn)物進(jìn)行雜交捕獲,以便獲得目的片段;將所述目的片段進(jìn)行重亞硫酸鹽處理,以便將所述目的片段中非甲基化的胞嘧啶轉(zhuǎn)換為尿嘧啶;將經(jīng)過轉(zhuǎn)換的目的片段進(jìn)行PCR擴(kuò)增;分離純化擴(kuò)增產(chǎn)物,該擴(kuò)增產(chǎn)物構(gòu)成高通量測(cè)序文庫。采用本發(fā)明的構(gòu)建高通量測(cè)序文庫的方法及其應(yīng)用,能夠方便有效地構(gòu)建樣本的基因組特定區(qū)域的高通量測(cè)序文庫。
文檔編號(hào)C40B40/06GK103103624SQ20111036203
公開日2013年5月15日 申請(qǐng)日期2011年11月15日 優(yōu)先權(quán)日2011年11月15日
發(fā)明者王君文, 高飛, 蔣慧, 武靖華, 吳紅龍 申請(qǐng)人:深圳華大基因科技有限公司, 深圳華大基因研究院