最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

適用于多樣本的擴(kuò)增子文庫(kù)構(gòu)建的引物、擴(kuò)增子文庫(kù)及其構(gòu)建方法

文檔序號(hào):8375970閱讀:1063來源:國(guó)知局
適用于多樣本的擴(kuò)增子文庫(kù)構(gòu)建的引物、擴(kuò)增子文庫(kù)及其構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及高通量測(cè)序領(lǐng)域,具體而言,涉及一種適用于多樣本的擴(kuò)增子文庫(kù)構(gòu) 建的引物、擴(kuò)增子文庫(kù)及其構(gòu)建方法。
【背景技術(shù)】
[0002] 擴(kuò)增子測(cè)序是對(duì)特定長(zhǎng)度的PCR產(chǎn)物或者捕獲的片段進(jìn)行測(cè)序,主要包括16S rDNA測(cè)序、18SrDNA測(cè)序、ITS測(cè)序及功能基因檢測(cè)等。采用illuminaMiSeq第二代高通 量測(cè)序平臺(tái)測(cè)定的16S/18S/ITS某個(gè)高變區(qū)域的序列,來反應(yīng)環(huán)境樣品在細(xì)菌、真菌、古菌 分類方面物種之間的差異,對(duì)研宄海洋、土壤、腸道糞便等環(huán)境中的微生物構(gòu)成有重要的指 導(dǎo)作用;同樣,也可通過對(duì)某些功能基因片段的測(cè)序,挖掘更多的生物學(xué)信息。
[0003] 16SrDNA是編碼細(xì)菌核糖體小亞基的DNA序列,分子大小約1540bp,由9個(gè)可變 區(qū)和10個(gè)保守區(qū)交叉排列組成。保守區(qū)能反映物種間親緣關(guān)系,可變區(qū)在不同菌種間存在 差異。根據(jù)保守區(qū)序列設(shè)計(jì)引物,將可變區(qū)擴(kuò)增出來進(jìn)行測(cè)序,通過測(cè)序數(shù)據(jù)與相應(yīng)數(shù)據(jù)庫(kù) 的比對(duì),即可確定微生物在進(jìn)化樹中的位置,從而鑒定樣本中可能存在的細(xì)菌種類。研宄表 明,V4靶基因區(qū)域(約300bp)對(duì)微生物進(jìn)行分類較為準(zhǔn)確。
[0004] ITS1是位于真核生物的18SrRNA和5. 8SrRNA之間的內(nèi)轉(zhuǎn)錄區(qū)域,ITS2位于真核 生物的5. 8SrRNA和28SrRNA之間的內(nèi)轉(zhuǎn)錄區(qū)域。由于進(jìn)化相對(duì)于18SrRNA、5. 8SrRNA 和28SrRNA迅速而具多態(tài)性,因而適合于等級(jí)水平較低的系統(tǒng)學(xué)研宄。根據(jù)保守區(qū)序列設(shè) 計(jì)引物,將其擴(kuò)增出來進(jìn)行測(cè)序,通過測(cè)序數(shù)據(jù)與相應(yīng)數(shù)據(jù)庫(kù)的比對(duì),即可確定微生物在進(jìn) 化樹中的位置,從而鑒定樣本中可能存在的真菌種類,是目前非常常見的分析真菌方法。
[0005] 微生物擴(kuò)增子區(qū)域的測(cè)序,首先是對(duì)目標(biāo)樣本進(jìn)行PCR擴(kuò)增,然后構(gòu)建適用于二 代測(cè)序平臺(tái)的文庫(kù)。目前現(xiàn)有的擴(kuò)增方法均為設(shè)計(jì)各菌株所通用的引物(即保守區(qū)擴(kuò)增 序列)對(duì)保守區(qū)進(jìn)行擴(kuò)增,由于16S、18S、ITS保守性較強(qiáng),不同菌種的差異性較低,序列相 似性較高,在測(cè)序過程中會(huì)影響測(cè)序儀的信噪比和簇成像,造成測(cè)序質(zhì)量差(Q20占60%~ 80%,Q20是指illumina的測(cè)序質(zhì)量,它是由Q= -101〇gl0(E)這個(gè)公式推導(dǎo)出來的,E代 表該堿基測(cè)序錯(cuò)誤率,如E= 0.01,那么Q值為20,同理可以算出E= 0.001,Q為30。那 么Q(20) = 80%代表在該測(cè)序結(jié)果中,堿基測(cè)序質(zhì)量在Q20以上的堿基數(shù)在總堿基數(shù)中 的比例為80%,也就說這個(gè)值越大越好),導(dǎo)致需要添加的平衡文庫(kù)高(占總文庫(kù)數(shù)量的 20% -50% )、有效數(shù)據(jù)量低(只有50% -70% )等缺點(diǎn)。
[0006] 因此,仍需要對(duì)現(xiàn)有的擴(kuò)增子文庫(kù)構(gòu)建方法進(jìn)行改進(jìn),以提高擴(kuò)增子文庫(kù)測(cè)序數(shù) 據(jù)的質(zhì)量和有效數(shù)據(jù)量。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明的主要目的在于提供一種適用于多樣本的擴(kuò)增子文庫(kù)構(gòu)建的引物、擴(kuò)增子 文庫(kù)及其構(gòu)建方法,以提高多樣本的擴(kuò)增子文庫(kù)測(cè)序數(shù)據(jù)的質(zhì)量和有效數(shù)據(jù)量。
[0008] 為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種適用于多樣本的擴(kuò)增子 文庫(kù)構(gòu)建的引物,該引物包括錯(cuò)位堿基序列和保守區(qū)擴(kuò)增序列;錯(cuò)位堿基序列是一個(gè)或多 個(gè)堿基排列形成的序列,且當(dāng)多樣本的數(shù)量小于4時(shí),多樣本的錯(cuò)位堿基序列在相同位置 上的堿基的類型各不相同;當(dāng)多樣本的數(shù)量為4n,且n為大于等于1的自然數(shù)時(shí),多樣本的 錯(cuò)位堿基序列在相同位置上的堿基類型為A、T、C和G均勻分布;當(dāng)多樣本的數(shù)量為4n+m, 且n為大于等于1的自然數(shù),m為1、2或3時(shí),其中,多樣本中的4n個(gè)樣本的錯(cuò)位堿基序列 在相同位置上的堿基類型為A、T、C和G均勻分布;剩余m個(gè)樣本的錯(cuò)位堿基序列在相同位 置上的堿基類型按照m的不同分別為A、T、C和G中的任意1種、2種或3種。
[0009] 進(jìn)一步地,錯(cuò)位堿基序列中堿基的數(shù)目小于等于5。
[0010] 進(jìn)一步地,當(dāng)多樣本的數(shù)量小于等于5時(shí),任意兩個(gè)樣本之間的錯(cuò)位堿基序序列 中的堿基的數(shù)目至少相差1個(gè)。
[0011] 進(jìn)一步地,當(dāng)多樣本的數(shù)量大于5時(shí),至少兩個(gè)樣本的錯(cuò)位堿基序序列中的堿基 數(shù)目相同。
[0012] 進(jìn)一步地,引物還包括樣本標(biāo)簽序列,樣本標(biāo)簽序列為6~12個(gè)堿基隨機(jī)排列所 形成的序列。
[0013] 進(jìn)一步地,引物為16SV4、18SV4或ITS1多樣本擴(kuò)增子文庫(kù)構(gòu)建的引物;當(dāng)引物 為16SV4多樣本擴(kuò)增子文庫(kù)構(gòu)建的引物時(shí),引物包括:16SV4正向序列:SEQIDNO:l、SEQ IDNO:2、SEQIDNO:3、SEQIDNO:4和SEQIDNO:5 ;16SV4反向序列:SEQIDNO:6、SEQ IDNO:7、SEQIDNO:8、SEQIDNO:9 和SEQIDNO: 10 ;當(dāng)引物為 18SV4 多樣本擴(kuò)增子文 庫(kù)構(gòu)建的引物時(shí),引物包括:18SV4正向序列:SEQIDNO:11、SEQIDNO:12、SEQIDNO: 13、SEQIDN0:14 和SEQIDN0:15;18SV4 反向序列:SEQIDN0:16、SEQIDN0:17、SEQ IDNO:18、SEQIDNO:19和SEQIDNO:20 ;當(dāng)引物為ITS1多樣本擴(kuò)增子文庫(kù)構(gòu)建的引物 時(shí),引物包括:ITS1 正向序列:SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO: 24和SEQIDN0:25;ITS1 反向序列:SEQIDN0:26、SEQIDN0:27、SEQIDN0:28、SEQID NO:29 和SEQIDNO:30。
[0014] 為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種多樣本的擴(kuò)增子文庫(kù)的 構(gòu)建方法,該構(gòu)建方法包括:利用目標(biāo)區(qū)域擴(kuò)增引物分別對(duì)多個(gè)不同樣本的目標(biāo)區(qū)域進(jìn)行 擴(kuò)增,得到多個(gè)樣本的目標(biāo)片段;對(duì)多個(gè)樣本的目標(biāo)片段進(jìn)行接頭連接,得到多樣本的擴(kuò)增 子文庫(kù);其中,目標(biāo)區(qū)域擴(kuò)增引物為上述任一種引物;或者目標(biāo)區(qū)域擴(kuò)增引物為上述任一 種引物和由樣本標(biāo)簽序列和保守區(qū)擴(kuò)增序列組成的引物。
[0015] 進(jìn)一步地,當(dāng)目標(biāo)區(qū)域擴(kuò)增引物為上述任一種引物和由樣本標(biāo)簽序列和保守區(qū)擴(kuò) 增序列組成的引物時(shí),多樣本的擴(kuò)增子文庫(kù)中含有0~5個(gè)堿基排列形成的錯(cuò)位堿基序列。
[0016] 進(jìn)一步地,接頭連接的步驟中,在多個(gè)樣本的目標(biāo)片段兩端分別連上P5和P7接 頭,得到多樣本的擴(kuò)增子文庫(kù)。
[0017] 根據(jù)本發(fā)明的又一個(gè)方面,提供了一種多樣本的擴(kuò)增子文庫(kù),該擴(kuò)增子文庫(kù)采用 上述任一種構(gòu)建方法構(gòu)建而成。
[0018] 應(yīng)用本發(fā)明的技術(shù)方案,通過在現(xiàn)有技術(shù)的通用引物的基礎(chǔ)上,在其前面增加1 個(gè)或多個(gè)錯(cuò)位堿基,使得所構(gòu)建的文庫(kù)在讀取多個(gè)樣本的目標(biāo)擴(kuò)增片段時(shí),從不同的堿基 位置開始讀取其保守區(qū)擴(kuò)增序列,減少了將多個(gè)樣本的保守區(qū)域的相同堿基同時(shí)讀取的概 率;因而,更容易分辨不同樣本來源的序列相似較高的序列,提高了測(cè)序質(zhì)量;同時(shí)由于擴(kuò) 增片段本身在相同位置處的堿基類型相對(duì)均勻分布,更提高了保守區(qū)擴(kuò)增序列的多樣性, 減少了平衡文庫(kù)的占比,使得所得測(cè)序數(shù)據(jù)中目標(biāo)片段的數(shù)據(jù)占比提高,即有效數(shù)據(jù)量得 到提尚。
【附圖說明】
[0019] 構(gòu)成本申請(qǐng)的一部分的說明書附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示 意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0020] 圖1示出了根據(jù)本發(fā)明的優(yōu)選實(shí)施例中適用于多樣本的擴(kuò)增子文庫(kù)構(gòu)建的引物 的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0021] 需要說明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相 互組合。下面將結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。
[0022] 現(xiàn)有技術(shù)中在利用通用的保守區(qū)擴(kuò)增序列擴(kuò)增來源不同的樣本時(shí),由于樣本間的 序列相似性較高,在測(cè)序時(shí)存在測(cè)序質(zhì)量差、有效數(shù)據(jù)量低等缺陷。為改善這一缺陷,在本 發(fā)明一種典型的實(shí)施方式中,提供了一種適用于多樣本的擴(kuò)增子文庫(kù)構(gòu)建的引物,該引物 包括錯(cuò)位堿基序列和保守區(qū)擴(kuò)增序列;錯(cuò)位堿基序列是一個(gè)或多個(gè)堿基排列形成的序列, 且當(dāng)多樣本的數(shù)量小于4時(shí),多樣本的錯(cuò)位堿基序列在相同位置上的堿基的類型各
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1