專利名稱:合成編碼文庫的方法
合成編碼文庫的方法本申請是申請日為2004年12月17日、申請?zhí)枮?00480037850. 3、發(fā)明名稱為“合 成編碼文庫的方法”的發(fā)明專利申請的分案申請。相關(guān)申請本申請要求2003年12月17日提交的美國臨時(shí)專利申請系列號60/530854、2004 年1月30日提交的美國臨時(shí)專利申請系列號60/540681、2004年3月15日提交的美國 臨時(shí)專利申請系列號60/553,715和2004年7月16日提交的美國臨時(shí)專利申請系列號 60/588,672的優(yōu)先權(quán),這些專利的全部內(nèi)容均在此弓|入作為參考。
背景技術(shù):
探索鑒定具有有用生物活性的化合物的更有效方法,導(dǎo)致發(fā)展了篩選大量不同化 合物的方法,這些化合物存在于被稱為組合文庫的集合中。這樣的文庫可含有105種或更 多不同的化合物。有許多方法用于產(chǎn)生組合文庫,并且已經(jīng)報(bào)道了肽、擬肽和有機(jī)小分子的 組合合成。組合方法應(yīng)用于藥物發(fā)現(xiàn)的兩個(gè)主要挑戰(zhàn)是非常復(fù)雜的文庫的合成和在所用篩 選中有活性的分子的鑒定。通常知道文庫的復(fù)雜程度越高,即文庫中存在的不同結(jié)構(gòu)的數(shù) 量越多,該文庫含有具有目標(biāo)活性的分子的可能性就越大。因此,文庫合成中使用的化學(xué)方 法必須能夠在合理時(shí)間范圍內(nèi)生成大量化合物。但是對于給定的克式濃度和總濃度來說, 提高文庫內(nèi)不同成員的數(shù)目降低了任何特定文庫成員的濃度。這使得從高復(fù)雜性文庫中鑒 定活性分子變得復(fù)雜??朔@些障礙的一種方法是發(fā)展編碼文庫,特別是其中每個(gè)化合物均包含可擴(kuò)增 標(biāo)簽的文庫。這樣的文庫包括DNA-編碼文庫,其中用于識別文庫成員的DNA標(biāo)簽?zāi)軌蛴梅?子生物學(xué)技術(shù)如聚合酶鏈反應(yīng)擴(kuò)增。但是,這些方法在產(chǎn)生很大文庫中的應(yīng)用尚未得到證 明,顯然,為了實(shí)現(xiàn)該方法用于藥物發(fā)現(xiàn)的可能性,需要改進(jìn)產(chǎn)生這種文庫的方法。發(fā)明概述本發(fā)明提供一種合成包含編碼寡核苷酸標(biāo)簽的分子文庫的方法。該方法使用“分 離-組合”策略,其中將含有起始物的溶液分成(“分離”)多個(gè)部分,該起始物包括連接有 一編碼寡核苷酸的第一結(jié)構(gòu)單元(buildingblock)。在每個(gè)部分中,起始物與獨(dú)特的第二 結(jié)構(gòu)單元和標(biāo)識該第二結(jié)構(gòu)單元的獨(dú)特的第二寡核苷酸反應(yīng)。這些反應(yīng)可以同時(shí)或相繼進(jìn) 行,如果是相繼進(jìn)行,則任一反應(yīng)都可以在另一反應(yīng)之前。將每個(gè)部分中產(chǎn)生的二聚體分 子合并(“組合”),然后再分為多個(gè)部分。這些部分中的每一個(gè)然后與獨(dú)特(每部分特異 性)的第三結(jié)構(gòu)單元和編碼(標(biāo)識)該結(jié)構(gòu)單元的獨(dú)特的第三寡核苷酸反應(yīng)。產(chǎn)物文庫中 存在的獨(dú)特分子的數(shù)目是以下數(shù)值的函數(shù)(1)在合成的每一步使用的不同結(jié)構(gòu)單元的數(shù) 目,和(2)組合和分離步驟的重復(fù)次數(shù)。在一個(gè)實(shí)施方案中,本發(fā)明提供一種合成分子的方法,該分子包含或由與編碼寡 核苷酸可操作連接的功能部分組成。該方法包括下列步驟(1)提供由包含n個(gè)結(jié)構(gòu)單元 的功能部分組成的起始化合物,其中n是1或大于1的整數(shù),其中該功能部分含有至少一個(gè) 反應(yīng)基團(tuán),并且其中該功能部分與起始寡核苷酸可操作連接;(2)將該起始化合物與包含至少一個(gè)互補(bǔ)反應(yīng)基團(tuán)的結(jié)構(gòu)單元反應(yīng),其中該至少一個(gè)互補(bǔ)反應(yīng)基團(tuán)與步驟(1)的反應(yīng) 基團(tuán)互補(bǔ),反應(yīng)條件適合所述反應(yīng)基團(tuán)與互補(bǔ)反應(yīng)基團(tuán)反應(yīng)形成共價(jià)鍵;(3)將起始寡核 苷酸與標(biāo)識步驟(b)的結(jié)構(gòu)單元的引入寡核苷酸反應(yīng),反應(yīng)條件適合所述引入寡核苷酸與 起始寡核苷酸連接,并存在催化所述起始寡核苷酸與引入寡核苷酸連接的酶,從而產(chǎn)生包 含功能部分或由該功能部分組成的分子,該功能部分含有n+1個(gè)結(jié)構(gòu)單元,并且與編碼寡 核苷酸可操作連接。如果步驟(3)的功能部分包含反應(yīng)基團(tuán),則步驟1-3可以重復(fù)一次或 多次,從而形成循環(huán)1至i,其中i是2或大于2的整數(shù),循環(huán)s的步驟⑶的產(chǎn)物成為循環(huán) s+1的起始化合物,其中s是i_l或更小的整數(shù)。在一個(gè)實(shí)施方案中,本發(fā)明提供一種合成化合物文庫的方法,其中化合物包含功 能部分,該功能部分包含兩個(gè)或更多的結(jié)構(gòu)單元,并且與標(biāo)識該功能部分結(jié)構(gòu)的寡核苷酸 可操作連接。該方法包括下列步驟(1)提供包含m種起始化合物的溶液,其中m是1或大 于1的整數(shù),其中起始化合物由包含n個(gè)結(jié)構(gòu)單元的功能部分組成,其中n是1或大于1的 整數(shù),該功能部分與識別該n個(gè)結(jié)構(gòu)單元的起始寡核苷酸可操作連接;(2)將步驟(1)的溶 液分成r個(gè)部分,其中r是2或大于2的整數(shù);(3)每個(gè)部分中的起始化合物與r個(gè)結(jié)構(gòu)單 元之一反應(yīng),從而產(chǎn)生r個(gè)部分,包含由與起始寡核苷酸可操作連接的功能部分組成的化 合物,該功能部分包含n+1個(gè)結(jié)構(gòu)單元;(4)每個(gè)部分中的起始寡核苷酸與一組r個(gè)不同引 入寡核苷酸之一反應(yīng),反應(yīng)條件適合所述引入寡核苷酸與起始寡核苷酸進(jìn)行酶連接,并存 在催化所述引入寡核苷酸與起始寡核苷酸連接的酶,從而產(chǎn)生r個(gè)等份,包含由與延長的 寡核苷酸可操作連接的功能部分組成的分子,該功能部分包含n+1個(gè)結(jié)構(gòu)單元,該延長的 寡核苷酸編碼(標(biāo)識)該n+1個(gè)結(jié)構(gòu)單元。任選地,該方法可進(jìn)一步包括步驟(5)重新組 合步驟(4)產(chǎn)生的r個(gè)部分,從而產(chǎn)生包含由功能部分組成的化合物的溶液,該功能部分包 含n+1個(gè)結(jié)構(gòu)單元并且與延長的寡核苷酸可操作連接。步驟(1)至(5)可以進(jìn)行一次或多 次,產(chǎn)生循環(huán)1至i,其中i是2或大于2的整數(shù)。在循環(huán)s+1中,其中s是i_l或更小的整 數(shù),步驟(1)的含有m種起始化合物的溶液是循環(huán)s的步驟(5)的溶液。同樣,循環(huán)s+1的 步驟(1)的起始化合物是循環(huán)s的步驟(5)的化合物。在一個(gè)優(yōu)選實(shí)施方案中,在每一步驟中用常規(guī)化學(xué)反應(yīng)偶聯(lián)結(jié)構(gòu)單元。結(jié)構(gòu)單元 可以偶聯(lián)產(chǎn)生直鏈或分支聚合物或低聚物,如肽、擬肽和類肽,或非低聚物分子,如包含連 接有一個(gè)或多個(gè)其他化學(xué)部分的支架結(jié)構(gòu)的分子。例如,如果結(jié)構(gòu)單元是氨基酸殘基,則該 結(jié)構(gòu)單元可以用標(biāo)準(zhǔn)肽合成方法偶聯(lián),如本領(lǐng)域公知的應(yīng)用適當(dāng)保護(hù)/脫保護(hù)策略的溶液 相或固相合成。優(yōu)選地,結(jié)構(gòu)單元采用溶液相化學(xué)法偶聯(lián)。編碼寡核苷酸是單鏈或雙鏈寡 核苷酸,優(yōu)選雙鏈寡核苷酸。編碼寡核苷酸優(yōu)選是每個(gè)結(jié)構(gòu)單元有4-12個(gè)堿基或堿基對的 寡核苷酸;編碼寡核苷酸可以利用標(biāo)準(zhǔn)溶液相或固相寡核苷酸合成法偶聯(lián),但是優(yōu)選利用 溶液相酶法偶聯(lián)。例如,如果編碼寡核苷酸的序列包含用于用一種這樣的酶進(jìn)行連接的起 始序列的話,則該寡核苷酸可以利用拓?fù)洚悩?gòu)酶、連接酶或DNA聚合酶偶聯(lián)。編碼寡核苷酸 的酶偶聯(lián)具有以下優(yōu)點(diǎn)⑴比標(biāo)準(zhǔn)合成(非酶)偶聯(lián)更高的添加精確度;和⑵應(yīng)用更簡 單的保護(hù)/脫保護(hù)策略。另一方面,本發(fā)明提供式I的化合物 其中X是包含一個(gè)或多個(gè)結(jié)構(gòu)單元的功能部分;Z是在其3’末端與B連接的寡 核苷酸;Y是在其5’末端與C連接的寡核苷酸;A是與X形成共價(jià)鍵的官能團(tuán);B是與Z的 3’ -末端形成鍵的官能團(tuán);C是與Y的5’ -末端形成鍵的官能團(tuán);D、F和E各自獨(dú)立地是雙 功能連接基團(tuán);且S是原子或分子支架。這樣的化合物包括應(yīng)用本發(fā)明的方法合成的那些 化合物。本發(fā)明進(jìn)一步涉及一種化合物文庫,其包含含有功能部分的化合物,該功能部分 包含兩個(gè)或多個(gè)結(jié)構(gòu)單元,并且與編碼該功能部分結(jié)構(gòu)的寡核苷酸可操作連接。這樣的文 庫可包含約102至約1012或更多種不同的成員,例如102、103、104、105、106、107、108、109、1010、 10"、1012或更多不同的成員,即不同的分子結(jié)構(gòu)。在一個(gè)實(shí)施方案中,該化合物文庫包含各自獨(dú)立地為式I的化合物 其中X是包含一個(gè)或多個(gè)結(jié)構(gòu)單元的功能部分;Z是在其3’末端與B連接的寡 核苷酸;Y是在其5’末端與C連接的寡核苷酸;A是與X形成共價(jià)鍵的官能團(tuán);B是與Z的 3’ -末端形成鍵的官能團(tuán);C是與Y的5’ -末端形成鍵的官能團(tuán);D、F和E各自獨(dú)立地是雙 功能連接基團(tuán);且S是原子或分子支架。這樣的文庫包括應(yīng)用本發(fā)明的方法合成的那些文庫。另一方面,本發(fā)明提供一種鑒定與生物靶標(biāo)結(jié)合的化合物的方法,該方法包括以 下步驟(a)使該生物靶標(biāo)接觸本發(fā)明的化合物文庫,其中該化合物文庫包括含有功能部 分的化合物,該功能部分包含兩個(gè)或多個(gè)結(jié)構(gòu)單元,并且與編碼該功能部分結(jié)構(gòu)的寡核苷 酸可操作連接。該步驟在適合化合物文庫的至少一個(gè)成員與該靶標(biāo)結(jié)合的條件下進(jìn)行;(2) 除去不與該靶標(biāo)結(jié)合的文庫成員;(3)擴(kuò)增能與該靶標(biāo)結(jié)合的化合物文庫至少一個(gè)成員的 編碼寡核苷酸;(4)對步驟(3)的編碼寡核苷酸進(jìn)行測序;和利用步驟(5)測定的序列確定 能與該生物靶標(biāo)結(jié)合的化合物文庫成員的功能部分的結(jié)構(gòu)。本發(fā)明在鑒定具有所需性質(zhì)的分子方面具有幾個(gè)優(yōu)點(diǎn)。例如,本發(fā)明的方法允許 在寡核苷酸標(biāo)簽的存在下使用許多化學(xué)反應(yīng)來構(gòu)建分子。本發(fā)明的方法也提供了向這樣產(chǎn)生的化學(xué)結(jié)構(gòu)中引入寡核苷酸標(biāo)簽的高保真度手段。另外,它們能夠合成每個(gè)成員具有高 拷貝數(shù)的文庫,從而允許對生物靶標(biāo)進(jìn)行多輪篩選,而在最后一輪后剩余足夠數(shù)量的分子 用于寡核苷酸標(biāo)簽的擴(kuò)增和測序。附圖簡述
圖1是雙鏈寡核苷酸的連接的示意圖,其中起始寡核苷酸具有與引入寡核苷酸的 突出端互補(bǔ)的突出端。起始鏈顯示為游離的、與氨基己基連接體偶聯(lián)的或通過氨基己基連 接體與苯丙氨酸殘基偶聯(lián)的。圖2是使用夾板(splint)鏈進(jìn)行寡核苷酸連接的示意圖。在該實(shí)施方案中,夾板 是12-mer的寡核苷酸,其序列與單鏈起始寡核苷酸和單鏈引入寡核苷酸互補(bǔ)。圖3是當(dāng)起始寡核苷酸是具有共價(jià)連接鏈的雙鏈,并且引入寡核苷酸是雙鏈時(shí), 起始寡核苷酸與引入寡核苷酸連接的示意圖。圖4是使用聚合酶延長寡核苷酸的示意圖。起始鏈表示為游離的、與氨基己基連 接體偶聯(lián)的或通過氨基己基連接體與苯丙氨酸殘基偶聯(lián)的。圖5是本發(fā)明的一個(gè)實(shí)施方案的合成循環(huán)的示意圖。圖6是應(yīng)用本發(fā)明的文庫進(jìn)行多輪篩選過程的示意圖。圖7是實(shí)施例1所述循環(huán)1至5中每一個(gè)的產(chǎn)物以及在封閉引物連接后的產(chǎn)物的 電泳凝膠。分子量標(biāo)準(zhǔn)顯示于泳道1,用于DNA定量的hyperladder的指定量顯示于泳道9 至12中。圖8是利用疊氮化物_炔環(huán)加成作用偶聯(lián)結(jié)構(gòu)單元的示意圖。圖9和10說明通過氯代三嗪上的親核芳族取代偶聯(lián)結(jié)構(gòu)單元。圖11顯示適合在功能部分合成中使用的代表性氯代雜芳環(huán)結(jié)構(gòu)。圖12說明應(yīng)用疊氮化物/炔環(huán)加成反應(yīng)環(huán)化直鏈肽。圖13A是如實(shí)施例2所述在循環(huán)4之后產(chǎn)生的文庫的層析圖。圖13B是如實(shí)施例2所述在循環(huán)4之后產(chǎn)生的文庫的質(zhì)譜圖。發(fā)明詳述本發(fā)明涉及制備化合物和組合化合物文庫的方法,通過本發(fā)明的方法制備的化合 物和文庫,和利用該文庫鑒定具有所需性質(zhì)如所需生物活性的化合物的方法。本發(fā)明進(jìn)一 步涉及應(yīng)用這些方法鑒定的化合物。已經(jīng)應(yīng)用了多種方法來產(chǎn)生和篩查組合化學(xué)文庫。例子包括將文庫的各成員彼此 物理分離的方法,例如當(dāng)在多個(gè)反應(yīng)容器的每一個(gè)中合成單一化合物時(shí)。但是,這些文庫一 般一次篩選一種化合物,或者最多一次篩選幾種化合物,因此不能獲得最有效的篩選過程。 在另外一些方法中,在固體支持體上合成化合物。這樣的固體支持體包括芯片,其中特定化 合物占據(jù)芯片或膜上的特定區(qū)域(“可定位的”)。在另外一些方法中,在珠上合成化合物, 每個(gè)珠含有不同的化學(xué)結(jié)構(gòu)。在篩查大文庫時(shí)遇到的兩個(gè)困難是⑴可以篩選的不同化合物的數(shù)量;和⑵在 篩選中有活性的化合物的鑒定。在一種方法中,在篩選中有活性的化合物如下鑒定將原始 文庫縮小為更小的部分或亞部,在每種情況下都選擇含有活性化合物的部分或亞部,并且 進(jìn)一步再分,直到獲得含有一組化合物的足夠小的活性亞部,以致該亞部的所有成員能夠 單獨(dú)合成,并且評價(jià)所需的活性。這是一項(xiàng)單調(diào)的、費(fèi)時(shí)的工作。
解析組合文庫篩查結(jié)果的另外一種方法是利用這樣的文庫,其中該文庫的成員用 識別標(biāo)簽進(jìn)行標(biāo)記,即,該文庫中存在的每個(gè)標(biāo)簽都與該文庫中存在的不同化合物結(jié)構(gòu)相 關(guān),因此該標(biāo)簽的識別指出了標(biāo)記分子的結(jié)構(gòu)。一種標(biāo)記文庫方法使用寡核苷酸標(biāo)簽,如 美國專利號 5,573,905 ;5,708,153 ;5,723,598,6,060,596,公開的 PCT 申請 TO 93/06121 ; W093/20242 ;W0 94/13623 ;W0 00/23458 ;W0 02/074929 和 W002/103008, Brenner 和 Lerner (Proc. Natl. Acad. Sci. USA 89,5381-5383(1992) ;Nielsen 禾口 Janda(Methods :A Companion to Methods inEnzymology 6,361-371 (1994) ;Nielsen,Brenner 禾口 Janda(J. Am. Chem. Soc. 115,9812-9813 (1993))所述,這些文獻(xiàn)均在此全文引用作為參考。這樣的標(biāo) 簽可以利用如聚合酶鏈反應(yīng)擴(kuò)增,產(chǎn)生多個(gè)標(biāo)簽拷貝,并且通過測序鑒定該標(biāo)簽。標(biāo)簽的序 列確定了結(jié)合分子的結(jié)構(gòu),這些分子可以以純的形式合成并且檢測。迄今為止,還沒有報(bào)道 使用Lerner等人公開的方法制備大文庫。本發(fā)明提供了產(chǎn)生DNA-編碼文庫的方法的改 進(jìn),以及利用溶液相合成法合成功能部分的DNA編碼分子大(105個(gè)成員或更多)文庫的首 批實(shí)例。本發(fā)明提供了一種方法,該方法允許容易地合成寡核苷酸編碼的組合文庫,并且 提供向大分子集合的每個(gè)成員上添加這種寡核苷酸標(biāo)簽的有效、高保真的手段。本發(fā)明的方法包括合成雙功能分子的方法,該雙功能分子包含由結(jié)構(gòu)單元組成的 第一部分(“功能部分”),和與第一部分可操作連接的第二部分,第二部分包含標(biāo)識第一 部分的結(jié)構(gòu)的寡核苷酸標(biāo)簽,即該寡核苷酸標(biāo)簽指示在第一部分構(gòu)建中使用了哪些結(jié)構(gòu)單 元,以及結(jié)構(gòu)單元連接的順序。通常,寡核苷酸標(biāo)簽提供的信息足以確定用來構(gòu)建活性部分 的結(jié)構(gòu)單元。在某些實(shí)施方案中,寡核苷酸標(biāo)簽的序列足以確定功能部分中結(jié)構(gòu)單元的排 列,例如,對于擬肽,為氨基酸序列。如此處所用的術(shù)語“功能部分”是指包含一個(gè)或多個(gè)結(jié)構(gòu)單元的化學(xué)部分。優(yōu)選 地,功能部分中的結(jié)構(gòu)單元不是核酸。功能部分可以是直鏈或支鏈或環(huán)形的聚合物或寡聚 物或有機(jī)小分子。如此處所用的術(shù)語“結(jié)構(gòu)單元”是與其他化學(xué)結(jié)構(gòu)單位連接的,或者能夠與其他這 樣的單位連接的化學(xué)結(jié)構(gòu)單位。當(dāng)功能部分是多聚的或寡聚的時(shí),結(jié)構(gòu)單元是聚合物或寡 聚物的單體單元。結(jié)構(gòu)單元也可以包括支架結(jié)構(gòu)(“支架結(jié)構(gòu)單元”),支架結(jié)構(gòu)上連接有 或者可以連接一個(gè)或多個(gè)其他的結(jié)構(gòu)(“周圍結(jié)構(gòu)單元”)。應(yīng)當(dāng)理解,此處使用的術(shù)語“結(jié)構(gòu)單元”是指存在于功能部分中的,也指以反應(yīng)性 形式用于合成功能部分的化學(xué)結(jié)構(gòu)單位。在功能部分內(nèi),結(jié)構(gòu)單元不含由于將該結(jié)構(gòu)單元 摻入功能部分中而丟失的結(jié)構(gòu)單元的任何部分。例如,在鍵形成反應(yīng)釋放小分子的情況中 (見下文),存在于功能部分中的結(jié)構(gòu)單元是“結(jié)構(gòu)單元?dú)埢?,即,在貢獻(xiàn)釋放分子的原子 丟失后在合成中使用的結(jié)構(gòu)單元的剩余部分。結(jié)構(gòu)單元可以是互補(bǔ)的任何化學(xué)化合物,即結(jié)構(gòu)單元必須能夠一起反應(yīng),形成含 有兩個(gè)或多個(gè)結(jié)構(gòu)單元的結(jié)構(gòu)。一般地說,使用的所有結(jié)構(gòu)單元都具有至少兩個(gè)反應(yīng)基團(tuán), 盡管也可能有一些使用的結(jié)構(gòu)單元(例如在寡聚功能部分中的最后一個(gè)結(jié)構(gòu)單元)各自只 含有一個(gè)反應(yīng)基團(tuán)。兩個(gè)不同結(jié)構(gòu)單元上的反應(yīng)基團(tuán)應(yīng)當(dāng)互補(bǔ),即,能夠一起反應(yīng)形成共價(jià) 鍵,任選地伴隨小分子如水、HC1、HF等的丟失。為了本目的,如果兩個(gè)反應(yīng)基團(tuán)能夠一起反應(yīng)形成共價(jià)鍵,則它們互補(bǔ)。在一個(gè)優(yōu)
15選實(shí)施方案中,鍵形成反應(yīng)在環(huán)境條件下快速發(fā)生,基本不形成副產(chǎn)物。優(yōu)選地,特定反應(yīng) 基團(tuán)將與特定互補(bǔ)反應(yīng)基團(tuán)反應(yīng)正好一次。在一個(gè)實(shí)施方案中,兩個(gè)結(jié)構(gòu)單元的互補(bǔ)反應(yīng) 基團(tuán)例如通過親核取代反應(yīng),形成共價(jià)鍵。在一個(gè)實(shí)施方案中,一對互補(bǔ)反應(yīng)基團(tuán)的一個(gè)成 員是親電子基團(tuán),而另一個(gè)成員是親核基團(tuán)?;パa(bǔ)親電子和親核基團(tuán)包括在適當(dāng)條件下通過親核取代反應(yīng)形成共價(jià)鍵的任 何兩個(gè)基團(tuán)。許多合適的鍵形成反應(yīng)在本領(lǐng)域中公知。參見,例如,March,Advanced Organic Chemistry,第四版,New York :JohnWiley and Sons (1992),第 10-16 章;Carey 禾口 Sundberg, Advanced OrganicChemistry, Part B, Plenum(1990),第 1—11 章;禾口 Collman 等,Principles andApplications of Organotransition Metal Chemistry, University ScienceBooks, Mill Valley, Calif. (1987),第 13-20 章;均在此全文引用作為參考。合 適的親電子基團(tuán)的例子包括反應(yīng)性羰基,如酰氯基,酯基,包括羰基五氟苯酯和琥珀酰亞胺 酯,酮基和醛基;反應(yīng)性磺酰基,如磺酰氯基,和反應(yīng)性膦酰基。其他親電子基團(tuán)包括末端環(huán) 氧基、異氰酸酯基和烷基鹵。合適的親核基團(tuán)包括伯氨基、仲氨基、羥基和羧基。合適的互補(bǔ)反應(yīng)基團(tuán)在下面描述。本領(lǐng)域技術(shù)人員能夠容易地確定可在本方法中 使用的其他反應(yīng)基團(tuán)對,此處提供的實(shí)例不是限制性的。在第一個(gè)實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括活化的羧基、反應(yīng)性磺酰基或反應(yīng)性膦 ?;蛩鼈兊慕M合,和伯氨基或仲氨基。在該實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)在適當(dāng)條件下反 應(yīng),形成酰胺、磺酰胺或磷酰胺鍵。在第二個(gè)實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括環(huán)氧基和伯氨基或仲氨基。含環(huán)氧化物 的結(jié)構(gòu)單元與含胺的結(jié)構(gòu)單元在適當(dāng)條件下反應(yīng),形成碳_氮鍵,生成0 _氨基醇。在另一個(gè)實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括吖丙啶基和伯氨基或仲氨基。在適當(dāng)條 件下,含吖丙啶的結(jié)構(gòu)單元與含胺的結(jié)構(gòu)單元反應(yīng),形成碳_氮鍵,生成1,2- 二胺。在第三 個(gè)實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括異氰酸酯基和伯氨基或仲氨基。含異氰酸酯的結(jié)構(gòu)單元 將與含胺的結(jié)構(gòu)單元在適當(dāng)條件下反應(yīng),形成碳_氮鍵,生成脲基。在第四個(gè)實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括異氰酸酯基和羥基。含異氰酸酯的結(jié)構(gòu) 單元將與含羥基的結(jié)構(gòu)單元在適當(dāng)條件下反應(yīng),形成碳_氧鍵,生成氨基甲酸酯基。在第五個(gè)實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括氨基和含羰基的基團(tuán),如醛基或酮基。胺 與這些基團(tuán)通過還原性胺化反應(yīng),形成新的碳_氮鍵。在第六個(gè)實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括磷葉立德基和醛基或酮基。含磷葉立德 的結(jié)構(gòu)單元將與含醛或酮的結(jié)構(gòu)單元在適當(dāng)條件下反應(yīng),形成碳_碳雙鍵,生成烯。在第七個(gè)實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)通過環(huán)加成作用反應(yīng),形成環(huán)結(jié)構(gòu)。這樣的互 補(bǔ)反應(yīng)基團(tuán)的一個(gè)例子是炔和有機(jī)疊氮化物,它們在適當(dāng)條件下反應(yīng),形成三唑環(huán)結(jié)構(gòu)。使 用這種反應(yīng)連接兩個(gè)結(jié)構(gòu)單元的一個(gè)例子在圖8中顯示。用于這樣的反應(yīng)的適當(dāng)條件在本 領(lǐng)域中公知,包括W0 03/101972公開的那些,該專利的全部內(nèi)容在此引用作為參考。在第八個(gè)實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)是烷基鹵和親核基團(tuán),如氨基、羥基或羧基。 這些基團(tuán)在適當(dāng)條件下反應(yīng),形成碳-氮(烷基鹵加胺)或碳-氧(烷基鹵加羥基或羧基)。在第九個(gè)實(shí)施方案中,互補(bǔ)官能團(tuán)是鹵代雜芳基和親核基團(tuán),結(jié)構(gòu)單元在適當(dāng)條 件下通過芳香親核取代連接。合適的鹵代雜芳基包括氯代嘧啶、三嗪和嘌呤,它們與親核物 質(zhì)如胺在水溶液中在溫和條件下反應(yīng)。寡核苷酸標(biāo)記的三氯三嗪與胺反應(yīng)的代表性例子在圖9和10中顯示。合適的氯代雜芳基的例子在圖11中顯示。應(yīng)當(dāng)理解,功能部分的合成可以通過一種特定類型的偶聯(lián)反應(yīng)進(jìn)行,例如但不限 于以上所述反應(yīng)中的一種,或者通過兩種或多種偶聯(lián)反應(yīng)如以上所述的兩種或多種偶聯(lián)反 應(yīng)的組合進(jìn)行。例如,在一個(gè)實(shí)施方案中,通過酰胺鍵形成(氨基和羧酸互補(bǔ)基團(tuán))和還原 性胺化(氨基和醛或酮互補(bǔ)基團(tuán))的組合,結(jié)構(gòu)單元連接在一起??梢允褂萌魏闻悸?lián)化學(xué) 方法,只要與寡核苷酸的存在相匹配。在本發(fā)明某些實(shí)施方案中使用的雙鏈(雙鏈體)寡 核苷酸標(biāo)簽在化學(xué)上比單鏈標(biāo)簽更強(qiáng),因此,容許較寬的反應(yīng)條件范圍,并且能夠采用用單 鏈標(biāo)簽不可能進(jìn)行的鍵形成反應(yīng)。除了反應(yīng)基團(tuán)或形成功能部分使用的基團(tuán)以外,結(jié)構(gòu)單元還可包含一個(gè)或多個(gè)官 能團(tuán)。一個(gè)或多個(gè)這樣的其他官能團(tuán)可以受到保護(hù),以阻止這些官能團(tuán)的不需要的反應(yīng)。 用于多種官能團(tuán)的合適的保護(hù)基在本領(lǐng)域中公知(Greene和Wuts,Protective Groups in OrRanic Synthesis,第二版,New York : John Wiley and Sons (1991),在此弓|用作為參 考)。特別有用的保護(hù)基包括叔丁基酯和醚、縮醛、三苯甲基醚和胺、乙酰基酯、三甲基硅烷 基醚、三氯乙基醚和酯和氨基甲酸酯。在一個(gè)實(shí)施方案中,每個(gè)結(jié)構(gòu)單元都含有兩個(gè)反應(yīng)基團(tuán),這兩個(gè)反應(yīng)基團(tuán)可以相 同也可以不同。例如,在循環(huán)s中添加的每個(gè)結(jié)構(gòu)單元可以包含兩個(gè)相同的反應(yīng)基團(tuán),但是 它們均與步驟S-1和S+1添加的結(jié)構(gòu)單元的反應(yīng)基團(tuán)互補(bǔ)。在另外一個(gè)實(shí)施方案中,每個(gè) 結(jié)構(gòu)單元都含有兩個(gè)自身互補(bǔ)的反應(yīng)基團(tuán)。例如,包含聚酰胺分子的文庫可以通過含有兩 個(gè)伯氨基的結(jié)構(gòu)單元與含有兩個(gè)活化羧基的結(jié)構(gòu)單元反應(yīng)產(chǎn)生。產(chǎn)生的化合物沒有N-末 端或C-末端,因?yàn)榻惶娴孽0坊哂邢喾吹姆较蛐??;蛘?,聚酰胺文庫也可以用各自含?氨基和活化羧基的結(jié)構(gòu)單元產(chǎn)生。在該實(shí)施方案中,在循環(huán)的步驟n中添加的結(jié)構(gòu)單元具 有游離的反應(yīng)基團(tuán),該反應(yīng)基團(tuán)與n-1結(jié)構(gòu)單元上可用的反應(yīng)基團(tuán)互補(bǔ),而優(yōu)選地,第n個(gè) 結(jié)構(gòu)單元上的另一反應(yīng)基團(tuán)受到保護(hù)。例如,如果該文庫的成員從C向N方向合成,則添加 的結(jié)構(gòu)單元將包含活化的羧基和受到保護(hù)的氨基。功能部分可以是多聚或寡聚部分,如肽、擬肽、肽核酸或類肽,或者它們可以是非 聚合的小分子,例如具有包含中央支架的結(jié)構(gòu)和繞支架周圍排列的結(jié)構(gòu)的分子。直鏈多聚 或寡聚文庫通過使用具有兩個(gè)反應(yīng)基團(tuán)的結(jié)構(gòu)單元產(chǎn)生,而分支多聚或寡聚文庫通過使用 具有三個(gè)或更多反應(yīng)基團(tuán)的結(jié)構(gòu)單元產(chǎn)生,任選地與只具有兩個(gè)反應(yīng)基團(tuán)的結(jié)構(gòu)單元組 合。這樣的分子可以表示為通式W. . xn,其中每一個(gè)X都是含有n個(gè)單體單元的聚合物 的單體單元,其中n是大于1的整數(shù)。對于寡聚或多聚化合物,末端結(jié)構(gòu)單元不需要含有兩 個(gè)官能團(tuán)。例如,對于聚酰胺文庫,C-末端結(jié)構(gòu)單元可包含氨基,但是羧基的存在是任選的。 類似地,N末端的結(jié)構(gòu)單元可包含羧基,但是不需要含有氨基。分支寡聚或多聚化合物也可以合成,只要至少一個(gè)結(jié)構(gòu)單元包含三個(gè)可與其他結(jié) 構(gòu)單元反應(yīng)的官能團(tuán)。本發(fā)明的文庫可包含直鏈分子、支鏈分子或它們的組合。也可以應(yīng)用如含有兩個(gè)或多個(gè)反應(yīng)基團(tuán)的支架結(jié)構(gòu)單元,與只具有一個(gè)可用反應(yīng) 基團(tuán)的其他結(jié)構(gòu)單元組合,來構(gòu)建文庫,例如在任何其他反應(yīng)基團(tuán)被保護(hù)或者不與該支架 結(jié)構(gòu)單元中存在的其他反應(yīng)基團(tuán)反應(yīng)時(shí)。在一個(gè)實(shí)施方案中,例如,合成的分子可以表示為 通式X (Y)n,其中X是支架結(jié)構(gòu)單元;每個(gè)Y都是與X連接的結(jié)構(gòu)單元,n是至少為2的整數(shù), 優(yōu)選2至大約6的整數(shù)。在一個(gè)優(yōu)選實(shí)施方案中,循環(huán)1的起始結(jié)構(gòu)單元是支架結(jié)構(gòu)單元。在通式X (Y) n的分子中,每個(gè)Y可以相同或不同,但是在典型文庫的大多數(shù)成員中,每個(gè)Y都 將不同。在一個(gè)實(shí)施方案中,本發(fā)明的文庫包含聚酰胺化合物。聚酰胺化合物可以由來源 于任何氨基酸的結(jié)構(gòu)單元組成,這些氨基酸包括20個(gè)天然存在的a -氨基酸,如丙氨酸 (Ala ;A)、甘氨酸(Gly ;G)、天冬酰胺(Asn ;N)、天冬氨酸(Asp ;D)、谷氨酸(Glu ;E)、組氨 酸(His ;H)、亮氨酸(Leu ;L)、賴氨酸(Lys ;K)、苯丙氨酸(Phe ;F)、酪氨酸(Tyr ;Y)、蘇氨 酸(Thr ;T)、絲氨酸(Ser ;S)、精氨酸(Arg ;R)、纈氨酸(Val ;V)、谷氨酰胺(Gin ;Q)、異亮氨 酸(lie ;I)、半胱氨酸(Cys ;C)、甲硫氨酸(Met ;M)、脯氨酸(Pro ;P)和色氨酸(Trp ;W),其 中給出了每個(gè)氨基酸的三字母和單字母編碼。在它們的天然存在的形式中,上述每個(gè)氨基 酸都以L-構(gòu)型存在,除非另外指出,此處即這樣假設(shè)。但是在本方法中,也可以使用這些 氨基酸的D-構(gòu)型形式。這些D-氨基酸在此用小寫三字母或單字母編碼表示,S卩,ala(a), gly(g)、leu(l)、gln(q)、thr(t)、Ser(S)等。結(jié)構(gòu)單元也可以來源于其他a-氨基酸,包括 但不限于3-芳基丙氨酸,如萘基丙氨酸、苯基取代的苯丙氨酸,包括4-氟_、4_氯、4-溴和 4-甲基苯丙氨酸;3-雜芳基丙氨酸,如3-吡啶基丙氨酸、3-噻吩基丙氨酸、3-喹啉基丙氨 酸和3-咪唑基丙氨酸;鳥氨酸;瓜氨酸;高瓜氨酸;肌氨酸;高脯氨酸;高半胱氨酸;取代的 脯氨酸,如羥脯氨酸和氟脯氨酸;脫氫脯氨酸;正亮氨酸;0-甲基酪氨酸;0-甲基絲氨酸; 0-甲基蘇氨酸和3-環(huán)己基丙氨酸。上述每個(gè)氨基酸都可以以D-或L-構(gòu)型使用。結(jié)構(gòu)單元也可以是非a-氨基酸的氨基酸,如a-氮雜氨基酸力,y , 5,$-氨 基酸,和N-取代的氨基酸,如N-取代的甘氨酸,其中N-取代基可以是例如取代的或未取代 的烷基、芳基、雜芳基、芳烷基或雜芳烷基。在一個(gè)實(shí)施方案中,N-取代基是來自天然存在 的或非天然存在的a-氨基酸的側(cè)鏈。結(jié)構(gòu)單元也可以是擬肽結(jié)構(gòu),如二肽、三肽、四肽或五肽模擬物。這樣的擬肽結(jié) 構(gòu)單元優(yōu)選來源于氨?;衔?,使得將這些結(jié)構(gòu)單元添加到生長的聚(氨酰)基上的 化學(xué)與用于其他結(jié)構(gòu)單元的化學(xué)相同或相似。結(jié)構(gòu)單元也可以是能夠形成與肽鍵電子等 排的鍵的分子,形成包含肽骨架修飾的擬肽功能部分,如¥ [CH2S]、¥ [CH2NH]、¥ [CSNH2]、 ¥ [NHCO]、¥ [C0CH2]和V [(E)或(Z) CH = CH]。在以上使用的命名中,V表示不存在酰 胺鍵。代替酰胺基的結(jié)構(gòu)在括號內(nèi)指出。在一個(gè)實(shí)施方案中,本發(fā)明提供一種合成化合物的方法,該化合物包含或由與編 碼寡核苷酸可操作連接的功能部分組成。該方法包括下列步驟(1)提供由包含n個(gè)結(jié)構(gòu) 單元的起始功能部分組成的起始化合物,其中n是1或大于1的整數(shù),其中該起始功能部分 含有至少一個(gè)反應(yīng)基團(tuán),并且其中該起始功能部分與編碼n個(gè)結(jié)構(gòu)單元的起始寡核苷酸可 操作連接;(2)將該起始化合物與包含至少一個(gè)互補(bǔ)反應(yīng)基團(tuán)的結(jié)構(gòu)單元反應(yīng),其中該至 少一個(gè)互補(bǔ)反應(yīng)基團(tuán)與步驟(1)的反應(yīng)基團(tuán)互補(bǔ),反應(yīng)條件適合所述反應(yīng)基團(tuán)與互補(bǔ)反應(yīng) 基團(tuán)反應(yīng)形成共價(jià)鍵;(3)將起始寡核苷酸與引入寡核苷酸反應(yīng),反應(yīng)條件適合所述引入 寡核苷酸與起始寡核苷酸連接,并存在催化所述起始寡核苷酸與引入寡核苷酸連接的酶, 從而產(chǎn)生包含功能部分或由該功能部分組成的分子,該功能部分含有n+1個(gè)結(jié)構(gòu)單元,并 且與編碼寡核苷酸可操作連接。如果步驟(3)的功能部分包含反應(yīng)基團(tuán),則步驟1-3可以 重復(fù)一次或多次,從而形成循環(huán)1至i,其中i是2或大于2的整數(shù),循環(huán)s-1的步驟(3)的 產(chǎn)物成為循環(huán)s的步驟(1)的起始化合物,其中s是i或更小的整數(shù)。在每個(gè)循環(huán)中,一個(gè)結(jié)構(gòu)單元添加到生長的功能部分上,并且編碼新結(jié)構(gòu)單元的一個(gè)寡核苷酸序列添加到生長 的編碼寡核苷酸上。在一個(gè)優(yōu)選實(shí)施方案中,每個(gè)單個(gè)結(jié)構(gòu)單元與不同的寡核苷酸相聯(lián),使得在特定 循環(huán)中添加的寡核苷酸中的核苷酸序列標(biāo)識在同一循環(huán)中添加的結(jié)構(gòu)單元。結(jié)構(gòu)單元的偶聯(lián)和寡核苷酸的連接通常在相似濃度的起始材料和試劑中發(fā)生。例 如,為了使結(jié)構(gòu)單元有效偶聯(lián),優(yōu)選約為微摩爾至毫摩爾例如約10iiM至約10mM的反應(yīng)物 濃度。在某些實(shí)施方案中,該方法在步驟(2)之后進(jìn)一步包括清除任何未反應(yīng)的起始功 能部分的步驟。清除特定循環(huán)中任何未反應(yīng)的起始功能部分防止了該循環(huán)的起始功能部分 與后一循環(huán)中添加的結(jié)構(gòu)單元反應(yīng)。這樣的反應(yīng)可導(dǎo)致產(chǎn)生丟失了一個(gè)或多個(gè)結(jié)構(gòu)單元的 功能部分,可能產(chǎn)生對應(yīng)于特定寡核苷酸序列的一系列功能部分結(jié)構(gòu)。這種清除可以通過 任何剩余的起始功能部分與可與步驟(2)的反應(yīng)基團(tuán)反應(yīng)的化合物進(jìn)行反應(yīng)來實(shí)現(xiàn)。優(yōu)選 地,清除化合物與步驟(2)的反應(yīng)基團(tuán)快速反應(yīng),并且不含能夠與后一循環(huán)中添加的結(jié)構(gòu) 單元反應(yīng)的另外的反應(yīng)基團(tuán)。例如,在步驟(2)的反應(yīng)基團(tuán)是氨基的化合物合成中,適合的 清除化合物是N-羥基琥珀酰亞胺酯,如乙酸N-羥基琥珀酰亞胺酯。在另一實(shí)施方案中,本發(fā)明提供一種制備化合物文庫的方法,其中每個(gè)化合物都 包含功能部分,該功能部分包含兩個(gè)或多個(gè)結(jié)構(gòu)單元?dú)埢?,并且與寡核苷酸可操作連接。在 一個(gè)優(yōu)選實(shí)施方案中,每個(gè)分子中存在的寡核苷酸提供了足以鑒別該分子內(nèi)的結(jié)構(gòu)單元和 任選地結(jié)構(gòu)單元添加順序的信息。在該實(shí)施方案中,本發(fā)明的方法包括一種合成化合物文 庫的方法,其中該化合物包含功能部分,該功能部分包括兩個(gè)或多個(gè)結(jié)構(gòu)單元,并且與標(biāo)識 該功能部分結(jié)構(gòu)的寡核苷酸可操作連接。該方法包括步驟(1)提供包含m種起始化合物的 溶液,其中m是1或大于1的整數(shù),其中起始化合物由包含n個(gè)結(jié)構(gòu)單元的功能部分組成, 其中n是1或大于1的整數(shù),該功能部分與標(biāo)識該n個(gè)結(jié)構(gòu)單元的起始寡核苷酸可操作連 接;⑵將步驟⑴的溶液分配到至少r個(gè)反應(yīng)容器中,其中r是2或大于2的整數(shù);(3)將 每個(gè)部分與r個(gè)結(jié)構(gòu)單元之一反應(yīng),從而產(chǎn)生r個(gè)等份,包含由功能部分組成的化合物,該 功能部分包含n+1個(gè)結(jié)構(gòu)單元,并且與起始寡核苷酸可操作連接;(4)將步驟(3)的r個(gè)部 分中的每一個(gè)與一組r個(gè)不同引入寡核苷酸之一反應(yīng),反應(yīng)條件適合所述引入寡核苷酸與 起始寡核苷酸發(fā)生酶連接,從而產(chǎn)生r個(gè)部分,包含由功能部分組成的分子,該功能部分包 含n+1個(gè)結(jié)構(gòu)單元,并且與編碼該n+1個(gè)結(jié)構(gòu)單元的延長的寡核苷酸可操作連接。任選地, 該方法可進(jìn)一步包括步驟(5)重新組合步驟(4)中產(chǎn)生的r個(gè)部分,從而產(chǎn)生包含由功能 部分組成的分子的溶液,該功能部分包含n+1個(gè)結(jié)構(gòu)單元,并且與編碼該n+1個(gè)結(jié)構(gòu)單元的 延長的寡核苷酸可操作連接。步驟(1)至(5)可以進(jìn)行一次或多次,以產(chǎn)生循環(huán)1至i,其 中i是2或大于2的整數(shù)。在循環(huán)s+1中,其中s是i_l或更小的整數(shù),步驟(1)的含有m 種起始化合物的溶液是循環(huán)s的步驟(5)的溶液。同樣,循環(huán)s+1的步驟(1)的起始化合 物是循環(huán)s的步驟(4)的產(chǎn)物。優(yōu)選地,在文庫合成的每個(gè)循環(huán)中將步驟(2)的溶液分成r個(gè)部分。在該實(shí)施方 案中,每個(gè)部分與獨(dú)特結(jié)構(gòu)單元反應(yīng)。在本發(fā)明的方法中,結(jié)構(gòu)單元和引入寡核苷酸的添加順序不是關(guān)鍵,分子合成的 步驟(2)和(3),和文庫合成中的步驟(3)和(4)可以顛倒,即在添加新結(jié)構(gòu)單元之前,引入寡核苷酸可以與起始寡核苷酸連接。在某些實(shí)施方案中,可以同時(shí)進(jìn)行這兩個(gè)步驟。在某些實(shí)施方案中,該方法在步驟(2)之后進(jìn)一步包括清除任何未反應(yīng)的起始功 能部分的步驟。清除特定循環(huán)中任何未反應(yīng)的起始功能部分防止了該循環(huán)的起始功能部分 與后一循環(huán)中添加的結(jié)構(gòu)單元反應(yīng)。這樣的反應(yīng)可導(dǎo)致產(chǎn)生丟失了一個(gè)或多個(gè)結(jié)構(gòu)單元的 功能部分,可能產(chǎn)生對應(yīng)于特定寡核苷酸序列的一系列功能部分結(jié)構(gòu)。這種清除可以通過 任何剩余的起始功能部分與可與步驟(2)的反應(yīng)基團(tuán)反應(yīng)的化合物進(jìn)行反應(yīng)來實(shí)現(xiàn)。優(yōu)選 地,清除化合物與步驟(2)的反應(yīng)基團(tuán)快速反應(yīng),并且不含能夠與后一循環(huán)中添加的結(jié)構(gòu) 單元反應(yīng)的另外的反應(yīng)基團(tuán)。例如,在步驟(2)的反應(yīng)基團(tuán)是氨基的化合物合成中,適合的 清除化合物是N-羥基琥珀酰亞胺酯,如乙酸N-羥基琥珀酰亞胺酯。在一個(gè)實(shí)施方案中,通過評價(jià)候選結(jié)構(gòu)單元與適當(dāng)互補(bǔ)官能團(tuán)在用于合成文庫的 條件下反應(yīng)的能力,從一組候選結(jié)構(gòu)單元中選擇文庫合成中使用的結(jié)構(gòu)單元。然后可以選 擇在這些條件下顯示適當(dāng)反應(yīng)性的結(jié)構(gòu)單元,用于引入文庫中。任選地可以純化特定循環(huán) 的產(chǎn)物。當(dāng)循環(huán)是中間循環(huán)時(shí),即,最終循環(huán)之前的任何循環(huán)時(shí),這些產(chǎn)物是中間產(chǎn)物,可以 在下一循環(huán)開始前純化。如果該循環(huán)是最后一次循環(huán),則該循環(huán)的產(chǎn)物是終產(chǎn)物,可以在該 化合物的任何應(yīng)用前純化。該純化步驟可以例如除去未反應(yīng)的或過量的反應(yīng)物和用于寡核 苷酸連接的酶??梢允褂眠m合將產(chǎn)物與溶液中存在的其他物質(zhì)進(jìn)行分離的任何方法,包括 液相色譜,如高效液相色譜(HPLC),和用合適的共溶劑如乙醇沉淀。合適的純化方法依賴于 產(chǎn)物的性質(zhì)和用于合成的溶劑系統(tǒng)。反應(yīng)優(yōu)選地在水溶液如緩沖水溶液中進(jìn)行,但是也可以在與結(jié)構(gòu)單元、寡核苷酸、 中間產(chǎn)物和終產(chǎn)物的溶解性質(zhì)和用于催化寡核苷酸連接的酶相匹配的混合水/有機(jī)介質(zhì) 中進(jìn)行。應(yīng)當(dāng)理解,上述方法中特定循環(huán)產(chǎn)生的化合物的理論數(shù)目是該循環(huán)中使用的不同 起始化合物的數(shù)目m與循環(huán)中添加的不同結(jié)構(gòu)單元的數(shù)目r的積。循環(huán)中產(chǎn)生的不同化合 物的實(shí)際數(shù)目可以高達(dá)r和m的積(rxm),但是如果某些結(jié)構(gòu)單元與某些其他結(jié)構(gòu)單元的反 應(yīng)性有差異的話,則可能較低。例如,向特定起始化合物上添加特定結(jié)構(gòu)單元的動(dòng)力學(xué)可能 是,在合成循環(huán)的時(shí)間尺度上,可能產(chǎn)生很少的反應(yīng)產(chǎn)物,甚至不產(chǎn)生產(chǎn)物。在某些實(shí)施方案中,在循環(huán)1之前、最后一次循環(huán)之后或任意兩次循環(huán)之間加入 通用結(jié)構(gòu)單元。例如,當(dāng)功能部分是聚酰胺時(shí),可以在最后一次循環(huán)后加入通用N-末端加 帽結(jié)構(gòu)單元。也可以在任意兩個(gè)循環(huán)之間引入通用結(jié)構(gòu)單元,例如添加官能團(tuán),如炔基或疊 氮基,它們可以在文庫合成后例如通過環(huán)化用來修飾功能部分。如此處所用的術(shù)語“可操作連接”是指兩個(gè)化學(xué)結(jié)構(gòu)以一種方式連接在一起,使得 它們經(jīng)受預(yù)期的各種操作后仍保持連接。一般來說,功能部分和編碼寡核苷酸通過合適的 連接基團(tuán)共價(jià)連接。該連接基團(tuán)是具有寡核苷酸連接部位和功能部分連接部位的二價(jià)部 分。例如,當(dāng)功能部分是聚酰胺化合物時(shí),該聚酰胺化合物可以與連接基團(tuán)在其N-末端、 C-末端或通過一個(gè)側(cè)鏈上的官能團(tuán)連接。該連接基團(tuán)足以通過至少一個(gè)原子,優(yōu)選一個(gè)以 上原子,如至少兩個(gè)、至少三個(gè)、至少四個(gè)、至少五個(gè)或至少六個(gè)原子,分隔聚酰胺化合物和 寡核苷酸。優(yōu)選地,該連接基團(tuán)具有充分的柔性,可使聚酰胺化合物與靶分子以不依賴于該 寡核苷酸的方式結(jié)合。在一個(gè)實(shí)施方案中,連接基團(tuán)與聚酰胺化合物的N-末端和寡核苷酸的5’ -磷酸基連接。例如,連接基團(tuán)可以來源于在一個(gè)末端上含有活化羧基而在另一末端上含有活化 酯的連接基團(tuán)前體。連接基團(tuán)前體與N-末端氮原子的反應(yīng)將形成一個(gè)酰胺鍵,將該連接基 團(tuán)與聚酰胺化合物或N-末端結(jié)構(gòu)單元連接在一起,而連接基團(tuán)前體與寡核苷酸的5’ -羥 基的反應(yīng)將導(dǎo)致寡核苷酸與連接基團(tuán)通過酯鍵連接。連接基團(tuán)可包括,例如聚亞甲基鏈, 如_(CH2)n-鏈,或聚(乙二醇)鏈,如_(CH2CH20)n鏈,其中在兩種情況中,n都是1至約20 的整數(shù)。優(yōu)選地,n為2至約12,更優(yōu)選約4至約10。在一個(gè)實(shí)施方案中,連接基團(tuán)包括環(huán) 己基(-(CH2)6-)。當(dāng)結(jié)構(gòu)單元是氨基酸殘基時(shí),得到的功能部分是聚酰胺??梢岳糜糜谛纬甚0?鍵的任何合適的化學(xué)方法將氨基酸偶聯(lián)。優(yōu)選地,氨基酸結(jié)構(gòu)單元的偶聯(lián)在與寡核苷酸的 酶連接相匹配的條件下進(jìn)行,例如在中性或接近中性的PH和水溶液中進(jìn)行。在一個(gè)實(shí)施方 案中,聚酰胺化合物以C-末端到N-末端的方向合成。在該實(shí)施方案中,第一個(gè),或者C-末 端的結(jié)構(gòu)單元在其羧基處與寡核苷酸通過合適的連接基團(tuán)連接。第一個(gè)結(jié)構(gòu)單元與第二個(gè) 結(jié)構(gòu)單元反應(yīng),第二個(gè)結(jié)構(gòu)單元優(yōu)選具有活化的羧基和受到保護(hù)的氨基??梢允褂眠m合溶 液相酰胺鍵形成的任何活化/保護(hù)基團(tuán)策略。例如,合適的活化羧基類型包括酰氟(美國專 利號5,360, 928,在此全文引用作為參考)、對稱酸酐和N-羥基琥珀酰亞胺酯。如本領(lǐng)域所 知,通過與合適的活化化合物反應(yīng),?;部梢栽换罨?。合適的活化化合物包括二環(huán)己基 碳二亞胺(DCC)、二異丙基碳二亞胺(010、1-乙氧羰基-2-乙氧基-1,2-二氫喹啉(EEDQ)、 1-乙基-3-(3-二甲基氨丙基)碳二亞胺鹽酸鹽(EDC)、正丙烷-膦酸酐(PPA)、N,N-二 (2-氧-3-噁唑烷基)亞氨基-磷酰氯(B0P-C1)、溴-三-吡咯烷基磷六氟磷酸(PyBrop)、 二苯基磷?;B氮化物(DPPA)、Castro ‘ s試劑(BOP,PyBop)、0-苯并三唑基-N,N, N', N'-四甲基脲鹽(HBTU)、二乙基磷酰氰(0£ 〔幻、2,5-聯(lián)苯基-2,3-二氫-3-氧-4-羥 基-噻吩二氧化物(Steglich' s 試劑;H0TD0)U,1' _ 羰基-二咪唑(CDI)和 4-(4,6-二 甲氧基-1,3,5-三嗪-2-基)-4_甲基嗎啉氯(DMT-MM)。偶聯(lián)試劑可以單獨(dú)使用或者與添 加劑如N,N- 二甲基-4-氨基吡啶(DMAP)、N-羥基-苯并三唑(HOBt)、N-羥基苯并三嗪 (HOOBt)、N-羥基琥珀酰亞胺(HOSu)、N-羥基氮雜苯并三唑(HOAt)、氮雜苯并三唑基-四甲 基脲鹽(HATU,HAPyU)或2-羥基吡啶組合使用。在某些實(shí)施方案中,文庫的合成需要使用 兩個(gè)或多個(gè)活化策略,以能夠使用結(jié)構(gòu)上多樣化的一組結(jié)構(gòu)單元。對于每個(gè)結(jié)構(gòu)單元,本領(lǐng) 域技術(shù)人員能夠確定合適的活化策略。N末端保護(hù)基可以是與該方法的條件相匹配的任何保護(hù)基,例如,適合溶液相合成 條件的保護(hù)基。一種優(yōu)選的保護(hù)基是芴甲氧羰基(“Fmoc”)。氨?;Y(jié)構(gòu)單元側(cè)鏈上的任 何潛在反應(yīng)性官能團(tuán)也可能需要適當(dāng)保護(hù)。優(yōu)選地,側(cè)鏈保護(hù)基與N末端保護(hù)基正交,即, 在不同于除去N末端保護(hù)基所需條件的條件下除去該側(cè)鏈保護(hù)基。合適的側(cè)鏈保護(hù)基包括 硝基藜蘆基,它可以用來既保護(hù)側(cè)鏈羧基又保護(hù)側(cè)鏈氨基。另外一種合適的側(cè)鏈胺保護(hù)基 是N-戊-4-烯?;=Y(jié)構(gòu)單元可以在摻入功能部分后修飾,例如,通過涉及一個(gè)或多個(gè)結(jié)構(gòu)單元上的 官能團(tuán)的適當(dāng)反應(yīng)進(jìn)行。結(jié)構(gòu)單元修飾可以在添加最后一個(gè)結(jié)構(gòu)單元后發(fā)生,或者在功能 部分合成的任一中間點(diǎn)發(fā)生,例如,在合成過程的任一循環(huán)后發(fā)生。當(dāng)合成本發(fā)明的雙功能 分子文庫時(shí),可以對整個(gè)文庫或文庫的一部分進(jìn)行結(jié)構(gòu)單元修飾,從而提高文庫的復(fù)雜程 度。合適的結(jié)構(gòu)單元修飾反應(yīng)包括可以在與功能部分和編碼寡核苷酸相匹配的條件下進(jìn)行的那些反應(yīng)。這樣的反應(yīng)的例子包括氨基或羥基的?;突腔?、氨基的烷基化、羧基的酯化 或硫酯化、羧基的酰胺化、烯的環(huán)氧化和本領(lǐng)域公知的其他反應(yīng)。當(dāng)功能部分包括含有炔或 疊氮官能團(tuán)的結(jié)構(gòu)單元時(shí),可以利用疊氮/炔的環(huán)加成反應(yīng)衍生化該結(jié)構(gòu)單元。例如,包含 炔的結(jié)構(gòu)單元可與有機(jī)疊氮化物反應(yīng),或者包含疊氮的結(jié)構(gòu)單元可與炔反應(yīng),在任一種情 況下都形成三唑。結(jié)構(gòu)單元修飾反應(yīng)可以在添加最后一個(gè)結(jié)構(gòu)單元后發(fā)生,或者在合成過 程的中間點(diǎn)處發(fā)生,并且能夠用來向功能部分上添加多種化學(xué)結(jié)構(gòu),包括碳水化合物、金屬 結(jié)合部分和用于靶向某些生物分子或組織類型的結(jié)構(gòu)。在另一個(gè)實(shí)施方案中,功能部分包含一系列直鏈結(jié)構(gòu)單元,該直鏈系列利用適當(dāng) 的反應(yīng)環(huán)化。例如,如果直鏈排列的至少兩個(gè)結(jié)構(gòu)單元包括巰基,則巰基可以氧化形成二硫 鍵,從而環(huán)化該直鏈系列。例如,功能部分可以是包含兩個(gè)或多個(gè)L或D-半胱氨酸和/或L 或D-高半胱氨酸部分的寡肽。結(jié)構(gòu)單元也可以包含能夠一起反應(yīng)環(huán)化直鏈系列的其他官 能團(tuán),如羧基和氨基或羥基。在一個(gè)優(yōu)選實(shí)施方案中,直鏈系列中的一個(gè)結(jié)構(gòu)單元包含炔基,而直鍵系列中的 另一個(gè)結(jié)構(gòu)單元包含疊氮基。可以誘導(dǎo)疊氮基和炔基通過環(huán)加成作用反應(yīng),導(dǎo)致形成大環(huán) 結(jié)構(gòu)。在圖9所示的實(shí)施例中,功能部分是在C末端包含炔丙基甘氨酸結(jié)構(gòu)單元而在N末 端包含疊氮基乙酰基的多肽。炔基與疊氮基在適當(dāng)條件下的反應(yīng)導(dǎo)致環(huán)狀化合物的形成, 包括大環(huán)內(nèi)的三唑結(jié)構(gòu)。對于文庫的情況,在一個(gè)實(shí)施方案中,文庫的每個(gè)成員都包含含炔 和疊氮基的結(jié)構(gòu)單元,并且可以以這種方式環(huán)化。在第二個(gè)實(shí)施方案中,文庫的所有成員都 包含含炔和疊氮基的結(jié)構(gòu)單元,但是只有文庫的一部分環(huán)化。在第三個(gè)實(shí)施方案中,只有某 些功能部分包含含炔和疊氮基的結(jié)構(gòu)單元,并且只有這些分子環(huán)化。在上述第二個(gè)和第三 個(gè)實(shí)施方案中,該文庫在環(huán)加成反應(yīng)后既包含環(huán)狀功能部分也包含直鏈功能部分。利用酶法連接寡核苷酸。在一個(gè)實(shí)施方案中,起始結(jié)構(gòu)單元與起始寡核苷酸可操 作連接。在第二結(jié)構(gòu)單元與起始結(jié)構(gòu)單元偶聯(lián)之前或之后,標(biāo)識第二結(jié)構(gòu)單元的第二寡核 苷酸序列與起始寡核苷酸連接。用于連接起始寡核苷酸序列和弓I入寡核苷酸序列的方法在 圖1和圖2中描述。在圖1中,起始寡核苷酸是雙鏈,一條鏈包含與第二寡核苷酸的一個(gè)末 端互補(bǔ)的突出端序列,并且使第二寡核苷酸接觸起始寡核苷酸。優(yōu)選地,起始寡核苷酸的突 出序列和第二寡核苷酸的互補(bǔ)序列都為至少約4個(gè)堿基;更優(yōu)選地兩個(gè)序列長度相同???以用合適的酶將起始寡核苷酸和第二寡核苷酸連接起來。如果起始寡核苷酸在一條鏈(“頂 鏈”)的5’末端與第一結(jié)構(gòu)單元連接,則與該頂鏈互補(bǔ)的鏈(“底鏈”)將在其5’末端包含 突出端序列,第二寡核苷酸將在其5’末端包含互補(bǔ)序列。在第二寡核苷酸連接后,可以添 加與第二寡核苷酸的序列互補(bǔ)的一條鏈,其位于突出端互補(bǔ)序列的3’方向,并且包含另外 的突出端序列。在一個(gè)實(shí)施方案中,寡核苷酸如圖2所示延長。定位與生長的功能部分結(jié)合的寡 核苷酸和引入寡核苷酸,用于利用“夾板”序列連接,該序列包括與起始寡核苷酸的3’末端 互補(bǔ)的區(qū)域和與引入寡核苷酸的5’末端互補(bǔ)的區(qū)域。夾板使寡核苷酸的5’末端靠近引入 寡核苷酸的3’末端,并且利用酶連接完成連接。在圖2所示的實(shí)施例中,起始寡核苷酸由16 個(gè)核堿基組成,夾板與3’末端的6個(gè)堿基互補(bǔ)。引入寡核苷酸由12個(gè)核堿基組成,夾板與 5’末端的6個(gè)堿基互補(bǔ)。夾板的長度和互補(bǔ)區(qū)的長度不是關(guān)鍵的。但是,互補(bǔ)區(qū)應(yīng)當(dāng)足夠 長,以便在連接條件下能夠形成穩(wěn)定的二聚體,而不是在終分子中產(chǎn)生過大的編碼核苷酸?;パa(bǔ)區(qū)的長度優(yōu)選為約4個(gè)堿基至約12個(gè)堿基,更優(yōu)選約5個(gè)堿基至約10個(gè)堿基,最優(yōu)選 約5個(gè)堿基至約8個(gè)堿基。在一個(gè)實(shí)施方案中,起始寡核苷酸是雙鏈,且兩條鏈共價(jià)連接。共價(jià)連接兩條鏈的 一種手段如圖3所示,其中利用連接部分連接兩條鏈和功能部分。該連接部分可以是任何 化學(xué)結(jié)構(gòu),其包含適合與結(jié)構(gòu)單元反應(yīng)的第一官能團(tuán),適合與寡核苷酸的3’ -末端反應(yīng)的 第二官能團(tuán),和適合與寡核苷酸的5’-末端反應(yīng)的第三官能團(tuán)。優(yōu)選地,第二和第三官能團(tuán) 的定向使兩條寡核苷酸鏈為相對的方向,這可使兩條鏈雜交。例如,連接部分可以具有通式 結(jié)構(gòu)⑴ 其中A是能夠與結(jié)構(gòu)單元形成共價(jià)鍵的官能團(tuán),B是能夠與寡核苷酸的5’ -末端 形成鍵的官能團(tuán),C是能夠與寡核苷酸的3’ -末端形成鍵的官能團(tuán)。D、F和E是將官能團(tuán) A、C和B與S連接的化學(xué)基團(tuán),S為核心原子或支架。優(yōu)選地,D、E和F各自獨(dú)立地為原子 鏈,如亞烷基鏈或低聚(乙二醇)鏈,D、E和F可以相同或不同,并且優(yōu)選地有效地使兩個(gè) 寡核苷酸雜交及功能部分合成。在一個(gè)實(shí)施方案中,三價(jià)連接體具有結(jié)構(gòu) 在該實(shí)施方案中,NH基可用于連接結(jié)構(gòu)單元,而末端磷酸基可用于連接寡核苷酸。在起始寡核苷酸是雙鏈的實(shí)施方案中,引入寡核苷酸也是雙鏈。如圖3所示,起始 寡核苷酸的一條鏈可以比另一條長,提供突出端序列。在該實(shí)施方案中,引入寡核苷酸包括 與起始寡核苷酸的突出端序列互補(bǔ)的突出端序列。兩個(gè)互補(bǔ)突出端序列的雜交使引入寡核 苷酸進(jìn)入與起始寡核苷酸連接的位置。這種連接可以用DNA或RNA連接酶酶促進(jìn)行。引入 寡核苷酸和起始寡核苷酸的突出端序列優(yōu)選地長度相同,并且由兩個(gè)或多個(gè)核苷酸,優(yōu)選 地2個(gè)至約10個(gè)核苷酸,更優(yōu)選2個(gè)至約6個(gè)核苷酸組成。在一個(gè)優(yōu)選的實(shí)施方案中,引入 寡核苷酸是在每一末端都有一個(gè)突出端序列的雙鏈寡核苷酸。在一個(gè)末端處的突出端序列 與起始寡核苷酸的突出端序列互補(bǔ),而在引入寡核苷酸與起始寡核苷酸連接后,在另一末端處的突出端序列成為下一循環(huán)的起始寡核苷酸的突出端序列。在一個(gè)實(shí)施方案中,三個(gè) 突出端序列長度均為2至6個(gè)核苷酸,引入寡核苷酸的編碼序列長度為3至10個(gè)核苷酸, 優(yōu)選3至6個(gè)核苷酸。在一個(gè)特定實(shí)施方案中,突出端序列的長度均為2個(gè)核苷酸,編碼序 列的長度為5個(gè)核苷酸。在圖4所示的實(shí)施方案中,引入鏈在其3’末端具有與起始寡核苷酸的3’末端互 補(bǔ)的區(qū)域,在兩條鏈的5’末端留有突出端。5’末端可以利用如DNA聚合酶如vent聚合酶 補(bǔ)平,產(chǎn)生雙鏈的延長寡核苷酸。該寡核苷酸的底鏈可以除去,并利用相同的方法向頂鏈的 3’末端添加另外的序列。連續(xù)添加識別每個(gè)連續(xù)結(jié)構(gòu)單元的寡核苷酸導(dǎo)致形成編碼寡核苷酸標(biāo)簽。在本發(fā) 明方法的一個(gè)實(shí)施方案中,連續(xù)寡核苷酸標(biāo)簽可以通過酶連接偶聯(lián),產(chǎn)生編碼寡核苷酸。酶催化的寡核苷酸連接可以用具有連接核酸片段能力的任何酶進(jìn)行。酶的例 子包括連接酶、聚合酶和拓?fù)洚悩?gòu)酶。在本發(fā)明的特定實(shí)施方案中,應(yīng)用DNA連接酶 (EC 6. 5. 1. 1)、DNA 聚合酶(EC 2. 7. 7. 7)、RNA 聚合酶(EC 2. 7. 7. 6)或拓?fù)洚悩?gòu)酶(EC 5.99. 1.2)連接寡核苷酸。每個(gè)EC類別中所含的酶可見于如Bairoch (2000) Nucleic Acids Research 28 :304_5 所述。在一個(gè)優(yōu)選實(shí)施方案中,在本發(fā)明方法中使用的寡核苷酸是寡脫氧核苷酸,用來 催化寡核苷酸連接的酶是DNA連接酶。為了在連接酶存在下發(fā)生連接,即為了在兩個(gè)寡核 苷酸之間形成磷酸二酯鍵,一個(gè)寡核苷酸必須具有游離的5’磷酸基,而另一個(gè)寡核苷酸必 須具有游離的3’羥基??梢栽诒景l(fā)明的方法中使用的DNA連接酶的例子包括T4DNA連接酶、 Taq DNA連接酶、T4RNA連接酶、DNA連接酶(大腸桿菌)(均獲自如New England Biolabs, MA)。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,用于連接的各種酶在特定條件如溫度、緩沖液濃度、pH 和時(shí)間下具有最佳活性。這些條件中的每一個(gè)都可以調(diào)節(jié),例如根據(jù)制造商說明進(jìn)行調(diào)節(jié), 以獲得寡核苷酸標(biāo)簽的最佳連接。引入寡核苷酸可以是任何需要的長度,但優(yōu)選長度為至少三個(gè)核堿基。更優(yōu)選地, 引入寡核苷酸的長度為4個(gè)或更多的核堿基。在一個(gè)實(shí)施方案中,引入寡核苷酸的長度為 3至約12個(gè)核堿基。本發(fā)明文庫中的分子的寡核苷酸優(yōu)選具有共同的末端序列,如本領(lǐng)域 所知,該序列可以用作PCR的引物。這種共同末端序列可以在文庫合成的最后一個(gè)循環(huán)中 引入作為引入寡核苷酸的末端,或者可以在文庫合成后添加,例如利用此處公開的酶連接 方法添加。本發(fā)明方法的一個(gè)優(yōu)選實(shí)施方案如圖5所示。該過程開始于在5’末端與連接體 連接的合成DNA序列,該連接體終止于氨基。在步驟1中,在Tris緩沖液中在夾板DNA鏈、 DNA連接酶和二硫蘇糖醇的存在下,該起始DNA序列與引入DNA序列連接。產(chǎn)生標(biāo)記DNA序 列,該序列然后可以直接用于下一步驟中,或者在進(jìn)行下一步驟之前例如利用HPLC或乙醇 沉淀純化。在步驟2中,標(biāo)記DNA與保護(hù)的活化氨基酸反應(yīng),在該實(shí)施例中,與Fmoc-保護(hù) 的氨基酸氟化物反應(yīng),產(chǎn)生保護(hù)的氨基酸-DNA偶聯(lián)物。在步驟3中,例如在哌啶的存在下 將保護(hù)的氨基酸-DNA偶聯(lián)物脫保護(hù),任選地例如通過HPLC或乙醇沉淀純化產(chǎn)生的脫保護(hù) 的偶聯(lián)物。脫保護(hù)的偶聯(lián)物是第一合成循環(huán)的產(chǎn)物,并且成為第二循環(huán)的起始材料,第二循 環(huán)向脫保護(hù)偶聯(lián)物的游離氨基上添加第二氨基酸殘基。
在利用PCR擴(kuò)增所選分子的編碼寡核苷酸的實(shí)施方案中,該編碼寡核苷酸優(yōu)選地 包括PCR引物序列。例如,在合成的第一循環(huán)之前,起始寡核苷酸中可以包含PCR引物序 列,或者可以與第一引入寡核苷酸一起包含。編碼寡核苷酸在編碼序列之后也可以包含加 帽PCR引物序列。在文庫合成的最后一個(gè)循環(huán)后,該加帽序列可以與編碼寡核苷酸連接,或 者可以包含在最后一個(gè)循環(huán)的引入寡核苷酸中。在引入寡核苷酸包含PCR引物序列的情況 中,這些引入寡核苷酸優(yōu)選地明顯長于在其他循環(huán)中添加的引入寡核苷酸,因?yàn)樗鼈兗劝?含編碼序列也包含PCR引物序列。對于在添加最后的結(jié)構(gòu)單元和最后的引入寡核苷酸后添加加帽序列的情況,如此 處所述的文庫的合成包括將加帽序列與編碼寡核苷酸連接的步驟,使基本所有文庫成員的 寡核苷酸部分終止于包含PCR引物序列的序列中。適合在本發(fā)明的文庫中使用的PCR引 物序列在本領(lǐng)域中公知;合適的引物和方法例如描述在Innis等人,編,PCR Protocols AGuide to Methods and Applications, San Diego :Academic Press (1990)中,其內(nèi)容在 此全文引用作為參考。優(yōu)選地,通過與作為最后合成循環(huán)的產(chǎn)物的組合組分連接,添加該加 帽序列。加帽序列可以用文庫構(gòu)建中使用的酶法添加。如上所述,作為本發(fā)明方法一部分的寡核苷酸標(biāo)簽的核苷酸序列可以用聚合酶鏈 反應(yīng)(PCR)確定。寡核苷酸標(biāo)簽由標(biāo)識構(gòu)成如此處所述功能部分的結(jié)構(gòu)單元的多核苷酸組成。寡核 苷酸標(biāo)簽的核酸序列通過對寡核苷酸標(biāo)簽進(jìn)行如下PCR反應(yīng)來測定。適當(dāng)樣品與PCR引物 對接觸,該引物對的每個(gè)成員具有預(yù)先選擇的核苷酸序列。該P(yáng)CR引物對通過與編碼寡核 苷酸標(biāo)簽上的PCR引物結(jié)合部位雜交,能夠啟動(dòng)引物延伸反應(yīng)。該P(yáng)CR引物結(jié)合部位優(yōu)選 地設(shè)計(jì)在編碼寡核苷酸標(biāo)簽內(nèi)部。例如,PCR引物結(jié)合部位可以摻入起始寡核苷酸標(biāo)簽內(nèi), 而第二 PCR引物結(jié)合部位可以位于最終寡核苷酸標(biāo)簽內(nèi)?;蛘?,第二 PCR引物結(jié)合部位可 以摻入如此處所述的加帽序列中。在優(yōu)選實(shí)施方案中,該P(yáng)CR引物結(jié)合部位的長度至少為 約 5、7、10、13、15、17、20、22 或 25 個(gè)核苷酸。通過將PCR引物對,優(yōu)選預(yù)定量的該引物對,與編碼寡核苷酸標(biāo)簽的核酸,優(yōu)選預(yù) 定量的該核酸,在PCR緩沖液中混合,形成PCR反應(yīng)混合物,進(jìn)行PCR反應(yīng)。將該混合物熱 循環(huán)一定的循環(huán)數(shù),該循環(huán)數(shù)一般預(yù)先確定,足以形成PCR反應(yīng)產(chǎn)物。足夠量的產(chǎn)物是能夠 以足以進(jìn)行DNA序列測定的量分離的產(chǎn)物。PCR 一般通過熱循環(huán)進(jìn)行,即在一個(gè)溫度范圍內(nèi)重復(fù)地提高和降低PCR反應(yīng)混合 物的溫度,該范圍的下限為約30°C至約55°C,上限為約90°C至約100°C。提高和降低可以 是連續(xù)的,但優(yōu)選是階段的,在有利于多核苷酸合成、變性和雜交的各個(gè)溫度下具有相對溫 度穩(wěn)定的時(shí)間段。PCR反應(yīng)用任何適當(dāng)?shù)姆椒ㄟM(jìn)行。通常在緩沖的水溶液即PCR緩沖液中發(fā)生,優(yōu)選 為pH 7-9。優(yōu)選含有摩爾過量的引物。為了提高該方法的效率,優(yōu)選較大的摩爾過量。PCR緩沖液還含有脫氧核糖核苷酸三磷酸(多核苷酸合成底物)dATP、dCTP、dGTP 和dTTP,和聚合酶,一般是熱穩(wěn)定的聚合酶,都是足以進(jìn)行引物延伸(多核苷酸合成)反應(yīng) 的量。得到的溶液(PCR混合物)加熱至約90°C -100°C約1-10分鐘,優(yōu)選1-4分鐘。該加 熱階段之后將溶液冷卻至54°C,該溫度是引物雜交優(yōu)選的。合成反應(yīng)可以在一定溫度下發(fā) 生,該溫度的范圍從室溫到高于該溫度聚合酶(誘導(dǎo)劑)即不再有效作用的溫度。因此,例如,如果使用DNA聚合酶,則溫度通常不高于約40°C。重復(fù)該熱循環(huán),直到產(chǎn)生所需量的PCR 產(chǎn)物。一種典型的PCR緩沖液每100微升緩沖液含有下列試劑50mM KC1 ; 10mMTris-HCl pH 8. 3 ;1. 5mM MgCl2 ;0. 001% (wt/vol)明膠,200iiM dATP ;200uM dTTP ;200uM dCTP ; 200 u M dGTP ;和 2. 5 單位棲熱水生菌(Thermus aquaticus) (Taq)DNA 聚合酶 I。用于延伸引物序列的合適的酶包括例如大腸桿菌DNA聚合酶I、Taq DNA聚合酶、 大腸桿菌DNA聚合酶I的Klenow片段、T4DNA聚合酶、其他可以使用的DNA聚合酶、逆轉(zhuǎn)錄 酶,和其他酶,包括熱穩(wěn)定的酶,其有利于以適當(dāng)?shù)姆绞浇M合核苷酸,形成與每條核酸鏈互 補(bǔ)的引物延伸產(chǎn)物。合成通常開始于每個(gè)引物的3'末端,并沿著模板鏈以5'方向前進(jìn), 直到合成終止,產(chǎn)生不同長度的分子。新合成的DNA鏈與其互補(bǔ)鏈形成雙鏈分子,該雙鏈分子可以在分析方法的后續(xù)步 驟中使用。PCR 擴(kuò)增方法在美國專利號 4,683,192,4, 683,202,4, 800,159 和 4,965,188 中詳細(xì)描述,并且至少在 PCR Technology principles andApplications for DNA Amplification, H. Erlich, ed. , Stockton Press, NewYork(1989);禾口 PCR Protocols :A Guide to Methods and Applications, Innis 等人,編,Academic Press, San Diego, Calif. (1990)中詳細(xì)描述。上述所有文獻(xiàn)的內(nèi)容在此引用作為參考。如此處所用的術(shù)語“多核苷酸”用于引物、探針和將要通過引物延伸合成的核酸片 段或區(qū)段時(shí),定義為由兩個(gè)或多個(gè)、優(yōu)選三個(gè)以上脫氧核糖核苷酸組成的分子。如此處所用的術(shù)語“引物”是指從核酸限制性消化物中純化的或合成產(chǎn)生的多核 苷酸,當(dāng)置于誘導(dǎo)合成與核酸鏈互補(bǔ)的引物延伸產(chǎn)物的條件下時(shí),即在核苷酸和聚合試劑 如DNA聚合酶、逆轉(zhuǎn)錄酶等的存在下,以及在合適的溫度和pH下,它能夠作為核酸合成的起 點(diǎn)。為了效率最高,引物優(yōu)選是單鏈,但是也可以是雙鏈形式。如果是雙鏈,則在用來制備延 伸產(chǎn)物之前首先處理該引物,使它與互補(bǔ)鏈分開。優(yōu)選地,引物是一種聚脫氧核糖核苷酸。 引物必須足夠長,以在聚合試劑存在下引發(fā)延伸產(chǎn)物的合成。引物的確切長度取決于許多 因素,包括溫度和引物來源。此處所用的引物選擇為與所要擴(kuò)增的每個(gè)特定序列的不同鏈“基本”互補(bǔ)。意思 是引物必須充分互補(bǔ),以便與相應(yīng)的模板鏈非隨機(jī)地雜交。因此,引物序列可能反映或者可 能不反映模板的準(zhǔn)確序列。多核苷酸引物可以用任何合適的方法制備,例如Narang等人,(1979)Meth. Enzymol. ,68 90 ;美國專利號4,356,270,美國專利號4,458,066,美國專利號4,416,988, 美國專利號4,293,652 ;和Brown等人,(1979)Meth. Enzymol. ,68 109所述的磷酸三酯或
磷酸二酯法。上述所有文獻(xiàn)的內(nèi)容在此引用作為參考。一旦擴(kuò)增出編碼寡核苷酸標(biāo)簽,即可應(yīng)用核酸序列分析確定該標(biāo)簽的序列,并最 終確定選擇的分子的組成,核酸序列分析是用于測定核苷酸序列的眾所周知的方法。核酸 序列分析通過以下方法的組合進(jìn)行(a)基于探針鏈與其互補(bǔ)靶標(biāo)雜交或變性的生理化學(xué) 技術(shù),和(b)與聚合酶的酶反應(yīng)。本發(fā)明進(jìn)一步涉及可以用本發(fā)明的方法制備的化合物,和這樣的化合物的集合, 其作為分離的物質(zhì)或組合形成化學(xué)結(jié)構(gòu)文庫。本發(fā)明的化合物包括下式的化合物 其中X是包含一個(gè)或多個(gè)結(jié)構(gòu)單元的功能部分,Z是在其3’末端與B連接的寡核 苷酸,Y是在其5’末端與C連接的寡核苷酸。A是與X形成共價(jià)鍵的官能團(tuán),B是與Z的 3’ _末端形成鍵的官能團(tuán),C是與Y的5’ -末端形成鍵的官能團(tuán)。D、F和E是將官能團(tuán)A、 C和B與S連接的化學(xué)基團(tuán),S是核心原子或支架。優(yōu)選地,D、E和F各自獨(dú)立地是原子鏈, 如亞烷基鏈或低聚(乙二醇)鏈,D、E和F可以相同或不同,優(yōu)選地有效地使兩個(gè)寡核苷酸 雜交以及功能部分合成。優(yōu)選地,Y和Z基本互補(bǔ),并且在化合物中定向,從而能夠在合適條件下發(fā)生 Watson-Crick堿基配對和雙鏈體形成。Y和Z的長度相同或不同。優(yōu)選地,Y和Z的長度 相同,或者Y和Z之一比另一個(gè)長1至10個(gè)堿基。在一個(gè)優(yōu)選實(shí)施方案中,Y和Z各自為 10個(gè)或更多堿基的長度,并且具有10個(gè)或更多個(gè)堿基對的互補(bǔ)區(qū)。更優(yōu)選地,Y和Z在其 全長上基本互補(bǔ),即它們每十個(gè)堿基對具有不超過1個(gè)錯(cuò)配。最優(yōu)選地,Y和Z在其全長上 互補(bǔ),即,除了 Y或Z上的任何突出端區(qū)域之外,這些鏈通過Watson-Crick堿基配對雜交, 在它們的全長上沒有錯(cuò)配。S可以是單一原子或分子支架。例如,S可以是碳原子、硼原子、氮原子或磷原子, 或多原子支架,如磷酸基或環(huán)基,如環(huán)烷基、環(huán)烯基、雜環(huán)烷基、雜環(huán)烯基、芳基或雜芳基。在 一個(gè)實(shí)施方案中,連接體是如下結(jié)構(gòu)的基團(tuán) 其中n、m和p各自獨(dú)立地是1至約20的整數(shù),優(yōu)選2至8,更優(yōu)選3至6。在一個(gè)
特定實(shí)施方案中,連接體具有以下所示的結(jié)構(gòu)。
在一個(gè)實(shí)施方案中,本發(fā)明的文庫包括由功能部分組成的分子,該功能部分由結(jié)構(gòu)單元組成,其中每個(gè)功能部分都與編碼寡核苷酸可操作連接。編碼寡核苷酸的核苷酸序 列指示功能部分中存在的結(jié)構(gòu)單元,在一些實(shí)施方案中,指示結(jié)構(gòu)單元的連接性或排列。本 發(fā)明具有以下優(yōu)點(diǎn),用來構(gòu)建功能部分及用來構(gòu)建寡核苷酸標(biāo)簽的方法可以在相同的反應(yīng) 介質(zhì)中,優(yōu)選地在水性介質(zhì)中進(jìn)行,從而與現(xiàn)有技術(shù)的方法相比簡化了制備文庫的方法。在 寡核苷酸連接步驟和結(jié)構(gòu)單元添加步驟都可以在水性介質(zhì)中進(jìn)行的某些實(shí)施方案中,每個(gè) 反應(yīng)都具有不同的最適PH。在這些實(shí)施方案中,結(jié)構(gòu)單元添加反應(yīng)可以在合適的含水緩沖 液中在合適的PH和溫度下進(jìn)行。然后緩沖液可以用提供適于寡核苷酸連接之pH的含水緩 沖液替換。本發(fā)明的方法的一個(gè)優(yōu)點(diǎn)是它們能夠用來制備含有大量化合物的文庫。利用公知 方法如聚合酶鏈反應(yīng)(“PCR”)擴(kuò)增編碼寡核苷酸序列的能力意味著,即使回收的拷貝較 少,也能夠鑒定選擇的分子。這允許實(shí)際應(yīng)用極大的文庫,其由于高度復(fù)雜性,要么包含相 對較少拷貝的任何特定文庫成員,要么需要使用極大的體積。例如,由108個(gè)獨(dú)特結(jié)構(gòu)組成, 其中每個(gè)結(jié)構(gòu)具有l(wèi)xlO12個(gè)拷貝(約1皮摩爾)的文庫,需要約100L的1 y M有效濃度的 溶液。對于相同的文庫,如果每個(gè)成員有1,000,000個(gè)拷貝,則在liiM有效濃度下需要的 體積為100 ii L。在一個(gè)優(yōu)選實(shí)施方案中,文庫包含約103至約1015個(gè)拷貝的每個(gè)文庫成員。假定 文庫成員之間的合成效率有差異,則不同文庫成員在任何特定文庫中可能具有不同的拷貝 數(shù)。因此,盡管文庫中理論存在的每個(gè)成員的拷貝數(shù)可能相同,但是任何特定文庫成員的實(shí) 際拷貝數(shù)與任何其他成員的拷貝數(shù)無關(guān)。更優(yōu)選地,本發(fā)明的化合物文庫包括至少約105、 106或107個(gè)拷貝的每個(gè)文庫成員,或基本上所有文庫成員。“基本上所有”文庫成員含意是 至少約85 %的文庫成員,優(yōu)選至少約90 %,更優(yōu)選至少約95 %的文庫成員。優(yōu)選地,文庫包含足夠拷貝數(shù)的每個(gè)成員,可對生物靶標(biāo)進(jìn)行多輪(即兩輪或兩 輪以上)選擇,在最后一輪選擇后剩余足夠數(shù)量的結(jié)合分子,使剩余的分子的寡核苷酸標(biāo) 簽?zāi)軌驍U(kuò)增,因此能夠識別結(jié)合分子的功能部分。這種選擇方法的示意圖在圖6中顯示,其 中1和2代表文庫成員,B是靶分子,X是與B可操作連接的部分,使得能夠從選擇介質(zhì)中除 去B。在該實(shí)例中,化合物1與B結(jié)合,而化合物2不與B結(jié)合。如第1輪所示,該選擇過程 包括(I)在適合化合物1與B結(jié)合的條件下使包含化合物1和2的文庫接觸B-X ; (II)除 去未結(jié)合的化合物2,(III)從B上解離化合物1,并從反應(yīng)介質(zhì)中除去BX。第1輪的結(jié)果 是相對于化合物2富含化合物1的分子集合。后續(xù)使用步驟I-III的幾輪導(dǎo)致化合物1相 對于化合物2的進(jìn)一步富集。盡管圖6顯示了 3輪選擇,但是實(shí)際上可以使用任何輪數(shù),例 如1至10輪,以實(shí)現(xiàn)所需的結(jié)合分子相對于非結(jié)合分子的富集。在圖6所示的實(shí)施方案中,在任何選擇輪數(shù)之后剩余的化合物沒有擴(kuò)增(更多拷 貝的合成)。這樣的擴(kuò)增可以產(chǎn)生與選擇后剩余的化合物的相對量不一致的化合物的混合 物。這種不一致是由于這一事實(shí),即某些化合物可能比其他化合物更容易合成,因此可能在 選擇后以與其存在不成比例的方式擴(kuò)增。例如,如果化合物2比化合物1更容易合成,則第 2輪后剩余的分子的擴(kuò)增將導(dǎo)致化合物2相對于化合物1的不成比例擴(kuò)增,獲得的化合物的 混合物具有更低的(如果有的話)化合物1相對于化合物2的富集。在一個(gè)實(shí)施方案中,利用任何公知的固定技術(shù)將靶標(biāo)固定在固體支持體上。固體 支持體可以是,例如層析柱或膜中所含的水不溶性基質(zhì)。編碼文庫可以加到層析柱中所含的水不溶性基質(zhì)上。然后洗柱,除去非特異性結(jié)合物。然后通過改變PH、鹽濃度、有機(jī)溶劑 濃度或其他方法,如與已知配體競爭靶標(biāo),使與靶標(biāo)結(jié)合的化合物解離。在另外一個(gè)實(shí)施方案中,靶標(biāo)在溶液中游離,與編碼文庫溫育。通過大小分離步 驟,如凝膠過濾或超濾,選擇性分離與靶標(biāo)(在此也稱作“配體”)結(jié)合的化合物 。在一個(gè)實(shí) 施方案中,編碼化合物與靶生物分子的混合物通過大小排阻層析柱(凝膠過濾),從未結(jié)合 的化合物中分離任何配體_靶標(biāo)復(fù)合物。將該配體_靶標(biāo)復(fù)合物轉(zhuǎn)移到反相層析柱上,將 配體與靶標(biāo)解離。解離的配體然后通過PCR擴(kuò)增和編碼寡核苷酸的序列分析進(jìn)行分析。在 靶標(biāo)的固定可導(dǎo)致活性喪失的情況下,該方法特別有利。一旦通過上述方法鑒定了單一配體,即可以應(yīng)用各種水平的分析獲得結(jié)構(gòu)-活性 關(guān)系的信息,并指導(dǎo)配體親和力、特異性和生物活性的進(jìn)一步優(yōu)化。對于來源于同一支架的 配體,可以利用三維分子模建鑒定這些配體共同的顯著結(jié)構(gòu)特征,從而產(chǎn)生可能在靶生物 分子上共同部位結(jié)合的小分子配體家族??梢詰?yīng)用多種篩選方法獲得對一個(gè)靶標(biāo)具有高親和力而對于另一個(gè)密切相關(guān)的 靶標(biāo)具有顯著較弱親和力的配體。一種篩選策略是在平行實(shí)驗(yàn)中鑒定兩個(gè)生物分子的配 體,接著通過交叉參考對比排除共同的配體。在該方法中,每個(gè)生物分子的配體都可以如以 上所述單獨(dú)鑒定。該方法與固定的靶生物分子和在溶液中游離的靶生物分子都匹配。對于固定的靶生物分子,另外一種策略是增加一個(gè)預(yù)選步驟,以從文庫中排除與 非靶生物分子結(jié)合的所有配體。例如,第一生物分子可以如上所述與文庫接觸。然后從形 成的任何第一生物分子_配體復(fù)合物中分離不與第一生物分子結(jié)合的化合物。然后第二生 物分子接觸不與第一生物分子結(jié)合的化合物。與第二生物分子結(jié)合的化合物可以如上所述 鑒定,它們對于第二生物分子比對于第一生物分子具有顯著較高的親和力。也可以使用通過上述方法鑒定的具有未知功能的生物分子的配體,來確定該生物 分子的生物功能。這是有利的,因?yàn)楸M管新的基因序列不斷鑒定,但是這些序列編碼的蛋白 質(zhì)的功能和這些蛋白質(zhì)作為新藥發(fā)現(xiàn)及開發(fā)靶標(biāo)的有效性難以確定,并且可能是應(yīng)用基因 組信息治療疾病的最大障礙。通過本發(fā)明所述方法獲得的靶標(biāo)特異性配體可以在全細(xì)胞生 物測定或適當(dāng)?shù)膭?dòng)物模型中應(yīng)用,用于理解靶蛋白質(zhì)的功能和靶蛋白質(zhì)用于治療性干預(yù)的 有效性。該方法也可證實(shí)靶標(biāo)特別適合小分子藥物發(fā)現(xiàn)。在一個(gè)實(shí)施方案中,本發(fā)明的文庫中的一種或多種化合物鑒定為特定生物分子的 配體。然后可以在體外試驗(yàn)中評價(jià)這些化合物與生物分子結(jié)合的能力。優(yōu)選地,合成結(jié)合 化合物的功能部分,其不含寡核苷酸標(biāo)簽或連接體部分,并且評價(jià)這些功能部分與生物分 子結(jié)合的能力。也可以用體外無細(xì)胞或基于細(xì)胞的試驗(yàn)評價(jià)功能部分與生物分子結(jié)合對生物分 子功能的影響。對于具有已知功能的生物分子,試驗(yàn)可以包括比較在存在及不存在配體的 情況下生物分子的活性,例如,通過直接測定活性,如酶活性,或者通過間接測定,例如該生 物分子影響的細(xì)胞功能。如果該生物分子具有未知的功能,則表達(dá)該生物分子的細(xì)胞可以 接觸配體,并且評價(jià)該配體對該細(xì)胞的生存力、功能、表型和/或基因表達(dá)的影響。這樣的 體外試驗(yàn)可以是,例如,細(xì)胞死亡測定、細(xì)胞增殖測定或病毒復(fù)制試驗(yàn)。例如,如果該生物分 子是病毒表達(dá)的蛋白質(zhì),則感染病毒的細(xì)胞可以與該蛋白質(zhì)的配體接觸。然后可以評價(jià)該 配體與蛋白質(zhì)的結(jié)合對病毒生存力的影響。
利用本發(fā)明的方法鑒定的配體也可以在體內(nèi)模型中或在人體內(nèi)進(jìn)行評價(jià)。例如, 配體可以在產(chǎn)生該生物分子的動(dòng)物或生物體中進(jìn)行評價(jià)??梢詼y定動(dòng)物或生物體在健康狀 態(tài)(例如疾病進(jìn)展)上產(chǎn)生的任何變化。 對于一種未知功能的生物分子,如蛋白質(zhì)或核酸分子,與生物分子結(jié)合的配體對 產(chǎn)生該生物分子的細(xì)胞或生物體的影響可以提供關(guān)于該生物分子生物功能的信息。例如, 觀察到特定細(xì)胞過程在配體存在下受到抑制,指示該過程至少部分依賴于該生物分子的功 能。利用本發(fā)明的方法鑒定的配體也可以用作與與它們結(jié)合的生物分子的親和試劑。 在一個(gè)實(shí)施方案中,利用這樣的配體實(shí)現(xiàn)生物分子的親和純化,例如,通過利用連接有一種 或多種這樣的配體的固相對含有該生物分子的溶液進(jìn)行層析。通過下面的實(shí)施例進(jìn)一步說明本發(fā)明,這些實(shí)施例不應(yīng)視為限制。在本申請全文 中引用的所有參考文獻(xiàn)、專利和公布的專利申請以及附圖和序列表的內(nèi)容,都在此引用作 為參考。
實(shí)施例實(shí)施例1 具有大約IO5個(gè)成員的文庫的合成和表征含有大約IO5個(gè)不同成員的文庫的合成使用下列試劑完成化合物1 脫氧核糖核苷酸的單字母密碼A =腺苷C =胞苷G=鳥苷T=胸苷結(jié)構(gòu)單元前體 寡核苷酸標(biāo)簽序列標(biāo)簽編號5,-P04-GCAACGAAG (SEQ ID NO 1)1. 1ACCGTTGCT-P03-5,(SEQ ID NO 2)
5,-p03_gcgtacaag(seq id no :3)1.2accgcatgt-p03_5,(seq id no :4)
5' -po3-gctctgtag(seq id no 5)1.3accgagaca-p03-5,(seq id no 6)5,-p03-gtgccatag(seq id no :7)1.4accacggta-p03_5,(seq id no 8)5,-p03-gttgaccag(seq id no :9)1.5accaactgg-p03-5,(seq id no 10)5,-p03-cgacttgac(seq id no :11)1.6caagtcgca-p03_5,(seq id no 12)5,-p03-cgtagtcag(seq id no :13)1.7acgcatcag-p03_5,(seq id no 14)5,-p03_ccagcatag(seq id no :15)1.8acggtcgta-p03-5,(seq id no 16)5,-p03-cctacagag(seq id no :17)1.9acggatgtc-p03_5,(seq id no 18)5,-p03-ctgaacgag (seq id no 19)1. 10cgttcagca-p03-5,(seq id no 20)5,-p03-ctccagtag (seq id no 21)1. 11acgaggtca-p03_5,(seq id no 22)5,-p03-taggtccag (seq id no :23)1. 12acatccagg-p03_5,(seq id no 24)5,-p03-gcgtgttgt (seq id no 25)2. 1tccgcacaa-p03-5,(seq id no 26)5,-p03-gcttggagt(seq id no :27) 2.2tccgaacct-p03-5,(seq id no 28)5,-p03_gtcaagcgt(seq id no :29) 2.3tccagttcg-p03-5,(seq id no 30)5,-p03-caagagcgt(seq id no :31) 2.4tcgttctcg-p03-5,(seq id no 32)5,-p03_cagttcggt(seq id no :33) 2.5tcgtcaagc-p03_5,(seq id no 34)5,-po3-cgaaggagt (seq id no :35) 2.6tcgcttcct-p03-5,(seq id no 36)5,-po3-cggtgttgt (seq id no :37) 2.7tcgccacaa-p03-5,(seq id no 38)5,-p03-cgttgctgt(seq id no :39) 2.8tcgcaacga-p03-5,(seq id no 40)5,-p03-ccgatctgt(seq id no :41) 2.9
tcggctaga-p03-5,(seq id no 42)5,-p03-ccttctcgt (seq id no 43) 2. 10tcggaagag-p03_5,(seq id no 44)5,-p03-tgagtccgt (seq id no 45) 2. 11tcactcagg-p03-5,(seq id no 46)
5,-p03-tgctacggt (seq id no 47) 2. 12tcagattgc-p03_5,(seq id no 48)5,-p03-gtgcgttga (seq id no 49) 3. 1cacacgcaa-p03-5,(seq id no 50)5,-p03-gttggcaga(seq id no :51) 3.2cacaaccgt-p03_5,(seq id no 52)5,-p03-cctgtagga(seq id no :53) 3.3caggacatc-p03_5,(seq id no 54)5,-p03-ctgcgtaga(seq id no :55) 3.4cagacgcat-p03-5,(seq id no 56)5,-p03-cttacgcga(seq id no :57) 3.5cagaatgcg-p03_5,(seq id no 58)5,-p03_tggtcacga(seq id no :59) 3.6caaccagtg-p03-5,(seq id no 60)5,-po3-tcagagcga (seq id no :6i) 3.7caagtctcg-p03-5,(seq id no 62)5,-p03-ttgctcgga(seq id no :63) 3.8caaacgagc-p03_5,(seq id no 64)5,-p03_gcagttgga(seq id no :65) 3.9cacgtcaac-p03_5,(seq id no 66)5,-p03-gcctgaaga (seq id no 67) 3. 10cacggactt-p03-5,(seq id no 68)5,-p03-gtagccaga (seq id no 69) 3. 11cacatcggt-p03_5,(seq id no 70)5,-p03-gtcgcttga (seq id no 71) 3. 12cacagcgaa-p03_5,(seq id no 72)5,-p03-gcctaagtt (seq id no 73) 4. 1ctcggattc-p03-5,(seq id no 74)5,-p03-gtagtgctt(seq id no :75) 4.2ctcatcacg-p03-5,(seq id no 76)5,-p03-gtcgaagtt(seq id no :77) 4.3ctcagcttc-p03-5,(seq id no 78)5,-p03-gtttcggtt(seq id no :79) 4.4ctcaaagcc-p03-5,(seq id no 80)
5,-P03-CAGCGTTTT(SEQ ID NO :81) 4.5CTGTCGCAA-P03-5,(SEQ ID NO 82)5,-P03-CATACGCTT(SEQ ID NO :83) 4.6CTGTATGCG-P03-5,(SEQ ID NO 84)5,-P03-CGATCTGTT(SEQ ID NO :85) 4.7CTGCTAGAC-P03-5,(SEQ ID NO 86) 5,-P03-CGCTTTGTT(SEQ ID NO :87) 4.8CTGCGAAAC-P03-5,(SEQ ID NO 88)5,-P03-CCACAGTTT(SEQ ID NO :89) 4.9CTGGTGTCA-P03-5,(SEQ ID NO 90)5,-P03-CCTGAAGTT (SEQ ID NO 91) 4. 10CTGGACTTC-P03-5,(SEQ ID NO 92)5,-P03-CTGACGATT (SEQ ID NO 93) 4. 11CTGACTGCT-P03-5,(SEQ ID NO 94)5,-P03-CTCCACTTT (SEQ ID NO 95) 4. 12CTGAGGTGA-P03-5,(SEQ ID NO 96)5,-P03-ACCAGAGCC (SEQ ID NO 97) 5. 1AATGGTCTC-P03-5,(SEQ ID NO 98)5,-P03-ATCCGCACC(SEQ ID NO :99) 5.2AATAGGCGT-P03-5,(SEQ ID NO : 100)5' -PO3-GACGACACC (SEQ ID NO 101) 5.3AACTGCTGT-P03-5,(SEQ ID NO : 102)5' -PO3-GGATGGACC (SEQ ID NO 103) 5.4AACCTACCT-P03-5,(SEQ ID NO : 104)5' -PO3-GCAGAAGCC (SEQ ID NO 105)5.5AACGTCTTC-P03-5,(SEQ ID NO : 106)5' -PO3-GCCATGTCC (SEQ ID NO 107)5.6AACGGTACA-P03_5,(SEQ ID NO : 108)5' -PO3-GTCTGCTCC (SEQ ID NO 109)5.7AACAGACGA-P03_5,(SEQ ID NO : 110)5' -PO3-CGACAGACC (SEQ ID NO 111)5.8AAGCTGTCT-P03-5,(SEQ ID NO : 112)5' -PO3-CGCTACTCC (SEQ ID NO 113)5.9AAGCGATGA-P03_5,(SEQ ID NO : 114)5,-PO3-CCACAGACC (SEQ ID NO 115)5. 10AAGGTGTCT-P03-5,(SEQ ID NO : 116)5,-PO3-CCTCTCTCC (SEQ ID NO : 117)5. 11AAGGAGAGA-P03_5,(SEQ ID NO : 118)5,-PO3-CTCGTAGCC (SEQ ID NO 119)5. 12
AAGAGCATC-P03_5,(SEQ ID NO : 120)IX 連接酶緩沖液50mM Tris, pH 7. 5 ; IOmM 二硫蘇糖醇;IOmMMgCl2 ;2. 5mM ATP ; 50mM NaCl。IOX 連接酶緩沖液500mM Tris, pH 7. 5 ; IOOmM 二硫蘇糖醇;IOOmM MgCl2 ;25mM ATP ; 500mM NaCl。循環(huán)1向12個(gè)PCR 管的每一個(gè)中加入50 μ L ImM化合物1的水溶液;75 μ L 0. 80mM標(biāo) 簽1. 1-1. 12之一的溶液;15 μ L IOX連接酶緩沖液和10 μ L去離子水。將這些管加熱到 950C 1分鐘,然后冷卻到16°C 10分鐘。向每個(gè)管中加入在50 μ 1 IX連接酶緩沖液中的 5,000 單位的 Τ4 DNA 連接酶(2. 5 μ L,2,000,000 單位 /mL 溶液(New England Biolabs,目 錄號M0202)),獲得的溶液在16°C下溫育16小時(shí)。連接后,將樣品轉(zhuǎn)移到1. 5ml Eppendorf管中,用20 μ L 5Μ NaCl水溶液和500 μ L 冷(_20°C )乙醇處理,在_20°C下保持1小時(shí)。離心后,棄去上清液,用70%乙醇水溶液 在-20°C下洗滌沉淀物。然后將每個(gè)沉淀物溶解于150 μ L 150mM硼酸鈉緩沖液,pH 9. 4中。在DMF中制備以分別0. 25Μ的濃度含有結(jié)構(gòu)單元前體BBl至ΒΒ12之一、N, N- 二 異丙基乙醇胺和0- (7-氮雜苯并三唑-1-基)-1,1,3,3-四甲基脲六氟磷酸的貯存液,并在 室溫下攪拌20分鐘。向上述每個(gè)沉淀溶液中添加結(jié)構(gòu)單元前體溶液,提供相對于連接體10 倍過量的結(jié)構(gòu)單元前體。攪拌獲得的溶液。20分鐘后向反應(yīng)混合物中加入另外10個(gè)當(dāng)量 的結(jié)構(gòu)單元前體,40分鐘后加入另外10個(gè)當(dāng)量。DMF在反應(yīng)混合物中的終濃度為22%。然 后在4°C下攪拌反應(yīng)溶液過夜。使用50mM乙酸四乙銨水溶液(pH = 7. 5)和乙腈,和2-46% 乙腈的梯度,通過RP-HPLC在14分鐘內(nèi)監(jiān)測反應(yīng)的進(jìn)展。當(dāng)約95%的起始材料(連接體) ?;瘯r(shí)終止反應(yīng)。?;蠛喜⒎磻?yīng)混合物,凍干至干燥。然后通過HPLC純化凍干的物質(zhì), 合并對應(yīng)于文庫的級分(?;a(chǎn)物),并凍干。該文庫溶解于2. 5ml 0. OlM磷酸鈉緩沖液(pH = 8. 2)中,向其中加入0. Iml哌啶 (4% ν/ν)。加入哌啶產(chǎn)生在混合時(shí)不溶解的混濁。反應(yīng)混合物在室溫下攪拌50分鐘,然后 離心(14,OOOrpm)混濁的溶液,用200 μ 1移液管除去上清液,將沉淀物重懸浮于0. Iml水 中。含水洗液與上清液混合,棄去沉淀。通過加入過量的冰冷的乙醇使乙醇在反應(yīng)液中的 終濃度為70% ν/ν,從溶液中沉淀脫保護(hù)的文庫。離心含水乙醇混合物,產(chǎn)生含有該文庫的 白色沉淀物。用冷70%乙醇水溶液洗滌沉淀物一次。除去溶劑后,使沉淀物風(fēng)干(約5分 鐘),除去痕量的乙醇,然后在循環(huán)2中使用。在第1輪中使用的標(biāo)簽和相應(yīng)的結(jié)構(gòu)單元前 體在下面的表1中列出。表 1
結(jié)構(gòu)單元前體 標(biāo)簽^ BBiITn
ΒΒ2 Γθ 循環(huán)2-5對于其中每一個(gè)循環(huán),將前一循環(huán)產(chǎn)生的混合的溶液分成12等份,每份50 μ 1,置 于PCR管中。向每管中加入含有不同標(biāo)簽的溶液,除循環(huán)3-5省略循環(huán)1所述的HPLC純化 步驟之外,如循環(huán)1所述進(jìn)行連接、純化和酰化。用于循環(huán)2-5的標(biāo)簽與結(jié)構(gòu)單元前體的對 應(yīng)關(guān)系在表2中給出。利用以上對于標(biāo)簽連接所述的方法,將循環(huán)5的產(chǎn)物與以下所示的封閉引物連接。5,-P03-GGCACATTGATTTGGGAGTCAGTGTAACTAAACCCTCAGT-PO3-5,表2 結(jié)果上述合成過程具有產(chǎn)生含有125(約249,000)個(gè)不同結(jié)構(gòu)的文庫的能力。通過對 每一循環(huán)的產(chǎn)物進(jìn)行凝膠電泳,監(jiān)測文庫的合成。5個(gè)循環(huán)中每一個(gè)的結(jié)果和封閉引物連接 后的最終文庫在圖7中顯示。標(biāo)為“headpiece”的化合物是化合物1。該圖顯示每個(gè)循環(huán) 導(dǎo)致預(yù)期的分子量增加,每一循環(huán)的產(chǎn)物在分子量上基本均勻。實(shí)施例2 具有大約IO8個(gè)成員的文庫的合成和表征含有大約IO8個(gè)不同成員的文庫的合成使用下列試劑實(shí)現(xiàn)化合物2 脫氧核糖核苷酸的單字母密碼A =腺苷C =胞苷G=鳥苷T =胸苷結(jié)構(gòu)單元前體 表3 循環(huán)1中使用的寡核苷酸標(biāo)簽
標(biāo)簽編號頂鏈序列底鏈序列
5 ’-P03-AAATCGATGTGGTC ACTCAG5 '-P03-GAGTGACCACATCGATTTGG
1.1(SEQIDN0:121)(SEQ ID NO: 122) 5'-P03-AAATCGATGTGGACTAGGAG5 '-P03-CCTAGTCCACATCGATTTGG
1.2(SEQ ID NO: 123)(SEQ ID NO: 124)
5 '-P03-AAATCGATGTGCCGTATGAG5 '-P03-CATACGGCACATCGATTTGG
1.3(SEQ ID NO: 125)(SEQ ID NO: 126) 5'-P03-AAATCGATGTGCTGAAGGAG5 '-P03-CCTTC AGCACATCGATTTGG
1.4(SEQ ID NO: 127)(SEQ ID NO: 128)
5,-P03-AAATCGATGTGGACTAGCAG5,-P03-GCTAGTCCACATCGATTTGG
1.5(SEQ ID NO: 129)(SEQ ID NO: 130)
5 '-P03-AAATCGATGTGCGCTAAGAG5 '-P03-CTTAGCGCACATCGATTTGG
1.6(SEQ ID NO: 131)(SEQ ID NO: 132)
5 '-P03-AAATCGATGTGAGCCGAGAG5 '-P03-CTCGGCTC AC ATCG ATTTGG
1.7(SEQIDNO:133)(SEQ ID NO: 134)
1.85 '-P03-AAATCGATGTGCCGTATCAG5 '-P03-GATACGGCACATCGATTTGG(SEQIDNO:135)(SEQ ID NO:136)
5 ’ -P03-AAATCGATGTGCTGAAGCAG5 ’ -P03 -GCTTC AGC AC ATCGATTTGG
1.9(SEQ ID NO: 137)(SEQ ID NO: 138)
5 '-P03-AAATCGATGTGTGCGAGTAG5 '-P03-ACTCGCACACATCGATTTGG
1.10(SEQ ID NO: 139)(SEQ ID NO: 140)
5 ’ -P03-AAATCGATGTGTTTGGCGAG5' -P03-CGCCAAACACATCGATTTGG
1.11(SEQ ID NO: 141)(SEQ IDNO:142)
5 '-P03-AAATCGATGTGCGCTAACAG5' -P03 -GTT AGCGC AC ATCGATTTGG
1.12_(SEQ ID NO: 143)_(SEQ ID NO: 144)_
5 '-P03-AAATCGATGTGAGCCGACAG5'-P03-GTCGGCTC AC ATCGATTTGG
1.13(SEQ ID NO: 145)(SEQ ID NO: 146)
5 '-P03-AAATCGATGTGAGCCGAAAG5'-P03-TTCGGCTC AC ATCGATTTGG
1.14(SEQ ID NO: 147)(SEQ ID NO: 148)
5 '-P03-AAATCGATGTGTCGGTAGAG5'-P03-CTACCGACACATCGATTTGG
1.15(SEQ ID NO: 149)(SEQ ID NO: 150)
5 '-P03-AAATCGATGTGGTTGCCGAG5,-P03、CGGCAACCACATCGATTTGG
1.16(SEQ ID NO: 151)(SEQ ID NO: 152)
5' -P03-AAATCGATGTGAGTGCGTAG5'-P03-ACGCACTCACATCGATTTGG
1.17(SEQ ID NO: 153)(SEQ ID NO: 154) 5'-P03-AAATCGATGTGGTTGCCAAG5'-P03-TGGCAACCACATCGATTTGG
1.18(SEQ ID NO: 155)(SEQ ID NO: 156)
5' -P03 -AAATCGATGTGTGCGAGGAG5'-P03-CCTCGCACACATCGATTTGG
1.19(SEQ ID NO: 157)(SEQ ID NO: 158) 5'-P03-AAATCGATGTGGAACACGAG5 '-P03-CGTGTTCCACATCGATTTGG
1.20(SEQ ID NO: 159)(SEQ ID NO: 160) 5'-P03-AAATCGATGTGCTTGTCGAG5 '-P03-CGAC AAGC AC ATCGATTTGG
1.21(SEQIDNO:161)(SEQ ID NO: 162) 5'-P03-AAATCGATGTGTTCCGGTAG5 '-P03-AOCCGGAAC AC ATCG ATTTGG
1.22(SEQ ID NO: 163)(SEQ ID NO: 164) 5'-P03-AAATCGATGTGTGCGAGCAG5 '-P03-GCTCGCACACATCGATTTGG
1.23(SEQ ID NO: 165)(SEQ ID NO: 166) 5'-P03-AAATCGATGTGGTCAGGTAG5' -P03-ACCTGACC AC ATCGATTTGG
1.24_(SEQ ID NO: 167)_(SEQ ID NO: 168)_
5'-P03-AAATCGATGTGGCCTGTTAG5' -P03-AAC AGGCC ACATCGATTTGG
1.25(SEQ ID NO: 169)(SEQ ID NO: 170)
5 '-P03-AAATCGATGTGGAACACCAG5' -P03-GGTGTTCC AC ATCGATTTGG
1.26(SEQ ID NO: 171)(SEQ ID NO: 172) 5,-P03-AAATCGATGTGCTTGTCCAG5,-P03-GGACAAGCACATCGATTTGG
1.27(SEQ ID NO: 173)(SEQ ID NO: 174)
5 '-P03-AAATCGATGTGTGCGAGAAG5 '-P03-TCTCGCACACATCGATTTGG1.28(SEQIDNO:175)(SEQ ID NO:176)
5 '-P03-AAATCGATGTGAGTGCGGAG5 '-P03-CCGC ACTC AC ATCGATTTGG
1.29(SEQ ID NO: 177)(SEQ ID NO: 178)
5 '-P03-AAATCGATGTGTTGTCCGAG5 '-P03-CGGACAACACATCGATTTGG
1.30(SEQ ID NO: 179)(SEQ ID NO: 180)
5 '-P03-AAATCGATGTGTGGAACGAG5 '-P03-CGTTCCACACATCGATTTGG
1.31(SEQ ID NO: 181)(SEQ ID NO: 182)
5 '-P03-AAATCGATGTGAGTGCGAAG5 '-P03-TCGC ACTC ACATCGATTTGG
1.32(SEQ ID NO: 183)(SEQ ID NO: 184)
5 '-P03-AAATCGATGTGTGGAACCAG5'-P03-GGTTCCACACATCGATTTGG
1.33(SEQ ID NO: 185)(SEQ ID NO: 186)
5 '-P03-AAATCGATGTGTTAGGCGAG5'-P03-CGCCTAACACATCGATTTGG
1.34(SEQ ID NO: 187)(SEQ ID NO: 188)
5 '-P03-AAATCGATGTGGCCTGTGAG5 '-P03-CAC AGGCCAC ATCG ATTTGG
1.35(SEQ ID NO: 189)(SEQ ID NO: 190) 5'-P03-AAATCGATGTGCTCCTGTAG5 '-P03-AC AGGAGC AC ATCG ATTTGG
1.36_(SEQ ID NO: 191)_(SEQ ID NO: 192)_
5'-P03-AAATCGATGTGGTCAGGCAG5'-P03-GCCTGACC AC ATCG ATTTGG
1.37(SEQIDNO:193)(SEQ ID NO:194)
5 '-P03-AAATCGATGTGGTCAGGAAG5 '-P03-TCCTGACC ACATCGATTTGG
1.38(SEQ ID NO: 195)(SEQ ID NO: 196)
5 '-P03-AAATCGATGTGGTAGCCGAG5,-P03-CGGCTACCACATCGATTTGG
1.39(SEQ ID NO: 197)(SEQ ID NO: 198)
5 '-P03-AAATCGATGTGGCCTGTAAG5 '-P03-TACAGGCCAC ATCGATTTGG
1.40(SEQ ID NO: 199)(SEQ ID N0:200)
5 '-P03-AAATCGATGTGCTTTCGGAG5 '-P03-CCG AAAGC AC ATCG ATTTGG
1.41(SEQ ID N0:201)(SEQ ID N0:202)
5 '-P03-AAATCGATGTGCGTAAGGAG5 '-P03-CCTT ACGC AC ATCG ATTTGG
1.42(SEQ ID N0:203)(SEQ ID N0:204)
5 '-P03-AAATCGATGTGAGAGCGTAG5 '-P03-ACGCTCTCAC ATCGATTTGG
1.43(SEQ ID N0:205)(SEQ ID N0:206)
5 '-P03-AAATCGATGTGGACGGCAAG5 '-P03-TGCCGTCC AC ATCGATTTGG
1.44(SEQ ID N0:207)(SEQ ID N0:208)
5 '-P03-AAATCGATGTGCTTTCGCAG5 '-P03-GCGAAAGC AC ATCGATTTGG
1.45(SEQ ID N0:209)(SEQ ID N0.210) 5'-P03-AAATCGATGTGCGTAAGCAG5'-P03-GCTTACGCACATCGATTTGG
1.46(SEQIDNO:211)(SEQ ID NO:212)
1.475 '-P03-AAATCGATGTGGCTATGGAG5 '-P03-CC ATAGCC AC ATCG ATTTGG
(SEQIDNO:213)(SEQIDNO:214)5 '-P03-AAATCGATGTGACTCTGGAG5 '-P03-CCAGAGTCACATCGATTTGG1.48(SEQIDNO:215)(SEQIDNO:216)5 '-P03-AAATCGATGTGCTGGAAAG5 '-P03-TTCCAGCACATCGATTTGG1.49(SEQIDNO:217)(SEQIDNO:218)5,-P03-AAATCGATGTGCCGAAGTAG5 '-P03-ACTTCGGCACATCGATTTGG1.50(SEQIDNO:219)(SEQ ID N0:220)5 '-P03-AAATCGATGTGCTCCTGAAG5,-P03-TCAGGAGCACATCGATTTGG1.51(SEQIDNO:221)(SEQ ID NO:222)5 '-P03-AAATCGATGTGTCCAGTCAG5'-P03-GACTGGACACATCGATTTGG1.52(SEQ ID NO:223)(SEQ ID NO:224)5 '-P03-AAATCGATGTGAGAGCGGAG5 '-P03-CCGCTCTCACATCGATTTGG1.53(SEQ ID NO:225)(SEQ ID NO:226)5,-P03-AAATCGATGTGAGAGCGAAG5 '-P03-TCGCTCTCACATCGATTTGG1.54(SEQ ID NO:227)(SEQ ID NO:228)5' -P03-AAATCGATGTGCCGAAGGAG5 '-P03-CCTTCGGCACATCGATTTGG1.55(SEQ ID NO:229)(SEQ ID N0:230)5 '-P03-AAATCGATGTGCCGAAGCAG5 '-P03-GCTTCGGCACATCGATTTGG1.56(SEQIDNO:231)(SEQ ID NO:232)5 '-P03-AAATCGATGTGTGTTCCGAG5 '-P03-CGGAACACACATCGATTTGG1.57(SEQ ID NO:233)(SEQ ID NO:234)5 '-P03-AAATCGATGTGTCTGGCGAG5 '-P03-CGCCAGACACATCGATTTGG1.58(SEQIDNO-.235)(SEQ ID NO-.236)5 '-P03-AAATCGATGTGCTATCGGAG5 '-P03-CCGATAGCACATCGATTTGG1.59(SEQ ID NO:237)(SEQIDNO:238)5 ’ -P03-AAATCGATGTGCGAAAGGAG5 ’ -P03-CCTTTCGC ACATCGATTTGG1.60(SEQ ID NO:239)(SEQ ID N0:240)5 ’ -P03-AAATCGATGTGCCGAAGAAG5,-P03-TCTTCGGC ACATCGATTTGG1.61(SEQIDNO:241)(SEQ ID NO:242)5 '-P03-AAATCGATGTGGTTGCAGAG5 ’ -P03-CTGCAACCACATCGATTTGG1.62(SEQ ID NO:243)(SEQ ID NO:244)5 '-P03-AAATCGATGTGGATGGTGAG5 '-P03-CACCATCCACATCGATTTGG1.63(SEQ ID NO:245)(SEQ ID NO:246)5'-P03-AAATCGATGTGCTATCGCAG5 ’ -P03-GCGATAGCACATCGATTTGG1.64(SEQ ID NO:247)(SEQ ID NO:248)5 '-P03-AAATCGATGTGCGAAAGCAG5' -P03-GCTTTCGC ACATCGATTTGG1.65(SEQ ID NO:249)(SEQ ID N0:250)5 '-P03-AAATCGATGTGACACTGGAG5'-P03-CCAGTGTCACATCGATTTGG1.66(SEQIDNO:251)(SEQ ID NO:252)D315]
465 '-P03-AAATCGATGTGTCTGGCAAG
1.67(SEQ ID NO:253)
5 '-P03-AAATCGATGTGGATGGTCAG
1.68(SEQ ID NO:255)
5 '-P03-AAATCGATGTGGTTGCACAG
1.69(SEQ ID NO:257)
5 '-P03-AAATCGATGTGGGCATCGAG
1.70(SEQ ID NO:259)
5 '-P03-AAATCGATGTGTGCCTCCAG
1.71(SEQIDNO:261)
5 '-P03-AAATCGATGTGTGCCTCAAG
1.72_(SEQ ID NO:263)_
5'-P03-TGCCAGACACATCGATTTGG (SEQ ID NO:254)
5 '-P03-GACCATCCACATCGATTTGG (SEQ ID NO:256)
5 '-P03-GTGCAACCACATCGATTTGG (SEQ ID NO:258)
5'-P03-CGATGCCCCATCCGA TTT GG (SEQ ID N0:260)
5 '-P03-GGAGGCACACATCGATTTGG (SEQ ID NO:262)
5 '-P03-TGAGGCACACATCGATTTGG (SEQ ID NQ:264)_
1.73
1.74
1.75
1.76
1.77
1.78
1.79
1.80
1.81
1.82
5'-P03 - AAATCGATGTGGGC ATCC AG (SEQ ID NO:265)
5 '-P03-AAATCGATGTGGGCATCAAG (SEQ ID NO:267)
5 ’ -P03-AAATCGATGTGCCTGTCGAG (SEQ ID NO:269)
5 ’ -P03-AAATCGATGTGGACGGATAG (SEQIDNO:271)
5'-P03-AAATCGATGTGCCTGTCCAG (SEQ ID NO:273)
5 '-P03-AAATCGATGTGAAGCACGAG (SEQ ID NO:275)
5 '-P03-AAATCGATGTGCCTGTCAAG (SEQ ID NO:277)
5 '-P03-AAATCGATGTGAAGCACCAG (SEQ ID NO:279)
5 '-P03-AAATCGATGTGCCTTCGTAG (SEQIDNO:281)
5 '-P03-AAATCGATGTGTCGTCCGAG
5,-P03 -GGATGCCC ACATCGATTTGG (SEQ ID NO:266)
5,-P03-TGATGCCCA CAT CGA TTT GG
(SEQ ID NO:268)
5'-P03-CGA CAG GCA CAT CGA TTT GG
(SEQ ID N0:270)
5'-P03-ATC CGT CCA CAT CGA TTT GG
(SEQ ID NO:272)
5 '-P03-GGA CAG GCA CAT CGA TTT GG
(SEQ ID NO:274)
5'-P03-CGT GCT TCA CAT CGA TTT GG
(SEQ ID NO:276)
5'-P03-TGA CAG GCA CAT CGA TTT GG
(SEQ ID NO:278)
5 '-P03-GGT GCT TCA CAT CGA TTT GG
(SEQ ID N0:280)
5'-P03-ACG AAG GCA CAT CGA TTT GG
(SEQ ID NO:282)
5'-P03-CGG ACG ACA CAT CGA TTT1.83
1.84
(SEQ ID NO:283)
5 '-P03-AAATCGATGTGGAGTCTGAG (SEQ ID NO:285)
5'-P03-AAATCGATGTGTGATCCGAG (SEQ ID NO:287)_
GG
(SEQ ID NO:284)
5'-P03-CAG ACT CCA CAT CGA TTT GG
(SEQ ID NO:286)
5'-P03-CGG ATC ACA CAT CGA TTT GG
(SEQ ID NQ.-288)_
5 '-P03-AAATCGATGTGTCAGGCGAG
1.85(SEQ ID NO:289)
5 '-P03-AAATCGATGTGTCGTCCAAG
1.86(SEQIDNO:291)
5'-P03-AAATCGATGTGGACGGAGAG
1.87(SEQ ID NO:293)
5 '-P03-AAATCGATGTGGTAGCAGAG
1.88(SEQ ID NO:295) 5'-P03-AAATCGATGTGGCTGTGTAG
1.89(SEQ ID NO:297)
5 ’ -P03 - AAATCGATGTGG ACGG AC AG
1.90(SEQIDNO-.299)
5'-P03-AAATCGATGTGTCAGGCAAG
1.91(SEQIDNO:301)
5 ’ -P03-AAATCGATGTGGCTCGAAAG
1.92(SEQ ID N0:303)
5' -P03-AAATCGATGTGCCTTCGGAG
1.93(SEQ ID N0:305)
5'-P03-AAATCGATGTGGTAGCACAG
1.94(SEQ ID N0;307)
5 '-P03-AAATCGATGTGGAAGGTCAG
1.95(SEQ ID N0:309)
5'-P03-CGC CTG ACA CAT CGA TTT GG
(SEQ ID N0:290)
5'-P03-TGG ACG ACA CAT CGA TTT GG
(SEQ ID NO:292)
5'-P03-CTC CGT CCA CAT CGA TTT GG
(SEQ ID NO:294)
5,-P03-CTG CTA CCA CAT CGA TTT GG
(SEQ ID NO:296)
5 '-P03-ACACAGCCACATCGATTTGG (SEQ ID NO:298)
5'-P03-GTC CGT CCA CAT CGA TTT GG
(SEQ ID N0:300)
5,-P03-TGC CTG ACA CAT CGA TTT GG
(SEQ ID N0:302)
5'-P03-TTCGAGCCACATCGATTTGG (SEQ ID N0:304)
5'-P03-CCG AAG GCA CAT CGA TTT GG
(SEQ ID N0:306)
5'-P03-GTG CTA CCA CAT CGA TTT GG
(SEQ ID N0:308)
5'-P03-GAC CTT CCA CAT CGA TTT GG
(SEQIDNO:310)1.96
5'-P03-ACA GCA CCA CAT CGA TTT 5 '-P03-AAATCGATGTGGTGCTGTAG GG
(SEQIDNO:311)_(SEQIDNO:312)_ 表4 循環(huán)2中使用的寡核苷酸標(biāo)簽
標(biāo)簽
編號頂鏈序列底鏈序列5'-P03-GTT GCC TGT5'-P03-AGG CAA CCT2.1(SEQIDNO:313)(SEQIDNO:314)5'-P03-CAG GAC GGT5'-P03-CGT CCT GCT2.2(SEQ ID NO:315)(SEQIDNO:316)5'-P03-AGA CGT GGT5'-P03-CAC GTC TCT2.3(SEQIDNO.-317)(SEQIDNO.-318)5'-P03-CAG GAC CGT5'-P03-GGT CCT GCT2.4(SEQIDNO:319)(SEQ ID N0:320)5'-P03-CAG GAC AGT5'-P03-TGT CCT GCT2.5(SEQ ID NO:321)(SEQ ID NO:322)5'-P03-CAC TCT GGT5'-P03-CAG AGT GCT2.6(SEQ ID NO:323)(SEQ ID NO:324)5'-P03-GAC GGC TGT5'-P03-AGC CGT CCT2.7(SEQ ID NO:325)(SEQ ID NO-.326)5'-P03-CAC TCT CGT5'-P03-GAG AGT GCT2.8(SEQ ID NO:327)(SEQ ID NO:328)5'-P03-GTA GCC TGT5'-P03-AGGCTACCT2.9(SEQ ID NO:329)(SEQ ID N0:330)5'-P03-GCC ACT TGT5'-P03-AAGTGG CCT2.10(SEQIDNO:331)(SEQ ID NO:332)5'-P03-CAT CGC TGT5'-P03-AGC GAT GCT2.11(SEQ ID NO:333)(SEQ ID NO:334)5'-P03-CAC TGG TGT5,-P03-ACC AGT GCT2.12(SEQIDNO:335)(SEQIDNO:336)5'-P03-GCC ACT GGT5,-P03-CAG TGG CCT2.13(SEQ ID NO:337)(SEQIDNO:338)5'-P03-TCT GGC TGT5'-P03-AGC CAG ACT2.14(SEQ ID NO:339)(SEQ ID N0:340)5'-P03-GCC ACT CGT5,-P03-GAG TGG CCT2.15(SEQ ID NO:341)(SEQ ID NO:342)
2.16
2.17
2.18
2.19
2.20 2.21 2.22 2.23
2.24
2.25
2.26
2.27
2.28
2.29
2.30
2.31
2.32
2.33
2.34
2.35
5'-P03-TGC CTC TGT (SEQ ID NO:343) 5'-P03-CAT CGC AGT (SEQ ID NO:345) 5'-P03-CAG GAA GGT (SEQ ID NO:347) 5'-P03-GGC ATC TGT (SEQ ID NO-.349) 5'-P03-CGG TGC TGT (SEQ ID NO:351) 5'-P03-CAC TGG CGT (SEQIDNO:353) 5'-P03-TCTCCTCGT (SEQIDNO:355) 5,-P03-CCT GTC TGT (SEQIDNO:357) 5'-P03-CAA CGC TGT (SEQIDNO:359)
5'-P03-TGC CTC GGT (SEQIDNO:361) 5'-P03-ACA CTG CGT (SEQ ID NO:363) 5'-P03-TCG TCC TGT (SEQ ID NO:365) 5'-P03-GCT GCC AGT (SEQ ID NO:367) 5'-P03-TCA GGC TGT (SEQ ID NO:369) 5'-P03-GCC AGG TGT (SEQIDNO:371) 5'-P03-CGG ACC TGT (SEQ ID NO:373) 5'-P03-CAA CGC AGT (SEQ ID NO:375) 5'-P03-CAC ACG AGT (SEQ ID NO:377) 5'-P03-ATG GCC TGT (SEQ ID NO:379)
5'-P03-CCA GTC TGT
5,-P03-AGA GGC ACT (SEQ ID NO:344) 5'-P03-TGC GAT GCT (SEQ ID NO:346) 5'-P03-CTT CCT GCT (SEQ ID NO:348) 5'-P03-AGA TGC CCT (SEQIDNO-.350) 5,-P03-AGC ACC GCT (SEQIDNO.352) 5,-P03-GCC AGT GCT (SEQIDNO:354) 5 '-P03-GAGGAGACT (SEQ ID NO:356) 5,-P03-AGA CAG GCT (SEQ ID NO: 3 5 8) 5'-P03-AGC GTT GCT (SEQ ID NO:36Q)
5'-P03-CGA GGC ACT (SEQ ID NO:362) 5'-P03-GCA GTG TCT (SEQ ID NO:364) 5'-P03-AGG ACG ACT (SEQ ID NO:366) 5'-P03-TGG CAG CCT (SEQ ID NO:368) 5'-P03-AGC CTG ACT (SEQ ID N0:370) 5'-P03-ACC TGG CCT (SEQ ID NO:372) 5,-P03-AGG TCC GCT (SEQ ID NO:374) 5'-P03-TGC GTT GCT (SEQ ID NO:376) 5,_P03-TCG TGT GCT (SEQ ID NO:378) 5'-P03-AGG CCA TCT (SEQIDNC>:380)
5'-P03-AGA CTG GCT
50
(SEQIDNO.-381)(SEQ ID NO:382)5’-P03-GCC AGG AGT5,-P03-TCC TGG CCT2.36(SEQIDNO:383)(SEQ ID NO:384)5'-P03-CGG ACC AGT5'-P03-TGG TCC GCT2.37(SEQIDNO:385)(SEQ ID NO:386)5'-P03-CCT TCG CGT5'-P03-GCG AAG GCT2.38(SEQIDNO:387)(SEQ ID NO:388)5'-P03-GCA GCC AGT5'-P03-TGG CTG CCT2.39(SEQIDNO:389)(SEQ ID N0:390)5'-P03-CCA GTC GGT5,-P03-CGA CTG GCT2.40(SEQIDNO:391)(SEQ ID NO:392)5'-P03-ACT GAG CGT5'-P03-GCT CAG TCT2.41(SEQ ID NO:393)(SEQ ID NO:394)5,-P03-CCA GTC CGT5,-P03-GGA CTG GCT2.42(SEQ ID NO:395)(SEQ ID NO:396)5'-P03-CCA GTC AGT5'-P03-TGA CTG GCT2.43(SEQ ID NO:397)(SEQ ID NO:398)5'-P03-CAT CGA GGT5'-P03-CTC GAT GCT2.44(SEQ ID NO:399)(SEQ ID N0:400)5'-P03-CCA TCG TGT5'-P03-ACG ATG GCT2.45(SEQIDNO:401)(SEQ ID N0:402)5'-P03-GTG CTG CGT5'-P03-GCA GCA CCT2.46(SEQ ID N0:403)(SEQ ID N0:404)5'-P03-GAC TAC GGT5'-P03-CGT AGT CCT2.47(SEQ ID N0:405)(SEQ ID N0:406)5'-P03-GTG CTG AGT5,-P03-TCAGCACCT2.48(SEQ ID N0:407)(SEQ ID N0:408)5'-P03-GCTGCATGT5'-P03-ATGCAGCCT2.49(SEQ ID N0:409)(SEQ ID N0:410)5'-P03-GAGTGGTGT5'-P03-ACCACTCCT2.50(SEQIDNO:411)(SEQIDNO:412)5'-P03-GACTACCGT5'-P03-GGTAGTCCT2.51(SEQIDNO:413)(SEQ ID NO:414)5,-P03-CGGTGATGT5'-P03-ATCACCGCT2.52(SEQIDNO:415)(SEQ ID NO:416)5'-P03-TGCGACTGT5'-P03-AGTCGCACT2.53(SEQIDNO:417)(SEQIDNO:418)5'-P03-TCTGGAGGT5'-P03-CTCCAGACT2.54(SEQIDNO:419)(SEQ ID N0:420)
515 '-P03-AGCACTGGT5,-P。3-CAGTGCTCT2.55(SEQIDNO-.421)(SEQIDNO:422)5'-P03-TCGCTTGGT5'-P03-CAAGCGACT2.56(SEQ ID NO:423)(SEQ ID NO:424)5,-P。3、AGCACTCGT5'-P03-GAGTGCTCT2.57(SEQ ID NO:425)(SEQIDNO:426)5'-P03-GCGATTGGT5'-P03-CAATCGCCT2.58(SEQ ID NO:427)(SEQ ID NO:428)5,-P03、CCATCGCGT5'-P03-GCGATGGCT2.59(SEQ ID NO:429)(SEQ ID N0:430)5'-P03-TCGCTTCGT5'-P03-GAAGCGACT2.60(SEQ ID NO:431)(SEQ ID NO:432)5,-P03-AGTGCCTGT5'-P03-AGGCACTCT2.61(SEQ ID NO:433)(SEQ ID NO:434)5'-P03-GGCATAGGT5'-P03-CTATGCCCT2.62(SEQ ID NO:435)(SEQ ID NO:436)5'-P03-GCGATTCGT5'-P03-GAATCGCCT2.63(SEQ ID NO:437)(SEQ ID NO:438)5'-P03-TGCGACGGT5'-P03-CGTCGCACT2.64(SEQ ID NO:439)(SEQ ID N0:440)5,-P03-GAGTGGCGT5'-P03-GCCACTCCT2.65(SEQ ID NO:441)(SEQ ID NO:442)5'-P03-CGGTGAGGT5'-P03-CTCACCGCT2.66(SEQ ID NO.-443)(SEQ ID NO:444)5 '-P03-GCTGCAAGT5'-P03-TTGCAGCCT2.67(SEQ ID NO:445)(SEQ ID NO:446)5'-P03-TTCCGCTGT5'-P03-AGCGGAACT2.68(SEQ ID NO:447)(SEQ ID NO:448)5,-P03-GAGTGGAGT5'-P03-TCCACTCCT2.69(SEQ ID NO:449)(SEQ ID N0:450)5 '-P03-ACAGAGCGT5'-P03-GCTCTGTCT2.70(SEQ ID NO:451)(SEQ ID NO:452)5'-P03-TGCGACCGT5'-P03-GGTCGCACT2.71(SEQ ID NO:453)(SEQ ID NO:454)5'-P03-CCTGTAGGT5'-P03-CTACAGGCT2.72(SEQ ID NO:455)(SEQ ID NO:456)5'-P03-TAGCCGTGT5'-P03-ACGGCTACT2.73(SEQ ID NO:457)(SEQ ID NO:458)2.745'-P03-TGCGACAGT5’-P03-TGTCGCACT 表5.循環(huán)3中使用的寡核苷酸標(biāo)簽
(SEQIDNO.-531)
5'-P03-TCA GGA CGA
3.15(SEQ ID NO:533) 5'-P03-AAA GGC GGA
3.16(SEQ ID NO:535) 5'-P03-CTC CTC GGA
3.17(SEQ ID NO:537) 5'-P03-CAG ATG CGA
3.18(SEQ ID N0.539) 5'-P03-GCA GCAAGA
3.19(SEQIDNO:541) 5'-P03-GTG GAG TGA
3.20(SEQ ID NO:543) 5'-P03-CCA GTA GGA
3.21(SEQ ID NO:545) 5'-P03-ATGGCACGA
3.22(SEQ ID NO:547) 5'-P03-GGA CTG TGA
3.23(SEQ ID NO:549) 5'-P03-CCG AAC TGA
3.24_(SEQIDNO:551)
(SEQ ID NO:532)
5'-P03-GTC CTG AAC (SEQ ID NO:534) 5,-P03-CGC CTT TAC (SEQ ID NO:536) 5,-P〇3-CGA GGA GAC (SEQ ID NO:538) 5'-P03-GCA TCT GAC (SEQ ID N0:540) 5'-P03-TTG CTG CAC (SEQ ID NO:542) 5'-P03-ACT CCA CAC (SEQ ID NO:544) 5'-P03-CTA CTG GAC (SEQ ID NO:546) 5'-P03-GTG CCA TAC (SEQ ID NO:548) 5'-P03-ACA GTC CAC (SEQ ID N0:550) 5'-P03-AGT TCG GAC (SEQ ID NO:552)
5'-P03-CTC CTC AGA
3.25(SEQ ID NO:553) 5'-P03-CAC TGC TGA
3.26(SEQ ID NO:555) 5,-P03-AGC AGG CGA
3.27(SEQ ID NO:557) 5'-P03-AGC AGG AGA
3.28(SEQ ID NO:559) 5'-P03-AGA GCC AGA
3.29(SEQIDNO:561) 5'-P03-GTC GTT GGA
3.30(SEQ ID NO:563) 5'-P03-CCG AAC GGA
3.31(SEQ ID NO:565) 5,-P03-CAC TGC GGA
3.32(SEQ ID NO:567) 5'-P03-GTG GAG CGA
3.33(SEQ ID NO:569)
5'-P03-TGA GGA GAC (SEQ ID NO: 554) 5'-P03-AGC AGT GAC (SEQ ID NO:556) 5'-P03-GCC TGC TAC (SEQ ID NO:558) 5'-P03-TCC TGC TAC (SEQ ID N0:560) 5'-P03-TGG CTC TAC (SEQ ID NO:562) 5'-P03-CAA CGA CAC (SEQ ID NO:564) 5'-P03-CGT TCG GAC (SEQ ID NO:566) 5'-P03-CGC AGT GAC (SEQ ID NO: 568) 5,-P03-GCT CCA CAC (SEQ ID NO:570)
5,-P03-GTG GAG AGA5'-P03-TCT CCA CAC3.34(SEQIDNO:571)(SEQ ID NO: 572)5'-P03-GGA CTG CGA5'-P03-GCA GTC CAC3.35(SEQIDNO:573)(SEQ ID NO:574)5'-P03-CCG AAC CGA5'-P03-GGT TCG GAC3.36(SEQ ID NO:575)(SEQ ID NO:576)5'-P03-CAC TGC CGA5'-P03-GGC AGT GAC3.37(SEQ ID NO:577)(SEQ ID NO:578)5'-P03-CGAAACGGA5'-P03-CGT TTC GAC3.38(SEQ ID NO:579)(SEQ ID N0:580)5'-P03-GGA CTG AGA5'-P03-TCA GTC CAC3.39(SEQIDNO:581)(SEQ ID NO:582)5'-P03-CCG AAC AGA5'-P03-TGT TCG GAC3.40(SEQ ID NO:583)(SEQ ID NO:584)5,-P03-CGA AAC CGA5'-P03-GGT TTC GAC3.41(SEQ ID NO:585)(SEQIDNO:586)5'-P03-CTG GCT TGA5'-P03-AAG CCA GAC3.42(SEQ ID NO:587)(SEQ ID NO:588)5,-P03-CAC ACC TGA5'-P03-AGG TGT GAC3.43(SEQ ID NO:589)(SEQ ID N0:590)5'-P03-AAC GAC CGA5'-P03-GGT CGT TAC3.44(SEQ ID NO:591)(SEQ ID NO:592)5'-P03-ATC CAG CGA5'-P03-GCT GGA TAC3.45(SEQ ID NO:593)(SEQIDNO:594)5'-P03-TGCGAAGGA5'-P03-CTT CGC AAC3.46(SEQ ID NO:595)(SEQIDNO:596)5'-P03-TGCGAACGA5'-P03-GTT CGC AAC3.47(SEQ ID NO:597)(SEQ ID NO:598)5'-P03-CTG GCT GGA5,-P03-CAG CCA GAC3.48(SEQ ID NO:599)(SEQ ID N0:600)5'-P03-CAC ACC GGA5,-P03-CGG TGT GAC3.49(SEQIDNO:601)(SEQ ID N0:602)5'-P03-AGT GCA GGA5'-P03-CTG CAC TAC3.50(SEQ ID N0:603)(SEQ ID N0:604)5'-P03-GAC CGT TGA5'-P03-AAC GGT CAC3.51(SEQ ID N0:605)(SEQ ID N0:606)5'-P03-GGT GAG TGA5'-P03-ACT CAC CAC3.52(SEQ ID N0:607)(SEQ ID N0:608)3.535'-P03-CCTTCCTGA5'-P03-AGG AAG GAC
56(SEQ ID N0:609)(SEQ ID N0:610)
5 '-P03-CTG GCT AGA5,-P03-TAG CCA GAC
3.54(SEQIDNO:611)(SEQ ID NO:612) 5'-P03-CAC ACC AGA5'-P03-TGG TGT GAC
3.55(SEQIDNO:613)(SEQ ID NO:614) 5,-P03-AGC GGT AGA5'-P03-TAC CGC TAC
3.56(SEQIDNO:615)(SEQ ID NO:616) 5,-P03-GTC AGA GGA5'-P03-CTC TGA CAC
3.57(SEQIDNO:617)(SEQ ID NO:618) 5'-P03-TTC CGA CGA5'-P03-GTC GGA AAC
3.58(SEQIDNO:619)(SEQ ID N0:620) 5'-P03-AGG CGT AGA5'-P03-TAC GCC TAC
3.59(SEQIDNO:621)(SEQ ID NO:622) 5'-P03-CTC GAC TGA5'-P03-AGT CGA GAC
3.60_(SEQ ID NO.-623)(SEQ ID NO:624)
5'-P03-TAC GCT GGA5'-P03-CAG CGT AAC
3.61(SEQ ID NO:625)(SEQ ID NO:626) 5'-P03-GTT CGG TGA5'-P03-ACC GAA CAC
3.62(SEQ ID NO:627)(SEQ ID NO:628)
5'-P03-GCC AGC AGA5'-P03-TGC TGG CAC
3.63(SEQ ID NO:629)(SEQ ID N0:630) 5'-P03-GAC CGT AGA5'-P03-TAC GGT CAC
3.64(SEQIDNO:631)(SEQ ID NO:632)
5,-P03-GTG CTC TGA5'-P03-AGA GCA CAC
3.65(SEQ ID NO:633)(SEQ ID NO:634)
5'-P03-GGT GAG CGA5'-P03-GCT CAC CAC
3.66(SEQ ID NO:635)(SEQ ID NO:636) 5'-P03-GGT GAG AGA5'-P03-TCT CAC CAC
3.67(SEQ ID NO:637)(SEQ ID NO:638) 5'-P03-CCT TCCAGA5'-P03-TGG AAG GAC
3.68(SEQ ID NO:639)(SEQ ID N0:640)
5'-P03-CTC CTA CGA5'-P03-GTA GGA GAC
3.69(SEQ ID NO:641)(SEQ ID NO:642) 5'-P03-CTC GAC GGA5'-P03-CGT CGA GAC
3.70(SEQ ID NO;643)(SEQ ID NO:644) 5'-P03-GCC GTT TGA5'-P03-AAA CGG CAC
3.71(SEQ ID NO:645)(SEQ ID NO:646) 5'-P03-GCG GAG TGA5'-P03-ACT CCG CAC
3.72_(SEQ ID NO:647)(SEQ ID NO:648)5’-P03-CGT GCT TGA5'-P03-AAG CAC GAC
3.73(SEQ ID NO:649)(SEQ ID N0:650) 5,-P03-CTC GAC CGA5,-P03-GGT CGA GAC
3.74(SEQIDNO:651)(SEQ ID NO:652)
5'-P03-AGA GCA GGA5'-P03-CTG CTC TAC
3.75(SEQ ID NO:653)(SEQ ID NO:654) 5'-P03-GTG CTC GGA5,-P03-CGA GCA CAC
3.76(SEQ ID NO:655)(SEQ ID NO:656)
5,-P03-CTC GAC AGA5,-P03-TGT CGA GAC
3.77(SEQ ID NO:657)(SEQ ID NO:658) 5,-P03-GGA GAG TGA5'-P03-ACT CTC CAC
3.78(SEQ ID NO:659)(SEQ ID N0:660) 5'-P03-AGG CTG TGA5,-P03-ACA GCC TAC
3.79(SEQIDNO:661)(SEQ ID NO:662) 5,-P03-AGA GCA CGA5,-P03-GTG CTC TAC
3.80(SEQ ID NO:663)(SEQ ID NO:664) 5'-P03-CCA TCC TGA5'-P03-AGG ATG GAC
3.81(SEQ ID NO:665)(SEQ ID NO:666) 5'-P03-GTT CGG AGA5'-P03-TCC GAA CAC3.82(SEQ ID NO:667)(SEQ ID NO:668)
5'-P03-TGG TAG CGA5'-P03-GCT ACC AAC
3.83(SEQ ID NO:669)(SEQ ID N0:670) 5'-P03-GTG CTC CGA5'-P03-GGA GCA CAC
3.84_(SEQIDNO:671)(SEQ ID NO:672)
5'-P03-GTG CTC AGA5'-P03-TGA GCA CAC
3.85(SEQ ID NO:673) (SEQ ID NO:674) 5'-P03-GCC GTT GGA5'-P03-CAA CGG CAC
3.86(SEQ ID NO:675)(SEQ ID NO:676)
5'-P03-GAG TGC TGA5'-P03-AGC ACT CAC
3.87(SEQ ID NO:677)(SEQ ID NO:678) 5'-P03-GCT CCT TGA5'-P03-AAG GAG CAC
3.88(SEQ ID NO:679)(SEQ ID N0:680)
5 ’-P03-CCG AAA GGA5'-P03-CTT TCG GAC
3.89(SEQIDNO:681)(SEQ ID NO:682) 5'-P03-CAC TGA GGA5'-P03-CTC AGT GAC
3.90(SEQ ID NO:683)(SEQ ID NO:684) 5'-P03-CGT GCT GGA5'-P03-CAG CAC GAC
3.91(SEQ ID NO:685)(SEQ ID NO:686)
3.925'-P03-CCG AAA CGA5'-P03-GTT TCG GAC(SEQ ID NO:687)(SEQ ID NO:688)
5’-P03-GCG GAG AGA5'-P03-TCT CCG CAC 3.93(SEQ ID NO:689)(SEQ ID N0:690)
5'-P03-GCC GTT AGA5'-P03-TAA CGG CAC3.94(SEQIDNO:691)(SEQ ID NO:692)
5'-P03-TCT CGT GGA5'-P03-CAG GAG AAC
3.95(SEQ ID NO:693)(SEQ ID NO:694) 5'-P03-CGT GCT AGA5 '-P03-TAG CAC GAC
3.96_(SEQ ID NO:695)(SEQ ID NO:696)表6.循環(huán)4中使用的寡核苷酸標(biāo)簽
標(biāo)簽編號頂鏈序列_底鏈序列_
5'-P03-GCCTGTCTT5'-P03-GAC AGG CTC
4.1(SEQ ID NO:697)(SEQ ID NO:698) 5'-P03-CTCCTGGTT5'-P03-CCA GGA GTC
4.2(SEQ ID NO:699)(SEQ ID N0:700) 5'-P03-ACTCTGCTT5'-P03-GCA GAG TTC
4.3(SEQ ID N0:701)(SEQ ID N0:702) 5'-P03-CATCGCCTT5'-P03-GGC GAT GTC
4.4(SEQ ID N0:703)(SEQ ID N0:704)
5 '-P03-GCCACTATT5 '-P03-TAG TGG CTC
4.5(SEQ ID N0:705)(SEQ ID N0:706) 5'-P03-CACACGGTT5,-P03-CCG TGT GTC4.6(SEQ ID N0:707)(SEQ ID N0:708)
5'-P03-CAACGCCTT5'-P03-GGC GTT GTC
4.7(SEQ ID N0:709)(SEQ ID NO:710) 5'-P03-ACTGAGGTT5'-P03-CCT CAG TTC
4.8(SEQIDNO:711)(SEQ ID NO:712) 5'-P03-GTGCTGGTT5'-P03-CCA GCA CTC
4.9(SEQIDNO:713)(SEQ ID NO:714) 5'-P03-CATCGACTT5'-P03-GTC GAT GTC
4.10(SEQIDNO:715)(SEQ ID NO:716) 5'-P03-CCATCGGTT5'-P03-CCG ATG GTC
4.11(SEQIDNO:717)(SEQ ID NO:718) 5'-P03-GCTGCACTT5'-P03-GTG CAG CTC
4.12_(SEQ ID NO:719)(SEQ ID NO:72Q)5 '-P03-ACAGAGGTT5'-P03-CCT CTG TTC
4.13(SEQIDNO:721)(SEQ ID NO:722)
5’-P03-AGTGCCGTT5'-P03-CGG CAC TTC
4.14(SEQ ID NO:723)(SEQ ID NO:724)
5'-P03-CGGACATTT5'-P03-ATG TCC GTC
4.15(SEQ ID NO:725)(SEQ ID NO:726)
5 '-P03-GGTCTGGTT5'-P03-CCA GAC CTC
4.16(SEQ ID NO:727)(SEQ ID NO:728)
5'-P03-GAGACGGTT5'-P03-CCG TCT CTC
4.17(SEQ ID NO:729)(SEQ ID NO:730) 5'-P03-CTTTCCGTT5'-P03-CGG AAA GTC
4.18(SEQ ID NO:731)(SEQ ID NO:732) 5,-P03-CAGATGGTT5,-P03-CCA TCT GTC
4.19(SEQ ID NO:733)(SEQ ID NO:734)
5 '-P03-CGGACACTT5'-P03-GTG TCC GTC
4.20(SEQIDNO:735)(SEQ ID NO:736) 5'-P03-ACTCTCGTT5'-P03-CGA GAG TTC
4.21(SEQIDNO:737)(SEQ ID NO:738)
5'-P03-GCAGCACTT5'-P03-GTG CTG CTC4.22(SEQ ID NO:739)(SEQ ID N0:740)
5'-P03-ACTCTCCTT5'-P03-GGA GAG TTC
4.23(SEQ ID NO:741)(SEQ ID NO:742) 5'-P03-ACCTTGGTT5'-P03-CCA AGG TTC
4.24_(SEQ ID NO:743)(SEQ ID NO:744)
5'-P03-AGAGCCGTT5'-P03-CGG CTC TTC
4.25(SEQ ID NO:745)(SEQ ID NO:746)
5' -P03-ACCTTGCTT5,-P03-GCA AGG TTC
4.26(SEQ ID NO:747)(SEQ ID NO:748)
5,-P03-AAGTCCGTT5' -P03-CGG ACT TTC
4.27(SEQ ID NO:749)(SEQ ID N0:750)
5'-P03-GGA CTG GTT5'-P03-CCA GTC CTC
4.28(SEQIDNO-.751)(SEQ ID NO:752) 5'-P03-GTCGTTCTT5'-P03-GAA CGA CTC
4.29(SEQ ID NO:753)(SEQ ID NO:754)
5'-P03-CAGCATCTT5'-P03-GAT GCT GTC
4.30(SEQ ID NO:755)(SEQ ID NO:756)
5 ’-P03-CTATCCGTT5'-P03-CGG ATA GTC
4.31(SEQ ID NO:757)(SEQ ID NO:758)
4.325,-P03-ACACTCGTT5,-P03-CGA GTG TTC(SEQ ID NO:759)(SEQ ID N0:760) 5'-P03-ATCCAGGTT5,-P03-CCT GGA TTC
4.33(SEQ ID NO:761)(SEQ ID NO:762) 5'-P03-GTTCCTGTT5 '-P03-CAG GAA CTC
4.34(SEQ ID NO:763)(SEQ ID NO:764)
5,-P03-ACACTCCTT5,-P03-GGA GTG TTC
4.35(SEQ ID NO:765)(SEQ ID NO:766) 5'-P03-GTTCCTCTT5'-P03-GAG GAA CTC
4.36_(SEQ ID NQ:767)(SEQ ID NO:768)
5 '-P03-CTGGCTCTT5,-P03-GAG CCA GTC
4.37(SEQ ID NO:769)(SEQ ID NO:770) 5'-P03-ACGGCATTT5 ’-P03-ATG CCG TTC
4.38(SEQ ID NO:771)(SEQ ID NO:772) 5’-P。3-GGTGAGGTT5'-P03-CCT CAC CTC
4.39(SEQ ID NO:773)(SEQ ID NO:774)
5,-P03-CCTTCCGTT5,-P03-CGG AAG GTC
4.40(SEQ ID NO:775)(SEQ ID NO:776) 5'-P03-TACGCTCTT5'-P03-GAG CGT ATC
4.41(SEQ ID NO:777)(SEQ ID NO:778)
5'-P03-ACGGCAGTT5'-P03-CTG CCG TTC
4.42(SEQ ID NO:779)(SEQ ID N0:780 5'-P03-ACTGACGTT5'-P03-CGT CAG TTC
4.43(SEQ ID NO:781)(SEQ ID NO:782) 5'-P03-ACGGCACTT5'-P03-GTG CCG TTC
4.44(SEQ ID NO:783)(SEQ ID NO:784) 5'-P03-ACTGACCTT5'-P03-GGT CAG TTC
4.45(SEQ ID NO:785)(SEQ ID NO:786) 5'-P03-TTTGCGGTT5'-P03-CCG CAA ATC
4.46(SEQ ID NO:787)(SEQ ID NO:788) 5,-P03-TGGTAGGTT5,-P03-CCT ACC ATC
4.47(SEQ ID NO:789)(SEQ ID N0:790) 5'-P03-GTTCGGCTT5'-P03-GCC GAA CTC
4.48_(SEQ ID NO:791)(SEQ ID NO:792)
5'-P03-GCC GTT CTT5'-P03-GAA CGG CTC
4.49(SEQ ID NO:793)(SEQ ID NO:794)
5'-P03-GGAGAGGTT5'-P03-CCT CTC CTC
4.50(SEQ ID NO:795)(SEQ ID NO:796)
5'-P03-CACTGACTT5'-P03-GTC AGT GTC
4.51(SEQ ID NO:797)(SEQ ID NO:798)5’-P03-CGTGCTCTT5'-P03-GAG CAC GTC
4.52(SEQ ID NO:799)(SEQ ID N0:800) 5'-P03-AATCCGCTT5 '-P03-GCGGATTTC
4.53(SEQ ID NO:801)(SEQ ID NO:802)
5 '-P03-AGGCTGGTT5 ’-P03-CCA GCC TTC
4.54(SEQ ID NO:803)(SEQ ID NO:804) 5'-P03-GCTAGTGTT5,-P03-CAC TAG CTC
4.55(SEQ ID NO:805)(SEQ ID NO:806)
5'-P03-GGAGAGCTT5'-P03-GCT CTC CTC
4.56(SEQ ID NO:807)(SEQ ID NO:808)
5'-P03-GGAGAGATT5'-P03-TCT CTC CTC
4.57(SEQ ID N0:809)(SEQ ID N0:810)
5 '-P03-AGGCTGCTT5 '-P03-GCA GCC TTC
4.58(SEQIDNO:811)(SEQ ID NO:812)
5'-P03-GAGTGCGTT5’-P03-CGC ACT CTC
4.59(SEQIDNO:813)(SEQ ID NO:814)
5 '-P03-CCATCCATT5'-P03-TGG ATG GTC
4.60_(SEQ ID NO:815)(SEQ ID NO:816)
5 '-P03-GCTAGTCTT5 '-P03-GAC TAG CTC4.61(SEQIDNO:817)(SEQ ID NO:818)
5'-P03-AGGCTGATT5'-P03-TCA GCC TTC
4.62(SEQIDNO:819)(SEQ ID NO:820)
5'-P03-ACAGACGTT5'-P03-CGT CTG TTC
4.63(SEQIDNO:821)(SEQ ID NO:822) 5'-P03-GAGTGCCTT5'-P03-GGC ACT CTC
4.64(SEQ ID NO:823)(SEQ ID NO:824) 5'-P03-ACAGACCTT5'-P03-GGT CTG TTC
4.65(SEQ ID NO:825)(SEQ ID NO:826)
5'-P03-CGAGCTTTT5'-P03-AAG CTC GTC
4.66(SEQ ID NO:827)(SEQ ID NO:828) 5'-P03-TTAGCGGTT5'-P03-CCG CTA ATC
4.67(SEQ ID NO:829)(SEQ ID N0:830) 5'-P03-CCTCTTGTT5'-P03-CAA GAG GTC
4.68(SEQ ID NO:831)(SEQ ID NO:832) 5'-P03-GGTCTCTTT5'-P03-AGA GAC CTC
4.69(SEQ ID NO:833)(SEQ ID NO:834) 5'-P03-GCCAGATTT5'-P03-ATC TGG CTC
4.70(SEQIDNO:835)(SEQ ID NO:836)
4.715' -P03-GAGACCTTT5 '-P03-AGG TCT CTC(SEQ ID NO:837)(SEQ ID NO:838)
5'-P03-CACACAGTT5'-P03-CTG TGTGTC 4.72_(SEQ ID NO:839)(SEQ ID N0:840)
5'-P03-CCTCTTCTT5'-P03-GAA GAG GTC
4.73(SEQIDNO:841)(SEQ ID NO:842) 5'-P03-TAGAGCGTT5'-P03-CGC TCT ATC
4.74(SEQ ID NO:843)(SEQ ID NO:844) 5'-P03-GCACCTTTT5'-P03-AAG GTG CTC
4.75(SEQ ID NO:845)(SEQ ID NO:846) 5’-P03-GGCTTGTTT5'-P03-ACA AGC CTC
4.76(SEQ ID NO:847)(SEQ ID NO:848) 5'-P03-GACGCGATT5'-P03-TCG CGT CTC
4.77(SEQ ID NO:849)(SEQ ID N0:850)
5 '-P03-CGAGCTGTT5'-P03-CAG CTC GTC
4.78(SEQ ID NO:851)(SEQ ED NO:852) 5'-P03-TAGAGCCTT5'-P03-GGC TCT ATC
4.79(SEQ ID NO:853)(SEQ ID NO:854)
5'-P03-CATCCGTTT5'-P03-ACG GAT GTC
4.80(SEQ ID NO:855)(SEQ ID NO:856)
5'-P03-GGTCTCGTT5'-P03-CGA GACCTC
4.81(SEQ ID NO:857)(SEQ ID NO:858) 5'-P03-GCCAGAGTT5'-P03-CTC TGG CTC
4.82(SEQ ID NO:859)(SEQ ID N0:860)
5 '-P03-GAGACCGTT5'-P03-CGG TCT CTC
4.83(SEQ ID NO:861)(SEQ ID NO:862) 5'-P03-CGAGCTATT5,-P03-TAG CTC GTC
4.84_(SEQ ID NO:863)(SEQ ID NO:864)
5 ’ -P03-GCAAGTGTT5' -P03 -CAC TTG CTC
4.85(SEQ ID NO:865)(SEQ ID NO:866) 5'-P03-GGTCTCCTT5'-P03-GGA GAC CTC
4.86(SEQ ID NO:867)(SEQ ID NO:868)
5'-P03-GCCAGACTT5 '-P03-GTC TGG CTC
4.87(SEQ ID NO:869)(SEQ ID NO:870) 5'-P03-GGTCTCATT5'-P03-TGA GAC CTC
4.88(SEQIDNO:871)(SEQ ID NO:872)
5'-P03-GAGACCATT5'-P03-TGG TCT CTC
4.89(SEQ ID NO:873)(SEQ ID NO:874) 5'-P03-CCTTCAGTT5'-P03-CTG AAG GTC
4.90(SEQ ID NO:875)(SEQ ID NO:876) IX 連接酶緩沖液50mMTris,pH 7. 5 ;10mM 二硫蘇糖醇;IOmMMgCl2 ;2mM ATP ;
50mM NaCl。IOX 連接酶緩沖液500mM Tris,pH 7. 5 ; IOOmM 二硫蘇糖醇;IOOmM MgCl2 ;20mM
ATP ; 500mM NaCl。水溶性間隔基與化合物2的連接將化合物2在硼酸鈉緩沖液(150mM,pH 9. 4)中的溶液(60mL,ImM)冷卻到4°C,向其中加入在N,N- 二甲基甲酰胺(DMF) (16mL, 0. 15M)中的40當(dāng)量的N-Fmoc-15-氨 基-4,7,10,13-四氧雜硬脂酸(S-Ado),接著加入40當(dāng)量的4-(4,6-二甲氧基[1.3. 5]三 嗪-2-基)-4-甲基嗎啉氯化物水合物(DMTMM)的水溶液(9. 6mL, 0. 25M)?;旌衔镌?°C下 輕輕搖動(dòng)2小時(shí),之后加入40當(dāng)量的S-Ado和DMTMM,并在4°C下再搖動(dòng)16小時(shí)。酰化后,加入0. IX體積的5M NaCl水溶液和2. 5X體積的冷(_20°C )乙醇,使該 混合物在_20°C下靜置至少1小時(shí)。然后在4°C下以14,OOOrpm離心該混合物15分鐘,獲 得白色沉淀物,用冷EtOH洗滌,然后在凍干機(jī)中室溫干燥30分鐘。將固體溶解在40mL水 中,使用WatersXterra RP18柱通過反相HPLC純化。使用50mM乙酸三乙銨緩沖液pH7. 5和 99%乙腈/1%水溶液,利用二元流動(dòng)相梯度分布洗脫產(chǎn)物。通過凍干濃縮純化的物質(zhì),將 獲得的殘余物溶解于5mL水中。向溶液中加入0. IX體積的哌啶,在室溫下輕輕搖動(dòng)混合物 45分鐘。然后如上所述通過乙醇沉淀純化產(chǎn)物,并且離心分離。將獲得的沉淀物用冷EtOH 洗滌兩次,通過凍干干燥,獲得純化的化合物3。 循環(huán)1向96孔板的每個(gè)孔中加入12. 5 μ L 4mM化合物3的水溶液;100 μ L如表3所示 的寡核苷酸標(biāo)簽1.1至1.96之一的ImM溶液(化合物3與標(biāo)簽的摩爾比為1 2)。將板 加熱至95°C 1分鐘,然后冷卻至16°C 10分鐘。向每孔中加入IOyL IOX連接酶緩沖液、30 單位 T4DNA 連接酶(IyL 30 單位 / μ L 溶液(FermentasLife Science,目錄號 EL0013))、 76. 5μ 1水,獲得的溶液在16°C下溫育16小時(shí)。連接反應(yīng)后,向每孔中直接加入20μ L 5Μ NaCl水溶液,然后加入500 μ L冷 (-20 0C )乙醇,在_20°C下保持1小時(shí)。在Beckman CoulterAllegra 6R離心機(jī)上,使用 Beckman Microplus Carriers,以3200g將板離心1小時(shí)。通過將板倒置小心除去上清 液,用70%冷乙醇水溶液在-20°C下洗滌沉淀物。每種沉淀物然后溶解于硼酸鈉緩沖液 (50 μ L, 150mM, pH 9. 4)中至濃度為ImM,并冷卻至4°C。向每種溶液中加入在DMF中的40當(dāng)量的96種結(jié)構(gòu)單元前體之一(13yL,0. 15M), 然后加入40當(dāng)量的DMT-MM水溶液(8μ L,0. 25M),溶液在4°C下輕輕搖動(dòng)。2小時(shí)后,加入 另外40當(dāng)量的各種結(jié)構(gòu)單元前體之一和DMTMM,溶液在4°C下輕輕搖動(dòng)16小時(shí)。?;?, 向每種溶液中加入在DMF中的10當(dāng)量乙酸-N-羥基-琥珀酰亞胺酯(2 μ L,0. 25Μ),輕輕搖 動(dòng)10分鐘。酰化后,合并96個(gè)反應(yīng)混合物,加入0. 1倍體積的5Μ NaCl水溶液和2. 5倍體積 的冷無水乙醇,使溶液在_20°C下靜置至少1小時(shí)。然后離心該混合物。離心后,用微量移 液器除去盡可能多的上清液,用冷乙醇洗滌沉淀物,再次離心。用200yL移液管除去上清 液。向管中加入70%冷乙醇,獲得的混合物在4°C下離心5分鐘。棄去上清液,剩余的乙醇通過在室溫下凍干10分鐘除去。然后將沉淀物溶解在 2mL水中,并使用Waters Xterra RP18柱通過反相HPLC純化。使用50mM乙酸三乙銨水緩 沖液pH 7. 5和99%乙腈/1%水溶液,利用二元流動(dòng)相梯度分布洗脫文庫。收集、合并和凍 干含有該文庫的級分。將獲得的殘余物溶解在2. 5mL水中,加入250 μ L哌啶。輕輕搖動(dòng)溶 液45分鐘,然后如前所述用乙醇沉淀。獲得的沉淀物通過凍干干燥,然后溶解在硼酸鈉緩 沖液(4. 8mL, 150mM, pH 9. 4)中至濃度為 ImM。將溶液冷卻至4°C,加入在DMF中的40當(dāng)量的每種N-Fmoc-炔丙基甘氨酸(1. 2mL,0. 15M)和DMT-MM水溶液(7. 7mL,0. 25M)?;旌衔镌?°C下輕輕搖動(dòng)2小時(shí),之后加入另外 40當(dāng)量的N-Fmoc-炔丙基甘氨酸和DMT-MM,溶液再搖動(dòng)16小時(shí)。稍后如上所述通過EtOH 沉淀和反相HPLC純化該混合物,并且如前所述用哌啶處理除去N-Fmoc基團(tuán)。在通過EtOH 沉淀進(jìn)行最終純化后,通過凍干干燥獲得的沉淀物,并進(jìn)入合成的下一循環(huán)。循環(huán)2-4 對于這些循環(huán)中的每一個(gè),將來自前一循環(huán)的干燥沉淀物溶解在水中,并且根據(jù) 文庫DNA成分的消光系數(shù),通過分光光度法測定文庫的濃度,其中化合物2的初始消光系數(shù) 為131,500L/(mole. cm)。用水調(diào)節(jié)文庫的濃度,使后續(xù)連接反應(yīng)中的終濃度為0. 25mM。然 后將文庫在96孔板中分成96個(gè)等份。向每個(gè)孔中加入含有不同標(biāo)簽的溶液(文庫與標(biāo)簽 的摩爾比為1 2),如循環(huán)1所述進(jìn)行連接。循環(huán)2、3、4中使用的寡核苷酸標(biāo)簽分別在表 4、5、6中列出。對于循環(huán)1-4中的每一個(gè),標(biāo)簽與結(jié)構(gòu)單元前體之間的對應(yīng)關(guān)系在表7中提 供。如以上對于循環(huán)1所述,通過加入乙醇沉淀文庫,并將其溶解在硼酸鈉緩沖液(150mM, PH 9. 4)中至濃度為ImM。隨后的?;图兓缪h(huán)1所述進(jìn)行,不同之處在于循環(huán)3中省 略了 HPLC純化。利用以上對于標(biāo)簽連接所述的方法,將循環(huán)4的產(chǎn)物與以下所示的封閉引物連接。5,-PO3-CAG AAG ACA GAC AAG CTT CAC CTG C (SEQ IDNO 889)5,-PO3-GCA GGT GAA GCT TGT CTG TCT TCT GAA (SEQ IDNO 890)結(jié)果上述合成程序能夠產(chǎn)生含有964(約IO8)個(gè)不同結(jié)構(gòu)的文庫。通過對每一循環(huán)的 產(chǎn)物進(jìn)行凝膠電泳和LC/MS,監(jiān)測文庫的合成。完成后,用幾種方法分析文庫。圖13a是循 環(huán)4后,但在封閉引物連接前的文庫的層析圖;圖13b是同一合成階段的文庫的質(zhì)譜圖。平 均分子量通過負(fù)離子LC/MS分析測定。離子信號用ProMass軟件解析。該結(jié)果與預(yù)測的該 文庫的平均質(zhì)量一致。通過瓊脂糖凝膠電泳分析文庫的DNA成分,顯示文庫物質(zhì)中的大多數(shù)對應(yīng)于正確 大小的連接產(chǎn)物。對從文庫采樣獲得的PCR產(chǎn)物的分子克隆進(jìn)行DNA序列分析,顯示DNA 連接高保真度地發(fā)生,并且接近于完成。文庫環(huán)化在循環(huán)4結(jié)束時(shí),在通常的?;瘲l件下,用疊氮基乙酸將文庫的一部分在N-末端 加帽。將通過EtOH沉淀純化的產(chǎn)物溶解在磷酸鈉緩沖液(150mM,pH 8)中至濃度為ImM, 并加入各為4當(dāng)量的CuSO4水溶液(200mM)、抗壞血酸水溶液(200mM)和以下所示化合物的 DMF溶液(200mM)。反應(yīng)混合物然后在室溫下輕輕搖動(dòng)2小時(shí)。
Ph」 ^
{
Ph為了測定環(huán)化程度,從文庫環(huán)化反應(yīng)中取出5 μ L等份,用如實(shí)施例4所述制備的熒光標(biāo)記的疊氮化物或炔(1μ L IOOmM DMF貯存液)處理。16小時(shí)后,根據(jù)500nm下的 HPLC分析,炔或疊氮化物標(biāo)記都未摻入文庫中。該結(jié)果表示該文庫不再含有能夠環(huán)加成的 疊氮基或炔基,因此該文庫一定已經(jīng)通過環(huán)化或分子間反應(yīng)與自身發(fā)生了反應(yīng)。如前所述 通過反相HPLC純化環(huán)化的文庫。用未環(huán)化的文庫進(jìn)行的對照實(shí)驗(yàn)顯示上述熒光標(biāo)記完全 摻入。實(shí)施例4 用于環(huán)化測定的熒光標(biāo)記的制備在單獨(dú)的管中,炔丙基甘氨酸或2-氨基-3-苯丙基疊氮(各Symol)與 FAM-OSu (Molecular Probes Inc.) (1. 2 當(dāng)量)在 pH 9. 4 的硼酸鹽緩沖液(250 μ L)中混 合。反應(yīng)在室溫下進(jìn)行3小時(shí),然后凍干過夜。經(jīng)HPLC純化獲得定量產(chǎn)率的需要的熒光炔 和疊氮化物。 實(shí)施例5 利用疊氮/炔環(huán)加成反應(yīng)環(huán)化各化合物疊氮基乙酰基-Gly-Pro-Phe-Pra-NH2的制備利用0. 3mmol Rink-酰胺樹脂,以Fmoc-保護(hù)的氨基酸和HATU為活化劑,用標(biāo) 準(zhǔn)固相合成技術(shù)合成指定的序列(Pra = C-炔丙基甘氨酸)。使用疊氮基乙酸對該四肽 加帽。用20% TFA/DCM從樹脂上切割肽4小時(shí)。經(jīng)RP HPLC純化獲得為白色固體的產(chǎn)物 (75mg,51% ) ο 1H NMR(DMS0_d6,400ΜΗζ) :8· 4_7· 8 (m,3H),7· 4_7· 1 (m,7H),4· 6_4· 4 (m,1H), 4. 4-4. 2 (m, 2Η),4. 0-3. 9 (m, 2H),3. 74 (dd, 1H, J = 6Hz, 17Hz),3. 5-3. 3 (m, 2H),3. 07 (dt, 1H, J = 5Hz,14Hz),2. 92(dd,1H, J = 5Hz,16Hz),2. 86(t,1H, J = 2Hz),2. 85-2. 75(m, 1H) , 2. 6-2. 4(m,2H) ,2. 2-1. 6(m,4H)。IR (mul 1) 2900,2100,1450,1300CHT1。ESIMS 497. 4([M+H],100% ), 993. 4 ([2M+H], 50 % )。具有離子源破碎的 ESIMS :519· 3 ([M+Na], 100% ) ,491. 3(100% ) ,480. 1 ([M-NH2], 90 % ), 452. 2 ([M-NH2-CO], 20 % ) ,424. 2(20% ), 385. 1 ([M-Pra] ,50% ), 357. 1 ([M-Pra-CO] ,40% ), 238. 0 ([M-Pra-Phe], 100% ) 疊氮基乙?;?Gly-Pro-Phe-Pra-NH2的環(huán)化
疊氮基乙?;?31mg,0. 62mmol)溶解在MeCN(30mL)中。加入二異丙基乙胺 (DIEA, ImL)和Cu(MeCN)4PF6(Img)。攪拌1. 5小時(shí)后,蒸發(fā)溶液,將獲得的殘余物回收在 20%MeCN/H20中。離心除去不溶性鹽后,對溶液進(jìn)行制備型反相HPLC。需要的環(huán)肽分離 為白色固體(10mg,32% )。1H NMR (DMS0-d6,400MHz) :8· 28 (t,1H,J = 5Hz),7· 77 (s,1H),
7.2-6. 9 (m, 9H),4. 98 (m, 2H),4. 48 (m, 1H),4. 28 (m, 1H),4. 1-3. 9 (m, 2H),3. 63 (dd, 1H, J = 5Hz, 16Ηζ),3· 33 (m,2Η),3. O (m,3Η),2. 48 (dd, 1H, J = 11Hz, 14Hz),1. 75 (m, IHO, 1. 55 (m, 1H),1. 32 (m, 1H),1. 05 (m, 1H) IR(mull) 2900,1475,1400cm—1。ESIMS 497. 2 ([M+H], 100% ), 993. 2([2M+H],30% ),1015. 2 ([2M+Na], 15 % )。具有離子源破碎的 ESIMS 535. 2(70% ), 519. 3([M+Na], 100 % ),497. 2([M+H],80 % ),480. 1 ([Μ-ΝΗ2],30 % ),452. 2([M-NH2-CO], 40% ) ,208. 1(60% )。疊氮基乙?;?Gly-Pro-Phe-Pra-Gly-OH的制備利用0. 3mmol甘氨酸-Wang樹脂,以Fmoc-保護(hù)的氨基酸和HATU為活化劑,合成 指定的序列。在最后的偶聯(lián)步驟中使用疊氮基乙酸對該五肽加帽。用50% TFA/DCM切割該 肽2小時(shí)。經(jīng)RP HPLC純化獲得為白色固體的肽(83mg ;50% ) 1H NMR(DMS0-d6,400MHz)
8.4-7. 9 (m, 4H),7. 2 (m, 5H),4. 7-4. 2 (m, 3H),4. 0-3. 7 (m, 4H),3. 5-3. 3 (m, 2H),3. 1 (m, 1H),2. 91 (dd, 1H, J = 4Hz, 16Hz),2. 84 (t, 1H, J = 2. 5Hz),2. 78 (m, 1H),2. 6-2. 4 (m, 2H), 2. 2-1. 6(m,4H)。IR(mull) 2900,2100,1450,1350CHT1。ESIMS 555. 3 ([M+H], 100% ) 具有 離子源破碎的ESIMS 577. 1 ([M+Na] ,90%), 555. 3 ([M+H], 80% ), 480. 1 ([M-Gly], 100% ), 385. 1 ([M-Gly-Pra],70 % ),357. 1 ([M-GIy-Pra-CO],40 % ),238. 0([M-Gly-Pra-Phe], 80% )。疊氮基乙?;?Gly-Pro-Phe-Pra-Gly-OH的環(huán)化將肽(32mg,0. 058mmol)溶解于MeCN(60mL)中。加入二異丙基乙胺(ImL)和 Cu(MeCN)4PF6(Img),攪拌溶液2小時(shí)。蒸發(fā)溶劑,對粗產(chǎn)物進(jìn)行RP HPLC以除去二聚體 和三聚體。環(huán)狀單體分離為無色玻璃狀(6mg,20 % )。ESIMS 555. 6 ([M+H], 100 % ), 1109. 3([2M+H],20% ),1131. 2 ([2M+Na], 15% )。具有離子源破碎的 ESIMS :555· 3 ([M+H], 100% ), 480. 4 ([M-Gly], 30 % ), 452. 2 ([M-Gly-CO] ,25% ), 424. 5 ([M_Gly-2C0], 10%,只 在環(huán)形結(jié)構(gòu)中才有可能)。直鏈肽與DNA的偶聯(lián)化合物2(45nmol)溶解在45 μ L硼酸鈉緩沖液(ρΗ 9. 4 ;150mM)中。在4°C下加 入直鏈肽(18yL在DMF中的IOOmM貯存液;180nmol ; 40當(dāng)量),然后加入DMT_MM(3. 6 μ L500mM在水中的貯存液;180nmol ;40當(dāng)量)。攪拌2小時(shí)后,LCMS顯示完全反應(yīng),經(jīng)乙醇沉淀 分離產(chǎn)物。ESIMS 1823. 0([M-3H]/3,20% ),1367. 2 ([M-4H]/4, 20 % ),1093. 7 ([M-5H]/5, 40% ) ,911. 4([M-6H]/6,100% )。環(huán)肽與DNA的偶聯(lián) 化合物2 (20nmol)溶解在20 μ L硼酸鈉緩沖液(ρΗ 9. 4,150mM)中。在4°C下加入 直鏈肽(8yL IOOmM在DMF中的貯存液;80nmol ;40當(dāng)量),然后加入DMT-MM (1. 6 μ L 500mM 在水中的貯存液;SOnmol ;40當(dāng)量)。攪拌2小時(shí)后,LCMS顯示完全反應(yīng),經(jīng)乙醇沉淀分離產(chǎn) 物。ESIMS 1823. 0([M-3H]/3,20% ),1367. 2 ([M-4HJ/4, 20% ),1093. 7 ([M-5H]/5,40% ), 911. 4([M-6H]/6,100% ) DNA-連接的肽的環(huán)化直鏈肽-DNA偶聯(lián)物(IOnmol)溶解在ρΗ 8的磷酸鈉緩沖液(10 μ L,150mm)中。在 室溫下加入各為4當(dāng)量的CuS04、抗壞血酸和Sharpless配體(0. 2 μ L 200mM貯存液)。反 應(yīng)進(jìn)行過夜。RP HPLC顯示沒有直鏈肽-DNA,產(chǎn)物與標(biāo)準(zhǔn)環(huán)肽-DNA共洗脫。未見痕量二聚 體或其他寡聚體。 LC 條件Targa C18,2. IX 40mm, 10-40% MeCN在40mM TEAA水溶液中,8分鐘實(shí)施例6 芳香親核取代反應(yīng)應(yīng)用于功能部分的合成用氰尿酰氯對化合物3進(jìn)行芳基化的一般程序化合物2以ImM的溶液溶解在ρΗ 9. 4硼酸鈉緩沖液中。將溶液冷卻至4°C,然后 以MeCN中的500mM溶液加入20當(dāng)量的氰尿酰氯。2小時(shí)后,經(jīng)LCMS證實(shí)反應(yīng)完全,獲得的 二氯三嗪-DNA偶聯(lián)物經(jīng)乙醇沉淀分離。二氯三嗪-DNA的胺取代程序
二氯三嗪-DNA偶聯(lián)物以ImM的濃度溶解在pH 9. 5硼酸鹽緩沖液中。在室溫下以DMF溶液加入40當(dāng)量的脂肪族胺。該反應(yīng)后進(jìn)行LCMS,通常在2小時(shí)后完成。獲得的烷基 氨基_ 一氯三嗪-DNA偶聯(lián)物經(jīng)乙醇沉淀分離。一氯三嗪-DNA的胺取代程序烷基氨基-一氯三嗪-DNA偶聯(lián)物以ImM的濃度溶解在pH 9. 5硼酸鹽緩沖液中。 在42C下以DMF溶液加入40當(dāng)量的第二種脂肪族胺。該反應(yīng)后進(jìn)行LCMS,通常在2小時(shí)后 完成。獲得的二氨基三嗪-DNA偶聯(lián)物經(jīng)乙醇沉淀分離。實(shí)施例7 還原性胺化反應(yīng)應(yīng)用于功能部分的合成含仲胺的DNA-連接體與醛結(jié)構(gòu)單元還原性胺化的一般程序化合物2與N-末端脯氨酸殘基偶聯(lián)。獲得的化合物以ImM的濃度溶解在磷酸鈉 緩沖液(50 μ L,150mM, pH 5. 5)中。向該溶液中加入各為40當(dāng)量的DMF中的醛結(jié)構(gòu)單元 (8 μ L,0. 25Μ)和DMF中的氰基硼氫化鈉(8 μ L,0. 25Μ),將溶液在80°C下加熱2小時(shí)。烷基 化后,通過乙醇沉淀純化該溶液。含醛的DNA-連接體與胺結(jié)構(gòu)單元還原性胺化的一般程序與含醛基的結(jié)構(gòu)單元偶聯(lián)的化合物2以ImM的濃度溶解在磷酸鈉緩沖液(50 μ L, 250mM,pH 5. 5)中。向該溶液中加入各為40當(dāng)量的DMF中的胺結(jié)構(gòu)單元(8μ L,0. 25M)禾口 DMF中的氰基硼氫化鈉(8 μ L,0. 25M),將溶液在80°C下加熱2小時(shí)。烷基化后,通過乙醇沉 淀純化該溶液。實(shí)施例8 類肽構(gòu)建反應(yīng)應(yīng)用于功能部分的合成在DNA-連接體上進(jìn)行類肽合成的一般程序 化合物2以ImM的濃度溶解在硼酸鈉緩沖液(50 μ L,150mM, pH9. 4)中,冷卻到 4°C。向該溶液中加入40當(dāng)量的DMF中的N-羥基琥珀酰亞氨基溴乙酸酯(13μ ,0. 15Μ), 該溶液在4°C下輕輕搖動(dòng)2小時(shí)。酰化后,DNA-連接體經(jīng)乙醇沉淀純化,以ImM的濃度再溶 解在硼酸鈉緩沖液(50 μ L,150mM, pH 9. 4)中,并冷卻到4°C。向該溶液中加入40當(dāng)量的 DMF中的胺結(jié)構(gòu)單元(13μ ,0. 15Μ),溶液在4°C下輕輕搖動(dòng)16小時(shí)。烷化后,DNA-連接體 經(jīng)乙醇沉淀純化,以ImM的濃度再溶解在硼酸鈉緩沖液(50 μ L,150mM, pH 9. 4)中,并冷卻 到4°C。通過分步加入N-羥基琥珀酰亞氨基溴乙酸酯,接著加入胺結(jié)構(gòu)單元,繼續(xù)類肽合 成。實(shí)施例9 疊氮化物_炔環(huán)加成反應(yīng)應(yīng)用于功能部分合成一般程序含炔的DNA偶聯(lián)物以約ImM的濃度溶解在pH 8. 0的磷酸鹽緩沖液。在室溫下 向該混合物中加入10當(dāng)量的有機(jī)疊氮化物和各為5當(dāng)量的硫酸銅(II)、抗壞血酸和配體 (三-((1-芐基三唑-4-基)甲基)胺。該反應(yīng)后進(jìn)行LCMS,通常在1-2小時(shí)后完成。獲 得的三唑-DNA偶聯(lián)物可通過乙醇沉淀分離。
實(shí)施例10 從編碼文庫內(nèi)鑒定Abl激酶的配體為了鑒定對治療目標(biāo)具有確定性質(zhì)的單一化合物,在DNA-編碼文庫中相對于不 需要的文庫成員富集目標(biāo)分子的能力是極為重要的。為了證明這種富集能力,合成了 rhAbl 激酶(GenBank U07563)的已知結(jié)合分子(描述于 Shah 等人,Science 305,399-401 (2004), 在此引用作為參考)。利用標(biāo)準(zhǔn)化學(xué)方法將該化合物通過前面實(shí)施例中所述的連接體連接 到雙鏈DNA寡核苷酸上,產(chǎn)生與通過實(shí)施例1和2所述方法產(chǎn)生的產(chǎn)物(與寡核苷酸連接 的功能部分)相類似的分子。通常如實(shí)施例2所述產(chǎn)生的文庫和DNA-連接的Abl激酶結(jié) 合分子設(shè)計(jì)為具有獨(dú)特的DNA序列,使兩種物質(zhì)都能進(jìn)行qPCR分析。DNA-連接的Abl激酶 結(jié)合分子與文庫以1 1000的比例混合。該混合物用rhAble激酶平衡,該酶在固相上捕 獲,洗滌除去未結(jié)合的文庫成員,洗脫結(jié)合的分子。洗脫物中文庫分子與DNA-連接的Abl 激酶抑制劑的比例為1 1,表示DNA-連接的Abl-激酶結(jié)合分子獲得500倍以上的富集, 與文庫分子相比1000-倍過量。等同方案本領(lǐng)域技術(shù)人員應(yīng)當(dāng)認(rèn)識到,或者僅應(yīng)用常規(guī)實(shí)驗(yàn)就能夠確定此處所述的本發(fā)明 的特定實(shí)施方案的許多等同方案。這些等同方案包括在權(quán)利要求書的范圍之內(nèi)。
權(quán)利要求
一種合成包含與編碼寡核苷酸可操作連接的功能部分的分子的方法,該方法包括以下步驟(a)提供由包含n個(gè)結(jié)構(gòu)單元的起始功能部分組成的起始化合物,其中n是1或大于1的整數(shù),其中該起始功能部分包含至少一個(gè)反應(yīng)基團(tuán),并且與起始寡核苷酸可操作連接;(b)將該起始化合物與包含至少一個(gè)互補(bǔ)反應(yīng)基團(tuán)的結(jié)構(gòu)單元反應(yīng),其中該至少一個(gè)互補(bǔ)反應(yīng)基團(tuán)與步驟(a)的反應(yīng)基團(tuán)互補(bǔ),反應(yīng)條件適合所述互補(bǔ)反應(yīng)基團(tuán)反應(yīng)形成共價(jià)鍵;(c)將所述起始寡核苷酸與標(biāo)識步驟(b)的結(jié)構(gòu)單元的引入寡核苷酸反應(yīng),反應(yīng)條件適合所述引入寡核苷酸與起始寡核苷酸連接形成編碼寡核苷酸,并存在催化起始寡核苷酸與引入寡核苷酸連接的酶;從而產(chǎn)生包含功能部分的分子,該功能部分含有n+1個(gè)結(jié)構(gòu)單元,并且與編碼寡核苷酸可操作連接。
2.權(quán)利要求1的方法,其中步驟(c)的功能部分包含反應(yīng)基團(tuán),重復(fù)步驟(a)至(c)一 次或多次,從而形成循環(huán)1至i,其中i是2或大于2的整數(shù),其中循環(huán)s的步驟(c)的產(chǎn)物 是循環(huán)s+1的起始化合物,其中s是i_l或更小的整數(shù)。
3.權(quán)利要求1的方法,其中步驟(c)在步驟(b)之前,或者步驟(b)在步驟(c)之前。
4.權(quán)利要求1的方法,其中所述結(jié)構(gòu)單元的至少一個(gè)是氨基酸或活化的氨基酸。
5.權(quán)利要求1的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自氨基、羧基、磺?;㈧??;h(huán)氧基、吖丙啶基和異氰酸酯基。
6.權(quán)利要求1的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自羥基、羧基、磺?;?、膦 ?;?、環(huán)氧基、吖丙啶基和異氰酸酯基。
7.權(quán)利要求1的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自氨基和醛基或酮基。
8.權(quán)利要求7的方法,其中所述反應(yīng)基團(tuán)與互補(bǔ)反應(yīng)基團(tuán)之間的反應(yīng)在還原條件下進(jìn)行。
9.權(quán)利要求1的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自磷葉立德基和醛基或酮基。
10.權(quán)利要求1的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)通過環(huán)加成作用反應(yīng),形成 環(huán)結(jié)構(gòu)。
11.權(quán)利要求10的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自炔和疊氮基。
12.權(quán)利要求10的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自鹵代雜芳基和親核基團(tuán)。
13.權(quán)利要求12的方法,其中所述鹵代雜芳基選自氯代嘧啶、氯代三嗪和氯代嘌呤。
14.權(quán)利要求12的方法,其中所述親核基團(tuán)是氨基。
15.權(quán)利要求1的方法,其中所述酶選自DNA連接酶、RNA連接酶、DNA聚合酶、RNA聚 合酶和拓?fù)洚悩?gòu)酶。
16.權(quán)利要求1的方法,其中所述起始寡核苷酸是雙鏈或單鏈的。
17.權(quán)利要求16的方法,其中所述起始寡核苷酸包含PCR引物序列。
18.權(quán)利要求16的方法,其中所述起始寡核苷酸是單鏈的,且引入寡核苷酸是單鏈的; 或者起始寡核苷酸是雙鏈的,且引入寡核苷酸是雙鏈的。
19.權(quán)利要求18的方法,其中起始功能部分和起始寡核苷酸通過連接部分連接。
20.權(quán)利要求19的方法,其中所述起始寡核苷酸是雙鏈的,所述連接部分與起始功能 部分和與起始寡核苷酸的兩條鏈共價(jià)偶聯(lián)。
21.權(quán)利要求1的方法,其中所述引入寡核苷酸為3到10個(gè)核苷酸的長度。
22.權(quán)利要求2的方法,其中循環(huán)i的引入寡核苷酸包含PCR封閉引物。
23.權(quán)利要求2的方法,其在循環(huán)i中進(jìn)一步包括以下步驟(d)將包含封閉PCR引物序列的寡核苷酸與編碼寡核苷酸連接。
24.權(quán)利要求23的方法,其中在催化所述連接的酶的存在下,將包含封閉PCR引物序列 的寡核苷酸與編碼寡核苷酸連接。
25.權(quán)利要求2的方法,其在循環(huán)i后進(jìn)一步包括以下步驟(e)環(huán)化所述功能部分。
26.權(quán)利要求25的方法,其中所述功能部分包含炔基和疊氮基,且將該化合物在適合 炔基和疊氮基環(huán)加成作用形成三唑基的條件下處理,從而環(huán)化該功能部分。
27.一種合成化合物文庫的方法,其中化合物包含功能部分,該功能部分包含兩個(gè)或 多個(gè)結(jié)構(gòu)單元并且與標(biāo)識該功能部分結(jié)構(gòu)的起始寡核苷酸可操作連接,該方法包括下列步 驟(a)提供包含m種起始化合物的溶液,其中m是1或大于1的整數(shù),其中起始化合物由 包含n個(gè)結(jié)構(gòu)單元的功能部分組成,其中n是1或大于1的整數(shù),該功能部分與標(biāo)識該n個(gè) 結(jié)構(gòu)單元的起始寡核苷酸可操作連接;(b)將步驟(a)的溶液分配到r個(gè)反應(yīng)容器中,其中r是2或大于2的整數(shù),從而產(chǎn)生 r個(gè)等份的溶液;(c)將每個(gè)反應(yīng)容器中的起始化合物與r個(gè)結(jié)構(gòu)單元之一反應(yīng),從而產(chǎn)生r個(gè)等份,該 等份包含由功能部分組成的化合物,該功能部分包含n+1個(gè)結(jié)構(gòu)單元,并且與起始寡核苷 酸可操作連接;和(d)在適合引入寡核苷酸與起始寡核苷酸發(fā)生酶連接的條件下,在催化引入寡核苷酸 與起始寡核苷酸連接的酶的存在下,將每個(gè)等份中的起始寡核苷酸與一組r個(gè)不同引入寡 核苷酸之一反應(yīng);從而產(chǎn)生r個(gè)等份,這些等份包含由功能部分組成的分子,該功能部分包含n+1個(gè)結(jié)構(gòu) 單元,并且與編碼該n+1個(gè)結(jié)構(gòu)單元的延長的寡核苷酸可操作連接。
28.權(quán)利要求27的方法,其選一步包括以下步驟(e)組合所述r個(gè)等份中的兩個(gè)或多個(gè)等份,從而產(chǎn)生包含由功能部分組成的分子的 溶液,該功能部分包含n+1個(gè)結(jié)構(gòu)單元,并且與編碼該n+1個(gè)結(jié)構(gòu)單元的延長的寡核苷酸可 操作連接。
29.權(quán)利要求28的方法,其中混合r個(gè)等份。
30.權(quán)利要求28的方法,其中步驟(a)至(e)進(jìn)行一次或多次,產(chǎn)生循環(huán)1至i,其中 i是2或大于2的整數(shù),其中在循環(huán)s+1中,其中s是i_l或更小的整數(shù),步驟(a)的含m種 起始化合物的溶液是循環(huán)s的步驟(e)的溶液。
31.權(quán)利要求7或權(quán)利要求8的方法,其中在循環(huán)1至i的至少一個(gè)中,步驟(d)在步 驟(c)之前。
32.權(quán)利要求28的方法,其中至少一個(gè)結(jié)構(gòu)單元是氨基酸。
33.權(quán)利要求7的方法,其中所述酶是DNA連接酶、RNA連接酶、DNA聚合酶、RNA聚合 酶或拓?fù)洚悩?gòu)酶。
34.權(quán)利要求28的方法,其中所述起始寡核苷酸是雙鏈寡核苷酸。
35.權(quán)利要求34的方法,其中所述引入寡核苷酸是雙鏈寡核苷酸。
36.權(quán)利要求28的方法,其中所述起始化合物包含連接體部分,該連接體部分包含適 合與結(jié)構(gòu)單元鍵合的第一官能團(tuán)、適合與寡核苷酸的5’末端鍵合的第二官能團(tuán),和適合與 寡核苷酸的3’末端鍵合的第三官能團(tuán)。
37.權(quán)利要求36的方法,其中所述連接體部分具有結(jié)構(gòu) 其中A是適合與結(jié)構(gòu)單元鍵合的官能團(tuán); B是適合與寡核苷酸的5’末端鍵合的官能團(tuán); C是適合與寡核苷酸的3’末端鍵合的官能團(tuán); S是原子或支架; D是將A與S相連接的化學(xué)結(jié)構(gòu); E是將B與S相連接的化學(xué)結(jié)構(gòu);且 F是將C與S相連接的化學(xué)結(jié)構(gòu)。
38.權(quán)利要求37的方法,其中 A是氨基;B是磷酸基;且 C是磷酸基。
39.權(quán)利要求37的方法,其中D、E和F各自獨(dú)立地為亞烷基或低聚(乙二醇)基。
40.權(quán)利要求37的方法,其中S是碳原子、氮原子、磷原子、硼原子、磷酸基、環(huán)基或多環(huán)基。
41.權(quán)利要求40的方法,其中連接體部分具有結(jié)構(gòu) 其中n、m和p各自獨(dú)立地為1至約20的整數(shù)。
42.權(quán)利要求41的方法,其中n、m和p各自獨(dú)立地為2至8的整數(shù)。
43.權(quán)利要求42的方法,其中n、m和p各自獨(dú)立地為3至6的整數(shù)。
44.權(quán)利要求41的方法,其中連接體部分具有結(jié)構(gòu)
45.權(quán)利要求27的方法,其中所述起始化合物的每一個(gè)都包含反應(yīng)基團(tuán),并且其中所 述r個(gè)結(jié)構(gòu)單元的每一個(gè)都包含與所述反應(yīng)基團(tuán)互補(bǔ)的互補(bǔ)反應(yīng)基團(tuán)。
46.權(quán)利要求45的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自氨基、羧基、磺?;?膦?;h(huán)氧基、吖丙啶基和異氰酸酯基。
47.權(quán)利要求45的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自羥基、羧基、磺?;?、 膦?;h(huán)氧基、吖丙啶基團(tuán)和異氰酸酯基。
48.權(quán)利要求45的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自氨基和醛基或酮基。
49.權(quán)利要求45的方法,其中所述反應(yīng)基團(tuán)與互補(bǔ)反應(yīng)基團(tuán)之間的反應(yīng)在還原條件下 進(jìn)行。
50.權(quán)利要求45的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自磷葉立德基和醛基或酮基。
51.權(quán)利要求45的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)通過環(huán)加成作用反應(yīng),形 成環(huán)結(jié)構(gòu)。
52.權(quán)利要求51的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自炔和疊氮基。
53.權(quán)利要求45的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)官能團(tuán)選自鹵代雜芳基和親核基團(tuán)。
54.權(quán)利要求53的方法,其中所述鹵代雜芳基選自氯代嘧啶、氯代三嗪和氯代嘌呤。
55.權(quán)利要求53的方法,其中所述親核基團(tuán)是氨基。
56.權(quán)利要求28的方法,其在循環(huán)i后進(jìn)一步包括以下步驟 (f)環(huán)化一個(gè)或多個(gè)功能部分。
57.權(quán)利要求56的方法,其中步驟(f)的功能部分包含疊氮基和炔基。
58.權(quán)利要求57的方法,其中所述功能部分保持在適合疊氮基和炔基環(huán)加成反應(yīng)形成 三唑基的條件下,從而形成環(huán)狀功能部分。
59.權(quán)利要求58的方法,其中所述環(huán)加成反應(yīng)在銅催化劑的存在下進(jìn)行。
60.權(quán)利要求59的方法,其中步驟(f)的一個(gè)或多個(gè)功能部分中的至少一個(gè)包含至少 兩個(gè)巰基,并且該功能部分保持在適合兩個(gè)巰基反應(yīng)形成二硫基的條件下,從而環(huán)化該功 能部分。
61.權(quán)利要求27的方法,其中所述起始寡核苷酸包含PCR引物序列。
62.權(quán)利要求28的方法,其中循環(huán)i的引入寡核苷酸包含PCR封閉引物。
63.權(quán)利要求28的方法,其在循環(huán)i后進(jìn)一步包括以下步驟(d)將包含封閉PCR引物序列的寡核苷酸與編碼寡核苷酸連接。
64.權(quán)利要求63的方法,其中在催化所述連接的酶的存在下,所述包含封閉PCR引物序 列的寡核苷酸與編碼寡核苷酸連接。
65.下式的化合物 其中X是包含一個(gè)或多個(gè)結(jié)構(gòu)單元的功能部分; Z是在其3’末端與B連接的寡核苷酸; Y是在其5’末端與C連接的寡核苷酸; A是與X形成共價(jià)鍵的官能團(tuán); B是與Z的3’ -末端形成鍵的官能團(tuán); C是與Y的5’ -末端形成鍵的官能團(tuán); D、F和E各自獨(dú)立地是雙功能連接基團(tuán);且 S是原子或分子支架。
66.權(quán)利要求65的化合物,其中D、E和F各自獨(dú)立地是亞烷基鏈或低聚(乙二醇)鏈。
67.權(quán)利要求65的化合物,其中Y和Z基本互補(bǔ),并且在化合物中定向,從而在適當(dāng)條 件下能夠發(fā)生Watson-Crick堿基配對和雙鏈體形成。
68.權(quán)利要求65的化合物,其中Y和Z具有相同的長度或不同的長度。
69.權(quán)利要求68的化合物,其中Y和Z具有相同的長度。
70.權(quán)利要求65的化合物,其中Y和Z各為10個(gè)或更多堿基的長度,并且具有10個(gè)或 更多堿基對的互補(bǔ)區(qū)。
71.權(quán)利要求65的化合物,其中S是碳原子、硼原子、氮原子、磷原子或多原子支架。
72.權(quán)利要求71的化合物,其中S是磷酸基或環(huán)基。
73.權(quán)利要求72的化合物,其中S是環(huán)烷基、環(huán)烯基、雜環(huán)烷基、雜環(huán)烯基、芳基或雜芳基。
74.權(quán)利要求65的化合物,其中連接體部分具有結(jié)構(gòu) 其中n、m和p各自獨(dú)立地為1至約20的整數(shù)。
75.權(quán)利要求74的化合物,其中n、m和p各自獨(dú)立地為2至8的整數(shù)。
76.權(quán)利要求75的化合物,其中n、m和p各自獨(dú)立地為3至6的整數(shù)。
77.權(quán)利要求65的化合物,其中連接體部分具有結(jié)構(gòu)
78.權(quán)利要求65的化合物,其中X和Y包含PCR引物序列。
79.—種包含至少約102種不同化合物的化合物文庫,該化合物包含功能部分,該功能 部分包含兩個(gè)或多個(gè)結(jié)構(gòu)單元并且與識別該功能部分結(jié)構(gòu)的寡核苷酸可操作連接。
80.權(quán)利要求79的化合物文庫,該文庫包含各為至少約105個(gè)拷貝的不同化合物。
81.權(quán)利要求79的化合物文庫,該文庫包含各為至少約106個(gè)拷貝的不同化合物。
82.權(quán)利要求79的化合物文庫,其包含至少約104種不同的化合物。
83.權(quán)利要求79的化合物文庫,其包含至少約106種不同的化合物。
84.權(quán)利要求79的化合物文庫,其包含至少約108種不同的化合物。
85.權(quán)利要求79的化合物文庫,其包含至少約101(1種不同的化合物。
86.權(quán)利要求79的化合物文庫,其包含至少約1012種不同的化合物。
87.權(quán)利要求79的化合物文庫,其中該文庫包含多種獨(dú)立地為式I的化合物 其中X是包含一個(gè)或多個(gè)結(jié)構(gòu)單元的功能部分; Z是在其3’末端與B連接的寡核苷酸; Y是在其5’末端與C連接的寡核苷酸; A是與X形成共價(jià)鍵的官能團(tuán); B是與Z的3’ -末端形成鍵的官能團(tuán); C是與Y的5’ -末端形成鍵的官能團(tuán); D、F和E各自獨(dú)立地是雙功能連接基團(tuán);且 S是原子或分子支架。
88.權(quán)利要求87的化合物文庫,其中對于每一種式I的化合物,A、B、C、D、E、F和S各 自具有相同的身份。
89.權(quán)利要求87的化合物文庫,該文庫基本由多種式I的化合物組成。
90.權(quán)利要求87的化合物文庫,其中D、E和F各自獨(dú)立地是亞烷基鏈或低聚(乙二醇)鏈。
91.權(quán)利要求87的化合物文庫,其中Y和Z基本互補(bǔ),并且在化合物中定向,從而在適 當(dāng)條件下能夠發(fā)生Watson-Crick堿基配對和雙鏈體形成。
92.權(quán)利要求87的化合物文庫,其中Y和Z具有相同的長度或不同的長度。
93.權(quán)利要求87的化合物文庫,其中Y和Z具有相同的長度。
94.權(quán)利要求87的化合物文庫,其中Y和Z各自為10個(gè)或更多堿基的長度,并且具有 10個(gè)或更多堿基對的互補(bǔ)區(qū)。
95.權(quán)利要求87的化合物文庫,其中S是碳原子、硼原子、氮原子、磷原子或多原子支^K o
96.權(quán)利要求87的化合物文庫,其中S是磷酸基或環(huán)基。
97.權(quán)利要求96的化合物文庫,其中S是環(huán)烷基、環(huán)烯基、雜環(huán)烷基、雜環(huán)烯基、芳基或雜芳基。
98.權(quán)利要求87的化合物文庫,其中連接體部分具有結(jié)構(gòu) 其中n、m和p各自獨(dú)立地是1至約20的整數(shù)。
99.權(quán)利要求98的化合物文庫,其中n、m和p各自獨(dú)立地是2至8的整數(shù)。
100.權(quán)利要求99的化合物,其中n、m和p各自獨(dú)立地是3至6的整數(shù)。
101.權(quán)利要求87的化合物,其中連接體部分具有結(jié)構(gòu)
102.權(quán)利要求87的化合物文庫,其中X和Z包含PCR引物序列。
103.由權(quán)利要求1的方法制備的一種化合物。
104.由權(quán)利要求27的方法制備的一種化合物文庫。
105.一種鑒定能與生物靶標(biāo)結(jié)合的一種或多種化合物的方法,該方法包括以下步驟(a)在適合化合物文庫的至少一個(gè)成員與靶標(biāo)結(jié)合的條件下使該生物靶標(biāo)接觸通過權(quán) 利要求27的方法制備的化合物文庫;(b)除去不與該靶標(biāo)結(jié)合的文庫成員;(c)擴(kuò)增能與該靶標(biāo)結(jié)合的化合物文庫至少一個(gè)成員的編碼寡核苷酸;(d)對步驟(c)的編碼寡核苷酸進(jìn)行測序;和(e)利用步驟(d)測定的序列確定能與該生物靶標(biāo)結(jié)合的化合物文庫成員的功能部分 的結(jié)構(gòu);從而鑒定能與生物靶標(biāo)結(jié)合的一種或多種化合物。
106.一種鑒定能與生物靶標(biāo)結(jié)合的化合物的方法,該方法包括以下步驟(a)在適合化合物文庫的至少一個(gè)成員與靶標(biāo)結(jié)合的條件下,使生物靶標(biāo)接觸包含至 少約102種不同化合物的化合物文庫,該化合物包含功能部分,該功能部分包含兩個(gè)或多個(gè) 結(jié)構(gòu)單元,并且與標(biāo)識該功能部分的結(jié)構(gòu)的寡核苷酸可操作連接;(b)除去不與該靶標(biāo)結(jié)合的文庫成員;(c)擴(kuò)增能與該靶標(biāo)結(jié)合的化合物文庫至少一個(gè)成員的編碼寡核苷酸;(d)對步驟(c)的編碼寡核苷酸進(jìn)行測序;和 (e)利用步驟(d)測定的序列確定能與該生物靶標(biāo)結(jié)合的化合物文庫成員的功能部分 的結(jié)構(gòu);從而鑒定能與該生物靶標(biāo)結(jié)合的一種或多種化合物。
107.權(quán)利要求106的方法,其中所述文庫包含各為至少約105個(gè)拷貝的不同化合物。
108.權(quán)利要求106的方法,其中所述文庫包含各為至少約106個(gè)拷貝的不同化合物。
109.權(quán)利要求106的方法,其中所述文庫包含至少約104種不同的化合物。
110.權(quán)利要求106的方法,其中所述文庫包含至少約106種不同的化合物。
111.權(quán)利要求106的方法,其中所述文庫包含至少約108種不同的化合物。
112.權(quán)利要求106的方法,其中所述文庫包含至少約101(1種不同的化合物。
113.權(quán)利要求106的方法,其中所述化合物文庫包含至少約1012種不同的化合物。
114.權(quán)利要求106的方法,其中所述化合物文庫包含多種獨(dú)立地為式I的化合物 (I)其中X是包含一個(gè)或多個(gè)結(jié)構(gòu)單元的功能部分; Z是在其3’末端與B連接的寡核苷酸; Y是在其5’末端與C連接的寡核苷酸; A是與X形成共價(jià)鍵的官能團(tuán); B是與Z的3’ -末端形成鍵的官能團(tuán); C是與Y的5’ -末端形成鍵的官能團(tuán); D、F和E各自獨(dú)立地是雙功能連接基團(tuán);且 S是原子或分子支架。
115.權(quán)利要求114的方法,其中對于每一種式I的化合物,A、B、C、D、E、F和S各自具 有相同的身份。
116.權(quán)利要求114的方法,其中所述化合物文庫基本由多種式I的化合物組成。
117.權(quán)利要求114的方法,其中D、E和F各自獨(dú)立地是亞烷基鏈或低聚(乙二醇)鏈。
118.權(quán)利要求114的方法,其中Y和Z基本互補(bǔ),并且在化合物中定向,從而在適當(dāng)條 件下能夠發(fā)生Watson-Crick堿基配對和雙鏈體形成。
119.權(quán)利要求114的方法,其中Y和Z具有相同的長度或不同的長度。
120.權(quán)利要求119的方法,其中Y和Z具有相同的長度。
121.權(quán)利要求114的方法,其中Y和Z各自為10個(gè)或更多堿基的長度,并且具有10個(gè) 或更多堿基對的互補(bǔ)區(qū)。
122.權(quán)利要求114的方法,其中S是碳原子、硼原子、氮原子、磷原子或多原子支架。
123.權(quán)利要求114的方法,其中S是磷酸基或環(huán)基。
124.權(quán)利要求123的方法,其中S是環(huán)烷基、環(huán)烯基、雜環(huán)烷基、雜環(huán)烯基、芳基或雜芳基。
125.權(quán)利要求114的方法,其中連接體部分具有結(jié)構(gòu) 其中n、m和p各自獨(dú)立地為1至約20的整數(shù)。
126.權(quán)利要求125的方法,其中n、m和p各自獨(dú)立地為2至8的整數(shù)。
127.權(quán)利要求126的方法,其中n、m和p各自獨(dú)立地為3至6的整數(shù)。
128.權(quán)利要求127的方法,其中連接體部分具有結(jié)構(gòu)
129.權(quán)利要求114的方法,其中X和Z包含PCR引物序列。
全文摘要
本發(fā)明提供一種合成包含編碼寡核苷酸標(biāo)簽的分子文庫的方法。
文檔編號C07H21/04GK101864412SQ20101015936
公開日2010年10月20日 申請日期2004年12月17日 優(yōu)先權(quán)日2003年12月17日
發(fā)明者丹尼斯·本杰明, 喬治·J·富蘭克林, 保羅·A·森特里爾拉, 克里斯托弗·C·阿里科·馬恩德爾, 尼爾斯·雅各布·維斯特·漢森, 巴里·摩根, 戴維德·I·伊斯雷爾, 斯蒂芬·菲利普·克里澤, 斯蒂芬·黑爾, 理查德·瓦格納, 雷克沙·A·阿查雅, 馬修·克拉克, 馬爾科爾姆·J·卡瓦爾納, 馬爾科爾姆·L·格夫特 申請人:普雷西斯藥品公司