最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

基因治療載體和胞嘧啶脫氨酶的制作方法

文檔序號:581342閱讀:701來源:國知局
專利名稱:基因治療載體和胞嘧啶脫氨酶的制作方法
技術(shù)領(lǐng)域
本公開涉及修飾的胞嘧啶脫氨酶(⑶)。本公開還涉及表達此類修飾⑶的細胞和使用此類修飾CD治療疾病和病癥的方法。
背景技術(shù)
酵母或細菌胞嘧啶脫氨酶將無毒性的抗生素前體藥物5-FC轉(zhuǎn)變成細胞毒性的化學治療劑5-氟尿嘧啶(5-FU)。尚不知曉人(一般而言,哺乳動物)具有編碼具有顯著胞嘧啶脫氨酶活性的酶的天然存在基因。酵母和細菌胞嘧啶脫氨酶在使用基因遞送和病毒載體用于遞送酶、然后用5-FC治療的癌癥治療中得到認可,其中5-FC然后被酶轉(zhuǎn)變成細胞毒性藥物(Miller 等,Can Res 62:773-780 2002 ;Kievit 等,Can Res 59:1417-1421 1999)。

發(fā)明內(nèi)容
本文提供將5-FC轉(zhuǎn)變成5-FU的多肽。還提供編碼此類多肽的核酸分子、表達此類多肽的細胞、包含此類多核苷酸和多肽的載體以及適宜地使用此類多肽合成5-FU或其衍生物的方法。因此,在多個實施方案中,提供了包含具有SEQ ID NO :2所示序列的胞嘧啶脫氨酶的分離的或重組的多肽。在其它實施方案中,多肽包含具有選自A23L、V108I、I140L 及其任何組合的突變的SEQ ID NO :2。在又一實施方案中,多肽包含SEQ ID NO :4中所示序列并且包括除殘基(a) 23、108和140之外的可達50、25、10或5個保守氨基酸取代。通常,本文提供的多肽表現(xiàn)出用于將5-FC轉(zhuǎn)變成5-FU的胞嘧啶脫氨酶活性。本公開還提供包含與SEQ ID而4至少80%、90%、95%、98%或99%相同的序列的多肽,其中多肽在第^位具有亮氨酸,在第108位具有異亮氨酸并且在第140位具有亮氨酸,并且其中多肽具有胞嘧啶脫氨酶活性。在又一實施方案中,多肽包含SEQ ID N0:4中所示序列。本公開還提供包含可操作連接至尿嘧啶磷酸核糖基轉(zhuǎn)移酶(UPRT)或乳清酸磷酸核糖基轉(zhuǎn)移酶(OPRT)的任何一種前述多肽的融合構(gòu)建體。在一個實施方案中,融合構(gòu)建體包含連接至具有UPRT或OPRT活性的第二多肽的第一多肽,所述第一多肽包含具有選自 A23L、V108I、I140L及其任何組合的突變的SEQ ID NO :2。在又一實施方案中,融合構(gòu)建體包含具有SEQ ID NO 4中所示序列的第一多肽并且包括除殘基23、108和140之外可達 50、25、10或5個保守氨基酸取代,其中第一多肽連接至具有UPRT或OPRT活性的第二多肽。 本公開還提供融合構(gòu)建體,其包含具有胞嘧啶脫氨酶活性并且含有與SEQ ID N0:4至少 80 %、90 %、95 %、98 %或99 %相同的序列的第一多肽,其中該多肽在第23位具有亮氨酸,在第108位具有異亮氨酸并且在第140位具有亮氨酸,并且其中第一多肽連接至包含UPRT 或OPRT活性的第二多肽。在一個實施方案中,具有UPRT或OPRT活性的多肽包含分別在 SEQ ID N0:8和10中所示序列或其變體。在又一實施方案中,包含胞嘧啶脫氨酶活性的第一多肽連接至具有UPRT或OPRT活性的多肽,其中多肽通過肽連接體分開。在另一實施方案中,融合構(gòu)建體包含選自SEQ ID NO: 12、14、16或18的序列。本公開還提供編碼任何前述多肽的多核苷酸。例如,本公開提供多核苷酸,所述多核苷酸編碼包含具有選自A23L、V108I、I140L及其任何組合的突變的SEQ ID NO :2的多肽。在又一實施方案中,多核苷酸編碼包含SEQ ID NO :4所示序列的多肽并且包括除殘基 (a) 23、108和140外可達50、25、10或5個保守氨基酸取代。在進一步的實施方案中,本公開提供多核苷酸,所述多核苷酸編碼包含與SEQ ID而4至少80%、90%、95%、98%或99% 相同的序列的多肽,其中多肽在第23位具有亮氨酸,在第108位具有異亮氨酸并且在第140 位具有亮氨酸,并且其中多肽具有胞嘧啶脫氨酶活性。在又一實施方案中,多核苷酸編碼包含SEQ ID NO :4的多肽。在又一實施方案中,多核苷酸編碼包含SEQ ID NO :4、6、8、10、11、 12或13所示序列的多肽。本公開提供編碼胞嘧啶脫氨酶的人密碼子優(yōu)化的多核苷酸。在一個實施方案中, 人密碼子優(yōu)化的多核苷酸包含SEQ ID NO :3所示序列。在又一實施方案中,多核苷酸包含 SEQ ID N0:5、7或9所示序列。在其它實施方案中,本公開的胞嘧啶脫氨酶或融合構(gòu)建體使用基因遞送系統(tǒng) (GDS)遞送。在另一方面中,編碼胞嘧啶脫氨酶的多核苷酸使用其為病毒或病毒衍生載體的 GDS遞送。病毒載體可以是復制型或者非復制型,并且可以是腺病毒載體、麻疹病毒載體、 皰疹病毒載體、反轉(zhuǎn)錄病毒載體(包括慢病毒載體)、彈狀病毒載體例如水泡性口炎病毒載體、呼腸孤病毒載體、矽尼卡谷病毒載體、痘病毒載體(包括動物疹或痘病毒衍生的載體)、 細小病毒屬載體(包括AAV載體)、甲病毒屬載體或本領(lǐng)域技術(shù)人員已知的其它病毒載體。 在一個實施方案中,病毒載體可以是能感染正在復制的哺乳動物細胞的可復制型反轉(zhuǎn)錄病毒載體??蓮椭菩头崔D(zhuǎn)錄病毒載體可以包括正反轉(zhuǎn)錄病毒(Orthoretrovirus)或更有代表性的Y反轉(zhuǎn)錄病毒載體。在一個方面中,可復制型反轉(zhuǎn)錄病毒載體包含在編碼本公開胞嘧啶脫氨酶的多核苷酸5’端的內(nèi)部核糖體進入位點(IREQ。在一個實施方案中,編碼胞嘧啶脫氨酶的多核苷酸在反轉(zhuǎn)錄病毒載體ENV多核苷酸的3’端。在其它實施方案中,提供用本公開的胞嘧啶脫氨酶或融合構(gòu)建體或者包括本公開多核苷酸或融合構(gòu)建體的載體轉(zhuǎn)染的宿主細胞。宿主細胞包括真核細胞,例如酵母細胞、昆蟲細胞或動物細胞。宿主細胞還包括原核細胞,例如細菌細胞。本公開還提供治療細胞增殖性病癥(包括癌癥)的方法,包括向受試者施用本公開的多核苷酸或多肽和使受試者接觸包含5-氟胞嘧啶(5-FC)的細胞毒性藥物。本公開提供重組的可復制型反轉(zhuǎn)錄病毒(RCR),包含反轉(zhuǎn)錄病毒GAG蛋白;反轉(zhuǎn)錄病毒POL蛋白;反轉(zhuǎn)錄病毒包膜;包含位于反轉(zhuǎn)錄病毒多核苷酸序列3'端的長末端重復 (LTR)序列、位于反轉(zhuǎn)錄病毒多核苷酸5'端的啟動子序列、gag核酸結(jié)構(gòu)域、pol核酸結(jié)構(gòu)域和erw核酸結(jié)構(gòu)域的反轉(zhuǎn)錄病毒多核苷酸,所述啟動子適宜于在哺乳動物細胞中表達; 包含可操作連接至異源多核苷酸的內(nèi)部核糖體進入位點(IRES)的盒,其中盒位于3' LTR 的5'端并且位于編碼反轉(zhuǎn)錄病毒包膜的erw核酸結(jié)構(gòu)域的3'端;和在靶細胞內(nèi)進行反轉(zhuǎn)錄、包裝和整合必需的順式作用序列,其中與PACE載體(SEQ ID NO :21)相比,RCR在6 次傳代后保持了較高的復制能力。在一個實施方案中,反轉(zhuǎn)錄病毒多核苷酸序列衍生自鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoMLV)、貓科白血病病毒或長臂猿白血病病毒 (GALV)。在另一實施方案中,MLV是雙嗜性MLV。在又一實施方案中,反轉(zhuǎn)錄病毒是致癌反轉(zhuǎn)錄病毒。在又一實施方案中,靶細胞是具有細胞增殖性病癥的細胞。細胞增殖性病癥可以選自,但不限于,肺癌、結(jié)腸-直腸癌、乳腺癌、前列腺癌、泌尿道癌、子宮癌、腦癌、頭頸癌、 胰腺癌、黑素瘤、胃癌和卵巢癌、類風濕性關(guān)節(jié)炎和其它自身免疫病。在一個實施方案中,啟動子包括具有SEQ ID NO 19、20或22的從核苷酸1至大約核苷酸582所示序列的CMV啟動子并且可包括對一個或更多個核酸堿基的修飾,所述啟動子能夠指導和起始轉(zhuǎn)錄。在仍然進一步的實施方案中,啟動子包含SEQ ID NO: 19、20或22從核苷酸1至大約核苷酸582 所示序列。在又一實施方案中,啟動子包含CMV-R-TO結(jié)構(gòu)域多核苷酸。在一個實施方案中, CMV-R-U5結(jié)構(gòu)域包含連接至MLV R-U5區(qū)的人巨細胞病毒立即早期啟動子。在又一實施方案中,CMV-R-U5結(jié)構(gòu)域多核苷酸包含SEQ ID NO :19、20或22從大約核苷酸1至大約核苷酸1202所示序列或者與SEQ ID NO :19、20或22所示序列至少95%相同的序列,其中多核苷酸促進與其可操作連接的核酸分子的轉(zhuǎn)錄。在另一實施方案中,所述多核苷酸的gag和 pol衍生自致癌反轉(zhuǎn)錄病毒。gag核酸結(jié)構(gòu)域可包含SEQ ID NO 19從大約核苷酸1203至大約核苷酸觀19的序列或者與其具有至少95^^98^^99%或99. 8%同一性的序列。pol 結(jié)構(gòu)域可包含SEQ ID NO :19從大約核苷酸洲20至大約核苷酸6358的序列或與其具有至少95%、98%、99%或99. 9%同一性的序列。在一個實施方案中,env結(jié)構(gòu)域編碼兩性env 蛋白質(zhì)。env結(jié)構(gòu)域可包含SEQ ID NO :19從大約核苷酸6359至大約核苷酸8323的序列或與其具有至少95 %、98 %、99 %或99. 8 %同一性的序列。載體的IRES結(jié)構(gòu)域可以是任何 IRES,然而,在一個實施方案中,IRES衍生自腦心肌炎病毒。在又一實施方案中,IRES包含 SEQ ID NO :19從大約核苷酸8327至大約核苷酸8876的序列或與其具有至少95^^98%或 99%同一性的序列。在仍然進一步的實施方案中,異源多核苷酸包括具有SEQ ID NO :3,5, 11、13、15或17所示序列的多核苷酸。在又一實施方案中,異源序列編碼包含SEQ ID NO 4 所示序列的多肽。異源核酸是人密碼子優(yōu)化的并且編碼如SEQ ID NO :4中所示多肽。在又一實施方案中,異源核酸包含SEQ ID NO: 19從大約核苷酸8877至大約9353所示序列。在一個實施方案中,3’ LTR衍生自致癌反轉(zhuǎn)錄病毒。在又一實施方案中,3’ LTR包含U3-R-U5 結(jié)構(gòu)域。在仍然進一步的實施方案中,3,LTR包含SEQ ID NO 19從大約核苷酸9405至大約9998所示序列或與其至少95%、98%或99. 5%相同的序列。本公開提供包含SEQ ID NO :19,20或22所示序列的多核苷酸。本公開提供分離的多核苷酸,從5’至3’包含人巨細胞病毒立即早期啟動子與 MLV R-U5區(qū)的CMV-R-U5融合物;PBS,對于反轉(zhuǎn)錄酶的引物結(jié)合位點;5’剪接位點;Ψ包裝信號;MLV組特異性抗原的gag編碼序列;MLV聚合酶多蛋白的pol編碼序列;3’剪接位點; MLV株4070A包膜蛋白的4070A env編碼序列;來自腦心肌炎病毒的內(nèi)部核糖體進入位點 (IRES);修飾的胞嘧啶脫氨酶編碼序列;多嘌呤段;和U3-R-U5 MLV長末端重復。本公開提供治療患有細胞增殖性病癥的受試者的方法,包括使受試者與具有胞嘧啶脫氨酶活性的本公開多肽的多核苷酸在多核苷酸表達的條件下接觸,和使受試者與 5-氟胞嘧啶接觸。
本公開還提供治療受試者中細胞增殖性病癥的方法,包括使受試者與本公開的反轉(zhuǎn)錄病毒接觸,其中異源核酸序列編碼抑制贅生性細胞增殖的治療蛋白質(zhì)。在一個實施方案中,反轉(zhuǎn)錄病毒包含編碼具有SEQ ID NO :4、12、14、16或18所示序列的多肽的多核苷酸。本公開的一個或更多個實施方案的細節(jié)在附圖
和下面的說明書中描述。根據(jù)說明書和附圖以及根據(jù)權(quán)利要求書,其它特征、目的和優(yōu)點將是顯而易見的。附圖簡述圖IA-D顯示(a)本公開重組反轉(zhuǎn)錄病毒載體的示意圖;(b)本公開多核苷酸的質(zhì)粒圖譜;(c和d)本公開的多核苷酸的序列(SEQ ID NO 19)。圖2A-D顯示包含具有⑶、OPRT和UPRT活性的多肽的本公開各個實施方案產(chǎn)生的方案。圖3顯示觀察到與感染的U-87細胞內(nèi)野生型y⑶蛋白相比y⑶2蛋白水平更高。圖4顯示包含本公開⑶多肽的載體的穩(wěn)定性和與本公開的其它載體的比較。圖5A-B顯示,當感染的細胞暴露于增加水平的5-FC時,與野生型y⑶活性 (T5. 0007)相比,本公開的胞嘧啶脫氨酶活性和載體提供相當?shù)幕蚋玫谋磉_,并且因此殺死感染的大鼠RG2 (5A)或U87細胞(5B)。圖6顯示感染的U87細胞內(nèi)T5. 0002 (yCD2)的比活性高于T5. 0001 (部分優(yōu)化的 yCD),T5. 0001 高于 T5. 0007 (野生型 yCD)。不同圖中相同參考符號表示著相同的元素。詳細描述如本文和后附權(quán)利要求書中所使用,單數(shù)形式“一 (a) ”、“一 (an) ”和“該(the) ” 包括復數(shù)指示物,除非上下文另外明確指出。因此,例如,當提到“一細胞(a cell)”時包括多數(shù)的此類細胞并且當提到“該試劑(the agent)”時包括提到本領(lǐng)域技術(shù)人員已知的一種或多種試劑,等等。同樣,“或”的使用意思是指“和/或”,除非另外說明。類似地,“包含/包括 (comprise,comprises,comprising),,、“包括(includes,including),,可互換并且不旨在是限制性的。還應當進一步理解,當使用術(shù)語“包含/包括”描述各種實施方案時,本領(lǐng)域技術(shù)人員將理解在一些特別情況下實施方案可選地使用語言“基本上由……組成”或“由……組成”描述。除非另外定義,本文所使用的所有技術(shù)和科學術(shù)語具有與本公開所屬領(lǐng)域普通技術(shù)人員通常理解相同的含義。雖然與本文所述的那些方法和材料相似或等同的方法和材料可以用于實施所公開的方法和組合物,但是本文描述示例性的方法、裝置和材料。上面以及本文通篇所討論的出版物被提供,原因僅僅在于它們的公開先于本申請的提交日。但無論如何不能解釋為承認發(fā)明人因在先公開而無權(quán)占先于此類公開。胞嘧啶脫氨酶(EC 3. 5. 4. 1)是催化下列化學反應的酶胞嘧啶+H2O —尿嘧啶+NH3因此,該酶的兩個底物是胞嘧啶和H2O,而其兩個產(chǎn)物是尿嘧啶和NH3。該酶屬于水解酶家族,這些酶作用于肽鍵之外的碳-氮鍵,特別是環(huán)脒中的碳-氮鍵。該酶類的系統(tǒng)名稱是胞嘧啶氨基水解酶。該酶也叫作異胞嘧啶脫氨酶。該酶參與嘧啶代謝。
更加具體而言,胞嘧啶脫氨酶是參與嘧啶代謝途徑的酶,通過該酶外源胞嘧啶經(jīng)水解脫氨基作用轉(zhuǎn)化成尿嘧啶。了胞嘧啶脫氨酶(CD酶或CD)活性已經(jīng)展示于原核生物和低等真核生物中,但是它們在哺乳動物中缺乏(Koechlin等,1966,Biochem. Pharmacol. 15,435-446 ;Polak 等,1976,Chemotherapy 22,137-153)。分別編碼釀酒酵母和大腸桿菌兩種生物CD酶的釀酒酵母(Saccharomyces cerevisiae, S. cerevisiae) FCYl基因和大腸桿菌(E. colDcoda基因是已知的并且它們的序列已經(jīng)公布(EP 402 108 ; Erbs 等,1997,Curr. Genet. 31,1-6 ;W0 93/01281)。CD 酶也將胞嘧啶類似物 5-氟胞嘧啶(5-FC)脫氨成為5-氟尿嘧啶(5-FU),其是高度細胞毒性的化合物,特別是當其被轉(zhuǎn)變成5-氟-UMP(5-FUMP)時。因為編碼該酶的基因的鈍化突變或者因為該酶天然缺乏 (例如哺乳動物細胞)而缺乏CD酶活性的細胞對5-FC有抗性(Jund和Lacroute, 1970, J. Bacteriol. 102,607-615 ;Kilstrup 等,1989,J. Bacteriol.,171,2124-2127)。另一方面,已經(jīng)證明可以將5-FC敏感性傳遞給已經(jīng)轉(zhuǎn)移入編碼⑶酶活性的序列的哺乳動物細胞 (Huber 等,1993,Cancer Res. 53,4619-4626 ;Mullen 等,1992,Proc. Natl. Acad. Sci. USA 89,33-37 ;WO 93/0U81)。因此,⑶的使用在基因治療、特別是抗癌基因治療情況下是有利的。然而,5-FC敏感性取決于細胞系而極大不同。在例如以表達大腸桿菌coda基因的反轉(zhuǎn)錄病毒轉(zhuǎn)導的PANC-I (胰腺的癌)和SK-BR-3 (乳腺癌)人腫瘤細胞系中觀察到低敏感性(Harris等,1994,Gene Therapy 1,170-175)。該現(xiàn)象被解釋為由CD酶的酶作用所形成的5-FU向細胞毒性5-FUMP的內(nèi)源轉(zhuǎn)變?nèi)狈虿睢T诓溉閯游锛毎姓S扇榍逅崃姿岷颂腔D(zhuǎn)移酶(0PRT酶)實現(xiàn)的這一步驟可能在某些腫瘤中缺乏并且因此使得基于 CD酶的基因治療無效。在原核生物和低等真核生物中,通過尿嘧啶磷酸核糖基轉(zhuǎn)移酶的作用(UPRT酶活性)尿嘧啶被轉(zhuǎn)變成UMP0該酶也將5-FU轉(zhuǎn)變成5-FUMP。重要的是,細菌尿嘧啶磷酸核糖基轉(zhuǎn)移酶(UPRT)與哺乳動物細胞的乳清酸磷酸核糖基轉(zhuǎn)移酶(OPRT)或尿苷-5'- 一磷酸合酶功能等效。這些酶介導5-氟尿嘧啶(5-FU)(尿嘧啶的氟化類似物) 向5-氟尿苷5' —磷酸(5-FUMP)的轉(zhuǎn)變。5-氟尿苷5' —磷酸之后通過哺乳動物嘧啶從頭合成途徑被轉(zhuǎn)變成5-FdUDP和FdUTP。每一 5-FdUTP是胸苷酸合酶(Thy-A)的不可逆抑制劑并且導致dTTP饑餓。廣泛公認的是,這種轉(zhuǎn)變是實現(xiàn)5-氟尿嘧啶的細胞毒性作用必需途徑之一并且細菌來源的細菌尿嘧啶磷酸核糖基轉(zhuǎn)移酶能夠向哺乳動物乳清酸磷酸核糖轉(zhuǎn)移酶一樣將5-氟尿嘧啶轉(zhuǎn)變成相同的活性代謝物。在UPRT酶活性或OPRT酶活性缺乏情況下,源于5-FC被CD酶的脫氨作用產(chǎn)生的5-FU不被轉(zhuǎn)變成細胞毒性的5-FUMP(Jimd 和 Lacroute,1970, J.Bacteriol. 102,607-615)。如本文所述,本公開提供編碼多肽的多核苷酸和包含具有胞嘧啶脫氨酶活性的第一多肽與包含UPRT或OPRT活性的第二多肽融合的多肽。此種融合構(gòu)建體可用于將尿嘧啶或其衍生物轉(zhuǎn)變成一磷酸類似物,并且具體而言將5-FU轉(zhuǎn)變成5-FUMP。如將在下面更加詳細地描述,本公開至少部分地基于催化5-FC轉(zhuǎn)變成5-FU的新的多肽的產(chǎn)生和表達。在一個實施方案中,提供了已經(jīng)被工程改造而具有將5-FC轉(zhuǎn)變成5-FU的改良催化特性的新多肽。此種多肽包括已經(jīng)被改變成在指定殘基處包括氨基酸取代的變體。雖然這些變體將在下面更加詳細地描述,但是應當理解,本公開的多肽可包含一個或更多個修飾的氨基酸。修飾的氨基酸的存在將在例如(a)增加多肽體內(nèi)半壽期,(b)降低或增加多肽抗原性,和(C)增加多肽保存穩(wěn)定性中是有利的。一個或多個氨基酸通過例如重組產(chǎn)生過程中的共翻譯或者翻譯后修飾(例如在哺乳動物細胞中在表達過程中N-X-S/T基序處的N-連接糖基化)或者通過合成手段修飾。因此,“突變體”、“變體” 或者“修飾的”蛋白質(zhì)、酶、多核苷酸、基因或者細胞意思是指已經(jīng)被改變或衍生,或者以一定方式與親本蛋白質(zhì)、酶、多核苷酸、基因或者細胞不同或者改變的蛋白質(zhì)、酶、多核苷酸、 基因或細胞。突變體或修飾的蛋白質(zhì)或酶通常,雖然不是必須,從突變體多核苷酸或基因表達?!巴蛔儭币馑际侵府a(chǎn)生突變體蛋白質(zhì)、酶、多核苷酸、基因或細胞的任何過程或者機制。這包括其中蛋白質(zhì)、酶、多核苷酸或基因序列被改變的任何突變,和源于此突變的在細胞中的任何可檢測的改變。有代表性地,突變以單個或多個核苷酸殘基的點突變、缺失或插入出現(xiàn)在多核苷酸或者基因序列中。突變包括基因的蛋白質(zhì)編碼區(qū)內(nèi)出現(xiàn)的多核苷酸改變以及蛋白質(zhì)編碼區(qū)序列外的區(qū)域(例如但不限于調(diào)節(jié)序列或啟動子序列)的改變。基因中的突變可以是“沉默的”,即不反映在表達時的氨基酸改變,產(chǎn)生基因的“序列保守”變體。這通常在一個氨基酸對應于一個以上密碼子時發(fā)生。修飾的氨基酸的非限定性實例包括糖基化氨基酸、硫酸化氨基酸、異戊二烯化 (例如法呢基化、櫳牛兒基櫳牛兒基化)氨基酸、乙?;被?、酰化氨基酸、聚乙二醇化氨基酸、生物素化氨基酸、羧化氨基酸、磷酸化氨基酸,等等。足以指導技術(shù)人員修飾氨基酸的參考文獻在文獻中到處都是。實例方案存在于Walker (1998) ftOtein Protocols on CD-ROM (Humana Press, Towata, N. J.)中。本文描述了用于產(chǎn)生、分離和使用本公開的修飾的CD多肽和多核苷酸的重組方法。除了重組生產(chǎn)外,多肽可以通過使用固相技術(shù)的直接肽合成(例如,Stewart等(1969) Solid-Phase Peptide Synthesis(WH Freeman Co,San Francisco);禾口Merrifield(1963) J. Am. Chem.SoC. 85 :2149-2154)產(chǎn)生。肽合成可以使用手工技術(shù)開展或者自動開展。自動合成可以使用例如 Applied Biosystems 431 肽合成儀(Perkin Elmer, Foster City, Calif.)按照制造商提供的說明書實現(xiàn)。通過例證方式,編碼大腸桿菌(Anderson等,1992,Eur. J. Biochem 204,51-56)、 乳酸鏈球菌(Lactococcus lactis) (Martinussen 禾口 Hammer, 1994, J. Bacteriol. 176, 6457-6463)、牛分枝桿菌(Mycobacterium bovis) (Kim 等,1997,Biochem Mol. Biol. Int 41,1117-1124)和枯草芽孢桿菌(Bacillus subtilis) (Martinussen 等,1995, J. Bacteriol. 177,271-274) UPRT酶的核酸序列可以在本公開背景中使用。然而,使用酵母 UPRT酶,并且特別是由釀酒酵母FURl基因編碼的UPRT酶,其序列公開于Kern等(1990, Gene 88,149-157)中,通過引用整合入本文。通過明示方式,基因的序列和相應UPRT酶的那些序列可以在文獻中和專門的數(shù)據(jù)庫(SWISSPR0T,EMBL,Genbank Medline,等)中找到。在本文中互換使用的術(shù)語“蛋白質(zhì)”或“多肽”包含稱作氨基酸的化學結(jié)構(gòu)塊通過稱作肽鍵的化學鍵連接在一起的一個鏈或更多個鏈?!懊浮币馑际侵赣绕涫腔蚨嗷蛏俅呋虼龠M一種或更多種化學或生物化學反應的任何物質(zhì),優(yōu)選全部或大部分由蛋白質(zhì)組成。術(shù)語“酶”還可指催化多核苷酸(例如RNA或DNA)?!疤烊弧被颉耙吧汀钡鞍踪|(zhì)、酶、多核苷酸、基因或細胞意思是指天然存在的蛋白質(zhì)、酶、多核苷酸、基因或細胞。因此,在幾個實施方案中,提供分離的或重組的多肽,其包含具有選自A23L、
11V108I、I140L及其任何組合的突變的SEQ ID NO :2。在又一實施方案中,多肽包含SEQ ID NO 4中所示序列并且包括除殘基(a) 23、108和140外可達50、25、10或5個保守氨基酸替代。通常,本文提供的多肽表現(xiàn)出用于將5-FC轉(zhuǎn)變成5-FU的胞嘧啶脫氨酶活性。本公開還提供包含與SEQ ID NO :4至少80%、90%、95%、98%或99%相同的序列的多肽,其中多肽在第^位具有亮氨酸,在第108位具有異亮氨酸并且在第140位具有亮氨酸,并且其中多肽具有胞嘧啶脫氨酶活性。在又一實施方案中,多肽包含SEQ ID N0:4中所示序列。本公開還提供包含可操作連接至尿嘧啶磷酸核糖轉(zhuǎn)移酶(UPRT)或乳清酸磷酸核糖轉(zhuǎn)移酶(OPRT)的任何一個前述多肽的融合構(gòu)建體。在一個實施方案中,融合構(gòu)建體包含連接至具有UPRT或OPRT活性的第二多肽的第一多肽,所述第一多肽包含具有選自A23L、 V108I、I140L及其任何組合的突變的SEQ ID NO :2。在又一實施方案中,融合構(gòu)建體包含具有SEQ ID NO :4中所示序列并且包括除殘基23、108和140之外可達50、25、10或5個保守氨基酸替代的第一多肽,其中第一多肽連接至具有UPRT或OPRT活性的第二多肽。本公開還提供融合構(gòu)建體,其包含具有胞嘧啶脫氨酶活性并包含與SEQ ID而彳至少日。1^、^1^、 95%、98%或99%相同的序列的第一多肽,其中多肽在第23位具有亮氨酸,在第108位具有異亮氨酸并且在第140位具有亮氨酸,并且其中第一多肽連接至包含UPRT或OPRT活性的第二多肽。在一個實施方案中,具有UPRT或OPRT活性的多肽分別包含SEQ ID NO 8和 10所示序列或其變體。在又一實施方案中,包含胞嘧啶脫氨酶活性的第一多肽連接至具有 UPRT或OPRT活性的多肽,其中多肽通過肽連接體分開。在另一實施方案中,融合構(gòu)建體包含選自SEQ ID NO 11,12或13的序列。術(shù)語“可操作連接”或“可操作結(jié)合”指調(diào)節(jié)序列與調(diào)節(jié)序列所調(diào)節(jié)多核苷酸之間或者兩個不同的多肽或編碼此種多肽的多核苷酸之間的功能性連接或者結(jié)合。包含具有⑶活性多肽和包含UPRT或OPRT活性多肽的融合構(gòu)建體可以被工程改造成包含切割位點以幫助蛋白質(zhì)回收或者其他連接體部分。有代表性地,連接體將是肽連接體部分。連接體部分的長度被選擇來優(yōu)化⑶多肽和UPRT或OPRT多肽的生物學活性,并且可以無需過度實驗而經(jīng)驗性確定。連接體部分應該足夠長且足夠靈活以便底物與⑶多肽相互作用以及底物與UPRT或OPRT多肽相互作用。連接體部分是長度上大約1個和30個氨基酸殘基之間,有代表性的大約2個和15個氨基酸殘基之間的肽。連接體部分的實例是一Gly—Gly—、GGGGS(SEQ ID NO :22)、(GGGGS)n(SEQ ID NO :23)、 (SGGGG)n (SEQ ID NO :24)、GKSSGSGSESKS (SEQ ID NO 25), GSTSGSGKSSEGKG (SEQ ID NO: 26)、GSTSGSGKSSEGSGSTKG(SEQ ID NO :27)、GSTSGSGKPGSGEGSTKG(SEQ ID NO :28)或 EGKSSGSGSESKEF(SEQ ID NO :29)。連接部分描述于例如 Huston 等,Proc. Nat' 1 Acad. Sci 85 :5879,1988 ;Whitlow 等,Protein Engineering 6 :989,1993 ;和 Newton 等, Biochemistry 35 =545,1996中。其他適宜的肽連接體是描述于美國專利號4,751,180和 4,935,233中的那些,該兩篇文獻通過引用并入本文。編碼期望肽連接體的DNA序列可以使用任何適宜的常規(guī)技術(shù)以與編碼CD多肽和后隨UPRT或OPRT多肽的多核苷酸相同的讀碼框插入在編碼⑶多肽和后隨UPRT或OPRT多肽的多核苷酸之間。例如,編碼連接體的化學合成的寡核苷酸可以連接在兩個編碼多核苷酸之間。在特別的實施方案中,包含2至4個分開結(jié)構(gòu)域(例如CD結(jié)構(gòu)域和UPRT或0PRT)的融合多肽由肽連接體分開。
特定序列的“保守氨基酸取代”或簡單地說“保守變異”指一個氨基酸或系列氨基酸被基本相同的氨基酸序列置換。技術(shù)人員將認識到,改變、添加或缺失編碼序列中單個氨基酸或一定百分比的氨基酸的各個取代、缺失或添加導致在其中改變導致氨基酸缺失、氨基酸添加或以化學相似氨基酸進行氨基酸取代的“保守變體”。提供功能相似的氨基酸的保守取代表在本領(lǐng)域眾所周知。例如,一個保守取代組包括丙氨酸(A)、絲氨酸( 和蘇氨酸(T)。另一保守取代組包括天冬氨酸(D)和谷氨酸 (E)。另一保守取代組包括天冬酰胺(N)和谷氨酰胺⑴)。又一保守取代組包括精氨酸(R) 和賴氨酸(K)。另一保守取代組包括異亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)和纈氨酸(V)。 另一保守取代組包括苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W)。因此,所列多肽序列(例如SEQ ID NO :2、4、6、8、10、11、12、13等)的“保守氨基酸取代”包括以同一保守取代組的保守選擇氨基酸對多肽序列氨基酸的一定百分比進行取代,有代表性地小于10%。因此,本公開多肽的保守取代變異可包含以同一保守取代組的保守取代變異進行的100、75、50、25或10個取代。酶的“活性”是其催化反應的能力(即“功能”)的量度,并且可以表示為產(chǎn)生反應產(chǎn)物的速率。例如,酶活性可以表示為每單位時間或每單位酶產(chǎn)生的產(chǎn)物的量(例如濃度或重量)或者以親和性或解離常數(shù)表示。如在本文可互換使用,“胞嘧啶脫氨酶活性”、“胞嘧啶脫氨酶生物學活性”或“胞嘧啶脫氨酶功能活性”指根據(jù)標準技術(shù)體內(nèi)或體外測定的、由本公開的胞嘧啶脫氨酶蛋白或多肽對胞嘧啶脫氨酶底物所發(fā)揮的活性。用于測量胞嘧啶脫氨酶活性的測定法在本領(lǐng)域已知。例如,胞嘧啶脫氨酶活性可以通過測定5-FC轉(zhuǎn)變成5-FU 或胞嘧啶轉(zhuǎn)變成尿嘧啶的速率來測量。5-FC、5-FU、胞嘧啶和尿嘧啶的檢測可以通過層析和本領(lǐng)域已知的其它方法開展。本領(lǐng)域技術(shù)人員將理解,所公開的核酸構(gòu)建體的許多保守變異產(chǎn)生功能相同的構(gòu)建體。例如,如上所述,由于遺傳密碼子的簡并性,“沉默取代”(即核酸序列中的不導致所編碼多肽改變的取代)是編碼氨基酸的每一核酸序列的隱含特征。本領(lǐng)域技術(shù)人員將理解, 由于遺傳密碼子的簡并性,可以產(chǎn)生許多編碼修飾的本公開胞嘧啶脫氨酶多肽的核苷酸序列,它們當中一些與本文所明確公開核酸序列具有相當大的同一性。例如,密碼子AGA、AGG、 CGA、CGC、CGG和CGU均編碼精氨酸。因此,在本公開核酸中密碼子指定為精氨酸的每一位置中,密碼子可以改變成上述的相應密碼子而不改變所編碼的多肽。應當理解,RNA序列中的U對應于DNA序列中的T。相似的,在氨基酸序列中一個或少數(shù)幾個氨基酸的“保守氨基酸取代”是以具有高度相似特性的不同氨基酸的取代,并且由于與所公開構(gòu)建體高度相似也容易鑒定。每一所公開序列的此類保守變異是本文所提供多肽的一特征。“保守變體”是這樣的蛋白質(zhì)或酶,其中給定氨基酸殘基已經(jīng)被改變而沒有改變蛋白質(zhì)或酶的總體構(gòu)象和功能,包括但不限于以具有相似特性(包括極性或非極性特征、 大小、形狀和電荷)的氨基酸進行的氨基酸取代。在蛋白質(zhì)或酶中除了所指出為保守的那些氨基酸之外的氨基酸可不同,使得任何兩個相似功能的蛋白質(zhì)之間的蛋白質(zhì)或氨基酸序列相似性百分數(shù)可變化并且可以是例如至少30%、至少50%、至少70%、至少80%或至少90%,如根據(jù)比對方案所測定。如本文中所提到,“序列相似性”意思是指核苷酸或蛋白質(zhì)序列相關(guān)的程度。兩個序列之間的相似性程度可以基于序列同一性和/或保守百分數(shù)。本文中的“序列同一性”意思是指兩個核苷酸或氨基酸序列不變化的程度?!靶蛄斜葘Α币馑际侵笧榱嗽u價相似性程度將兩個或更多個序列排隊以達到最大同一性(并且對于氨基酸序列而言為保守性)水平的過程。用于比對序列和評價相似性/同一性的許多方法在本領(lǐng)域中是已知的,例如其中相似性基于MEGALIGN算法的Cluster方法以及BLASTN、 BLASTP 和 FASTA (Lipman 和 Pearson, 1985 ;Pearson 和 Lipman,1988)。當使用所有的這些程序時,優(yōu)選的設(shè)置是導致最高序列相似性的那些設(shè)置。例如,對于特定的所比對氨基酸序列對,“同一性”或“同一性百分數(shù)”可以指通過ClustalW分析(W 1. 8版,可從European Bioinformatics Institute, Cambridge, UK得到)得到的氨基酸序列同一性百分數(shù),所述分析為計算比對中相同匹配的數(shù)量并將此相同匹配的數(shù)量除以(i)所比對序列的長度和 ( )96的較大者,并且使用下列默認ClustalW參數(shù)以實現(xiàn)慢/精確配對比對-缺口罰分 10 ;缺口延長罰分0. 10 ;蛋白質(zhì)加權(quán)矩陣=Gonnet series ;DNA加權(quán)矩陣=IUB ;切換慢/快配對比對=SLOW 或 FULL Alignment。當兩個序列使用所確定的氨基酸取代矩陣(例如BL0SUM62)、缺口存在罰分和缺口延長罰分以便得到對于該序列對的可能的最高分數(shù)進行相似性得分比對時,該兩個序列是“最佳比對的”。氨基酸取代矩陣及它們在定量兩個序列之間相似性中的使用是本領(lǐng)域眾所周知的并且描述于例如Dayhoff等(1978),“ Atlas of Protein Sequence and Structure,“第 5 卷,增刊 3 (編者 Μ. 0. Dayhoff)第 345-352 頁的〃 A model of evolutionary change in proteins " , Natl. Biomed. Res. Found. , Washington, D. C.禾口 Henikoff 等(1992) Proc. Nat ‘ 1. Acad. Sci. USA 89 :10915-10919 中。BL0SUM62 矩陣(圖 10)常常用作序列比對方案例如Gapped BLAST 2. O中的默認得分取代矩陣。對于向所比對序列之一引入單個氨基酸缺口賦予缺口存在罰分,并且對于插入在已經(jīng)開放的缺口中的每一額外的空氨基酸位置賦予缺口延長罰分。比對由每一序列中比對開始和結(jié)束的氨基酸位置限定,并且任選地,由在一個或兩個序列中插入缺口或多個缺口以得到最高可能得分限定。雖然最佳比對和得分可以人工實現(xiàn),但是通過使用計算機執(zhí)行的比對算法,如描述于 Altschul 等(1997) Nucl. Acids Res. 25 :3389-3402 并且可在 National Center for Biotechnology Information (NCBI)網(wǎng)址(www.ncbi.nlm.nih.gov)公開獲得的 gapped BLAST 2. O容易地開展。最佳比對,包括多重比對,可以使用例如通過NCBl網(wǎng)站可獲得并且描述于 Altschul 等(1997) Nucl. Acids Res. 25 :3389-3402 中的 PSI-BLAST 進行。對于與參照序列最佳比對的氨基酸序列,氨基酸殘基“對應于”參照序列中在比對中殘基與其配對的位置?!拔恢谩庇蓴?shù)字表示,該數(shù)字基于參照序列中每一氨基酸相對于 N-末端的位置順序確定每一氨基酸。由于當確定最佳比對時必須考慮的缺失、插入、截斷、 融合等原因,如通過簡單地從N-末端開始計數(shù)所確定,通常測試序列中氨基酸殘基數(shù)字將不必要與參照序列中的其對應位置的數(shù)字相同。例如,在所比對測試序列中存在缺失的情況下,在發(fā)生缺失位點處將沒有氨基酸對應于參照序列中的位置。在所比對參照序列中存在插入的情況下,該插入將不對應于參照序列中的任何氨基酸位置。在截斷或融合的情況下,在參照序列或者比對序列中存在不對應相應序列中任何氨基酸的氨基酸序列段。特定多肽的非保守修飾是未表征為保守取代的任何氨基酸取代的那些修飾。例如,跨上述6個組邊界的任何取代。這包括堿性或酸性氨基酸取代中性氨基酸(例如Asp、 Glu、Asn或Gln取代Val、lie、Leu或Met)、芳香族氨基酸取代堿性或酸性氨基酸(例如Phe, Tyr或Trp取代Asp、Asn, Glu或Gln)或者不以相似氨基酸置換氨基酸的任何其它取代。堿性側(cè)鏈包括賴氨酸(K)、精氨酸(R)、組氨酸(H);酸性側(cè)鏈包括天冬氨酸(D)、谷氨酸(E);不帶電荷的極性側(cè)鏈包括甘氨酸(G)、天冬酰胺(N)、谷氨酰胺⑴)、絲氨酸(S)、蘇氨酸(T)、酪氨酸(Y)、半胱氨酸(C);非極性側(cè)鏈包括丙氨酸(A)、纈氨酸(V)、亮氨酸(L)、 異亮氨酸(I)、脯氨酸(P)、苯丙氨酸(F)、甲硫氨酸(M)、色氨酸(W) ;β分支側(cè)鏈包括蘇氨酸(T)、纈氨酸(V)、異亮氨酸(I);芳香族側(cè)鏈包括酪氨酸(Y)、苯丙氨酸(F)、色氨酸(W)、 組氨酸(H)。因此,在多肽中特定位置上的一些氨基酸殘基被從保守氨基酸取代“排除”。例如, 本公開提供包含SEQ ID NO :4所示序列的多肽。在一些實施方案中,多肽可以以如上所述保守氨基酸取代來改變,然而,期望某些殘基不被取代,例如位置23、108和140上的殘基?!坝H本”蛋白質(zhì)、酶、多核苷酸、基因或細胞是使用任何方法、工具或技術(shù)從其衍生或制造任何其它蛋白質(zhì)、酶、多核苷酸、基因或細胞的任何蛋白質(zhì)、酶、多核苷酸、基因或細胞,并且不管親本自身是天然的還是突變體。親本多核苷酸或基因標碼親本蛋白質(zhì)或酶。當多核苷酸、多肽或其它成分部分或者完全地與其所天然伴隨的成分(其它蛋白質(zhì)、核酸、細胞、合成試劑等)分開時,則多核苷酸、多肽或其它成分是“分離的”。當核酸或多肽是人工的或者工程化的或者衍生自人工的或者工程化的蛋白質(zhì)或核酸時,則核酸或多肽是“重組體”。例如,插入至載體或者任何其它異源位置(例如重組生物的基因組中)使得其與天然發(fā)現(xiàn)在正常情況下位于多核苷酸側(cè)翼的核苷酸序列不再相關(guān)的多核苷酸是重組多核苷酸。從重組多核苷酸體外或體內(nèi)表達的蛋白質(zhì)是重組多肽的實例。同樣,天然不存在的多核苷酸序列(例如天然存在基因的變體)是重組體。在其它實施方案中,提供編碼本公開胞嘧啶脫氨酶多肽或融合構(gòu)建體的分離的多核苷酸。在一個方面中,本公開提供分離的或重組的多核苷酸,在本文中稱作“CD優(yōu)化的多核苷酸”、“CD多核苷酸”或“CD-融合多核苷酸”。術(shù)語“多核苷酸”、“核苷酸序列”和“核酸分子”用于指核苷酸(A、C、T、U、G等或者天然存在或人工的核苷酸類似物)的聚合物,例如 DNA或RNA,或者其表示法,例如字符串等,這取決于相關(guān)的語境。給定的多核苷酸或互補多核苷酸可以從任何指定的核苷酸序列確定。本公開的一個實施方案涉及編碼胞嘧啶脫氨酶或者突變體胞嘧啶脫氨酶多肽或其生物學活性部分的分離的多核苷酸。如本文所使用,術(shù)語“核酸分子”或者“多核苷酸”旨在包括DNA分子(例如cDNA或基因組DNA)和RNA分子(例如mRNA)和使用核苷酸類似物產(chǎn)生的DNA和RNA的類似物。核酸分子可以是單鏈的或者雙鏈的。在一個實施方案中,CD優(yōu)化的多核苷酸或CD多核苷酸包括從生物體如細菌或酵母菌株分離的天然存在核酸的重組、工程化或分離形式。示例性的CD多核苷酸包括編碼 SEQ ID NO :2中所示野生型多肽的那些。在本公開的另一實施方案中,⑶多核苷酸通過將一個或更多個天然存在的、分離的或者重組的CD多核苷酸多樣化(例如重組和/或突變) 而產(chǎn)生。如在本文別處更加詳細地描述,可以產(chǎn)生這樣的多樣化CD多核苷酸,其編碼具有優(yōu)良功能特性(例如與用作多樣化過程中本源或親本的CD多核苷酸所編碼多肽相比提高的催化功能、提高的穩(wěn)定性或者更高表達水平)的CD多肽。示例性的多核苷酸包括SEQ ID NO 3和5和編碼本公開⑶變體多肽的那些。本公開的多核苷酸在例如本公開⑶多肽的重組產(chǎn)生(即表達)中具有多種多樣
15的用途,并且用作進一步多樣化產(chǎn)生(例如重組反應或突變反應)以便產(chǎn)生新的和/或改良的CD同系物的本源物等等。重要的是注意到,CD多核苷酸的某些特定的、重要的和可信的用途不需要多核苷酸編碼具有相當大的CD活性或者甚至變體CD活性的多肽。例如,不編碼活性酶的CD多核苷酸可以是用于多樣化過程中以取得具有期望功能特性(例如高k。at或k。at/Km、低Km、對熱和其它環(huán)境因素的高穩(wěn)定性、高轉(zhuǎn)錄或翻譯速率、抵抗蛋白水解切割等)的CD多核苷酸變體或非CD多核苷酸的親本多核苷酸的寶貴來源。CD多核苷酸,包括編碼CD多肽和其變體、CD多肽片段、相關(guān)融合蛋白或其功能等效物的核苷酸序列,用于指導⑶多肽在適宜宿主細胞如細菌細胞中表達的重組DNA分子中。由于遺傳密碼子的固有簡并性,編碼基本相同或者功能等效氨基酸序列的其它核酸序列也可以用于克隆和表達⑶多核苷酸。術(shù)語“宿主細胞”,如本文所使用,包括易于以核酸構(gòu)建體轉(zhuǎn)化的任何細胞類型。術(shù)語“轉(zhuǎn)化”意思是指引入外源(即外面的或細胞外的)基因、DNA或RNA序列至宿主細胞中,使得宿主細胞將表達所引入的基因或序列以產(chǎn)生期望的物質(zhì),有代表性地是由所引入基因或序列編碼的蛋白質(zhì)或酶。所引入的基因或序列可包括調(diào)節(jié)或控制序列,例如起始序列、終止序列、啟動子序列、信號序列、分泌序列或細胞遺傳機器所使用的其它序列。接受并表達所引入DNA或RNA的宿主細胞已經(jīng)“被轉(zhuǎn)化”并且是“轉(zhuǎn)化體”或“克隆”。引入至宿主細胞的DNA或RNA可以來自任何來源,包括與宿主細胞相同屬或種的細胞,或者不同屬或種的細胞。如本領(lǐng)域技術(shù)人員將理解的那樣,修飾編碼序列以增強其在特定宿主中的表達可以是有利的。遺傳密碼子是冗余的,有64種可能的密碼子,但是大多數(shù)生物體優(yōu)先使用這些密碼子的亞組。在物種中最經(jīng)常使用的密碼子稱作最佳密碼子,并且不十分經(jīng)常使用的那些密碼子歸類為稀有或者低利用密碼子(見例如^iang等(1991)Gene 105:61-72)。密碼子可以被取代以表現(xiàn)宿主的優(yōu)先密碼子使用,這是一個有時被稱作“密碼子優(yōu)化”或者 “控制物種密碼子偏倚性”的過程??梢灾苽浒囟ㄔ嘶蛘婧怂拗鲀?yōu)選的密碼子的優(yōu)化的編碼序列(還可見 Murray等(1989) Nucl. Acids Res. 17 :477-508),以例如增加翻譯速度或者產(chǎn)生具有期望特征(例如與從非優(yōu)化序列產(chǎn)生的轉(zhuǎn)錄物相比更長的半壽期)的重組RNA轉(zhuǎn)錄物。還可以修飾翻譯終止密碼子以表現(xiàn)宿主偏倚性。例如,對于釀酒酵母(S. cerevisiae)和哺乳動物的優(yōu)選終止密碼子分別是UAA和UGA。對于單子葉植物的優(yōu)選終止密碼子是UGA,而昆蟲和大腸桿菌優(yōu)選使用UAA作為終止密碼子(Dalphin等(1996) Nucl. Acids Res. 24 :216-218)。密碼子使用偏倚性指蛋白質(zhì)編碼性DNA序列(基因)中密碼子存在頻率在生物體當中的差異。密碼子是編碼多肽鏈中特定氨基酸殘基的一系列三個核苷酸(三聯(lián)體)。由于在DNA中有四種核苷酸,即腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),所以具有 64種可能的三聯(lián)體來編碼20種氨基酸,和三個翻譯終止(無義)密碼子。由于該冗余性, 除了兩種氨基酸外的所有氨基酸由多于一個三聯(lián)體編碼。不同的生物體常常對編碼同一氨基酸的數(shù)個密碼子中的一個顯示出特定的偏好。這些偏好是如何出現(xiàn)的是分子進化的辯論激烈的領(lǐng)域。普遍接受的是,密碼子優(yōu)先性反映出對于翻譯優(yōu)化的突變偏倚性和自然選擇之間的平衡。在快速生長的微生物如大腸桿菌(Escherichia coli)或釀酒酵母(面包酵母)中的優(yōu)化密碼子反映出它們各自的基因組tRNA庫的組成。認為優(yōu)化密碼子幫助實現(xiàn)最快的翻譯速率和高準確性。由于這些因素的結(jié)果,預期翻譯選擇在高度表達的基因中更強,在上述生物體中的確如此。在不表現(xiàn)出高生長速度或者存在小基因組的其它生物中,通常缺乏密碼子使用優(yōu)化,并且密碼子優(yōu)先性通過在該特定基因組中所見的特征突變偏倚性確定。 該情況的實例是智人(Homo sapiens)(人)和幽門螺桿菌(Helicobacter pylori)。表現(xiàn)出中等水平密碼子使用優(yōu)化的生物包括黑腹果蠅(Drosophila melanogaster)(果蠅)、秀麗隱桿線蟲(Caenorhabditis elegans)(線蟲)或者擬南芥(Arabidopsis thaliana)(墻水芹)。術(shù)語“密碼子優(yōu)化的序列”通常指已經(jīng)通過將具有小于約20%使用頻率的任何密碼子替換掉而針對特定宿主物種優(yōu)化的核苷酸序列。除了密碼子優(yōu)化之外,通過消除假的多腺苷化序列、消除外顯子/內(nèi)含子剪接信號、消除轉(zhuǎn)座子樣重復和/或優(yōu)化GC含量,已經(jīng)對于在特定宿主物種中表達優(yōu)化的核苷酸序列在本文中稱作“表達增強序列”。表1 人密碼子選擇和密碼子優(yōu)先性。對于每一密碼子,該表顯示人編碼區(qū)每一密碼子的使用頻率(每一千)(第一列)和在同義密碼子當中每一密碼子的相對頻率(第二列)。
權(quán)利要求
1.分離的多核苷酸,包含編碼SEQ ID NO :4的多肽的人密碼子優(yōu)化的多核苷酸,其中所述多肽包含胞嘧啶脫氨酶(CD)活性。
2.權(quán)利要求1的分離的多核苷酸,其中所述多核苷酸包含SEQID NO :3所示序列并且包含1-50個沉默突變。
3.權(quán)利要求1或2的分離的多核苷酸,其中所述多核苷酸包含SEQID NO :3。
4.權(quán)利要求1的分離的多核苷酸,還包含編碼具有UPRT或OPRT活性的多肽的UPRT或 OPRT多核苷酸,所述具有UPRT或OPRT活性的多肽可操作連接至具有⑶活性的多肽。
5.權(quán)利要求4的分離的多核苷酸,其中UPRT或OPRT多核苷酸是密碼子優(yōu)化的。
6.權(quán)利要求4的分離的多核苷酸,其中UPRT或OPRT多核苷酸通過連接體與編碼具有 CD活性的多肽的多核苷酸分開。
7.分離的多核苷酸,包含編碼具有胞嘧啶脫氨酶活性的多肽的第一編碼序列;和編碼具有URPT或OPRT活性的多肽的第二編碼序列, 其中第一編碼序列可操作連接至第二編碼序列。
8.權(quán)利要求7的分離的多核苷酸,其中第一和第二編碼序列通過編碼肽連接體的序列分開。
9.權(quán)利要求7的分離的多核苷酸,其中所述多核苷酸編碼包含SEQID NO: 12、14或16 中所示序列的多肽。
10.基本上純的通過權(quán)利要求1、2、4或7的多核苷酸的表達產(chǎn)生的多肽。
11.包含權(quán)利要求1、2、4或7的多核苷酸的載體。
12.權(quán)利要求11的載體,其中所述載體是質(zhì)粒。
13.權(quán)利要求11的載體,其中所述載體是表達載體。
14.權(quán)利要求11的載體,其中所述載體包括病毒載體。
15.權(quán)利要求14的載體,其中所述病毒載體包括可復制型反轉(zhuǎn)錄病毒。
16.含有權(quán)利要求12、13、14或15的載體的宿主細胞。
17.包含權(quán)利要求1、4或7的多核苷酸的宿主細胞。
18.權(quán)利要求17的宿主細胞,其中所述宿主細胞包括人細胞。
19.權(quán)利要求18的宿主細胞,其中所述宿主細胞包括包含細胞增殖性病癥的細胞。
20.權(quán)利要求17的宿主細胞,其中所述宿主細胞包括穩(wěn)定轉(zhuǎn)化的人細胞。
21.權(quán)利要求20的宿主細胞,其中所述宿主細胞包含細胞增殖性病癥。
22.權(quán)利要求19或21的宿主細胞,其中所述宿主細胞包含多形性成膠質(zhì)細胞瘤。
23.權(quán)利要求17的宿主細胞,其中所述宿主細胞被體內(nèi)轉(zhuǎn)化。
24.重組的可復制型反轉(zhuǎn)錄病毒(RCR),包含 反轉(zhuǎn)錄病毒GAG蛋白;反轉(zhuǎn)錄病毒POL蛋白; 反轉(zhuǎn)錄病毒包膜;反轉(zhuǎn)錄病毒多核苷酸,包含反轉(zhuǎn)錄病毒多核苷酸序列3'端的長末端重復(LTR)序列、 反轉(zhuǎn)錄病毒多核苷酸5'端的啟動子序列、gag核酸結(jié)構(gòu)域、pol核酸結(jié)構(gòu)域和env核酸結(jié)構(gòu)域,所述啟動子適于在哺乳動物細胞中表達;盒,包含可操作連接至包含權(quán)利要求1的多核苷酸的異源核酸的內(nèi)部核糖體進入位點 (IRES),其中所述盒位于3' LTR的5'位置和編碼所述反轉(zhuǎn)錄病毒包膜的erw核酸結(jié)構(gòu)域的3'位置;和對于在靶細胞中反轉(zhuǎn)錄、包裝和整合必需的順式作用序列。
25.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中反轉(zhuǎn)錄病毒多核苷酸序列衍生自鼠白血病病毒 (MLV)、莫洛尼鼠白血病病毒(MoMLV)、貓科白血病病毒或長臂猿白血病病毒(GALV)。
26.權(quán)利要求M或25的反轉(zhuǎn)錄病毒,其中MLV是雙嗜性MLV。
27.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中所述反轉(zhuǎn)錄病毒是Y反轉(zhuǎn)錄病毒。
28.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中所述靶細胞是具有細胞增殖性病癥的細胞。
29.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中所述靶細胞是贅生性細胞。
30.權(quán)利要求觀的反轉(zhuǎn)錄病毒,其中所述細胞增殖性病癥選自肺癌、結(jié)腸-直腸癌、乳腺癌、前列腺癌、泌尿道癌、子宮癌、腦癌、頭頸癌、胰腺癌、黑素瘤、胃癌和卵巢癌、類風濕性關(guān)節(jié)炎或其它自身免疫病。
31.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中啟動子序列與生長調(diào)節(jié)基因關(guān)聯(lián)。
32.根據(jù)權(quán)利要求M的反轉(zhuǎn)錄病毒,其中啟動子序列包括組織特異性啟動子序列。
33.根據(jù)權(quán)利要求32的反轉(zhuǎn)錄病毒,其中組織特異性啟動子序列包含至少一個雄激素應答元件(ARE)。
34.根據(jù)權(quán)利要求33的反轉(zhuǎn)錄病毒,其中雄激素應答元件衍生自前列腺堿性蛋白啟動子。
35.根據(jù)權(quán)利要求32的反轉(zhuǎn)錄病毒,其中組織特異性啟動子序列包含前列腺堿性蛋白啟動子。
36.根據(jù)權(quán)利要求M的反轉(zhuǎn)錄病毒,其中啟動子包括具有SEQID NO :19,20或22的從核苷酸1至大約核苷酸582所示序列的CMV啟動子并且可包含對一個或更多個核酸堿基的修飾,所述啟動子能夠指導和起始轉(zhuǎn)錄。
37.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中啟動子包含SEQID NO 19或20的從核苷酸1至大約核苷酸582所示的序列。
38.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中啟動子包含CMV-R-U5結(jié)構(gòu)域多核苷酸。
39.權(quán)利要求38的反轉(zhuǎn)錄病毒,其中CMV-R-U5結(jié)構(gòu)域包含連接至MLVR-U5區(qū)的人巨細胞病毒立即早期啟動子。
40.權(quán)利要求39的反轉(zhuǎn)錄病毒,其中CMV-R-U5結(jié)構(gòu)域多核苷酸包含SEQID NO :19、20 或22的從大約核苷酸1至大約核苷酸1202所示的序列或與SEQ ID NO :19、20或22所示的序列至少95%相同的序列,其中多核苷酸促進與其可操作連接的核酸分子的轉(zhuǎn)錄。
41.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中多核苷酸的gag衍生自Y反轉(zhuǎn)錄病毒。
42.權(quán)利要求41的反轉(zhuǎn)錄病毒,其中g(shù)ag核酸結(jié)構(gòu)域包含SEQID NO 19從大約核苷酸編號1203至大約核苷酸觀19的序列或者與其具有至少95^^98^^99%或99. 8%同一性的序列。
43.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中多核苷酸的pol結(jié)構(gòu)域衍生自Y反轉(zhuǎn)錄病毒。
44.權(quán)利要求43的反轉(zhuǎn)錄病毒,其中pol結(jié)構(gòu)域包含SEQID NO 19從大約核苷酸編號觀20至大約核苷酸6358的序列或與其具有至少95%、98%、99%或99. 9%同一性的序列。
45.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中env結(jié)構(gòu)域包含SEQID NO :19從大約核苷酸編號6359至大約核苷酸8323的序列或與其具有至少95%、98%、99%或99. 8%同一性的序列。
46.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中IRES衍生自腦心肌炎病毒。
47.權(quán)利要求46的反轉(zhuǎn)錄病毒,其中IRES包含SEQID NO 19從大約核苷酸編號8327 至大約核苷酸8876的序列或與其具有至少95^^98%或99%同一性的序列。
48.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中異源核酸包含具有SEQID NO :3、5、11、13、15或 17所示序列的多核苷酸。
49.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中異源核酸編碼包含SEQID NO :4所示序列的多肽。
50.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中異源核酸是人密碼子優(yōu)化的并且編碼SEQID NO 4中所示的多肽。
51.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中異源核酸包含SEQID NO :19從大約核苷酸編號 8877至大約9353所示的序列。
52.權(quán)利要求51的反轉(zhuǎn)錄病毒,其中3’LTR衍生自、反轉(zhuǎn)錄病毒。
53.權(quán)利要求52的反轉(zhuǎn)錄病毒,其中3’LTR包含U3-R-U5結(jié)構(gòu)域。
54.權(quán)利要求52的反轉(zhuǎn)錄病毒,其中3,LTR包含SEQID NO 19從大約核苷酸9405至大約9998所示序列或者與其至少95%、98%或99. 5%相同的序列。
55.權(quán)利要求M的反轉(zhuǎn)錄病毒,其中反轉(zhuǎn)錄病毒多核苷酸包含SEQID N0:19、20或22 所示的序列。
56.分離的多核苷酸,從5’至3’包含來自人巨細胞病毒的立即早期啟動子與MLV R-U5區(qū)的CMV-R-U5融合物; PBS,反轉(zhuǎn)錄酶的引物結(jié)合位點; 5’剪接位點; Ψ包裝信號;MLV組特異性抗原的gag編碼序列; MLV聚合酶多蛋白的pol編碼序列; 3’剪接位點;MLV株4070A包膜蛋白的4070Aenv編碼序列; 來自腦心肌炎病毒的內(nèi)部核糖體進入位點(IRES); 修飾的胞嘧啶脫氨酶編碼序列; 多嘌呤段;和U3-R-U5 MLV長末端重復。
57.權(quán)利要求56的多核苷酸,其中反轉(zhuǎn)錄病毒多核苷酸包含SEQID N0:19、20或22所示的序列。
58.權(quán)利要求56的多核苷酸,其中反轉(zhuǎn)錄病毒多核苷酸序列衍生自鼠白血病病毒 (MLV)、莫洛尼鼠白血病病毒(MoMLV)、貓科白血病病毒或長臂猿白血病病毒(GALV)。
59.權(quán)利要求58的多核苷酸,其中MoMLV是雙嗜性MoMLV。
60.治療患有細胞增殖性病癥的受試者的方法,包括使受試者與權(quán)利要求1、7或56的多核苷酸在使得多核苷酸表達的情況下接觸和使受試者與5-氟胞嘧啶接觸。
61.權(quán)利要求60的方法,其中多核苷酸整合入受試者的細胞內(nèi)。
62.權(quán)利要求60的方法,其中多核苷酸通過反轉(zhuǎn)錄病毒載體遞送。
63.權(quán)利要求62的方法,其中反轉(zhuǎn)錄病毒載體包含SEQID NO 19、20或22所示的序列。
64.權(quán)利要求60的方法,其中細胞增殖性病癥是多形性成膠質(zhì)細胞瘤。
65.權(quán)利要求60的方法,其中細胞增殖性病癥選自肺癌、結(jié)腸-直腸癌、乳腺癌、前列腺癌、泌尿道癌、子宮癌、腦癌、頭頸癌、胰腺癌、黑素瘤、胃癌和卵巢癌、類風濕性關(guān)節(jié)炎或其它自身免疫病。
66.治療受試者中細胞增殖性病癥的方法,包括使受試者與權(quán)利要求M的反轉(zhuǎn)錄病毒接觸和使受試者與5-氟胞嘧啶接觸。
67.權(quán)利要求66的方法,其中異源核酸編碼包含SEQID NO :4、12、14、16或18所示序列的多肽。
68.權(quán)利要求66的方法,其中反轉(zhuǎn)錄病毒多核苷酸包含SEQID NO :19、20或22所示的序列。
全文摘要
本公開提供修飾的胞嘧啶脫氨酶(CD)。本公開還涉及表達或包含此類修飾CD的細胞和載體以及使用此類修飾CD治療疾病和病癥的方法。
文檔編號C12N15/867GK102227501SQ200980147509
公開日2011年10月26日 申請日期2009年9月26日 優(yōu)先權(quán)日2008年9月26日
發(fā)明者克里斯托弗·R·洛格, 哈利·E·格魯貝爾, 奧馬爾·佩雷斯, 道格拉斯·喬利 申請人:托卡根公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1