用于淺灰霉素和甲基淺灰霉素的生物合成的基因簇的制作方法
【專利摘要】本發(fā)明涉及牽涉淺灰霉素和甲基淺灰霉素生物合成的基因簇,以及所述基因簇包含的基因。本發(fā)明還涉及所述基因簇、所述基因簇所包含的基因以及它們所編碼的蛋白質(zhì)在產(chǎn)生抗生素試劑中的用途。
【專利說明】用于淺灰霉素和甲基淺灰霉素的生物合成的基因簇
[0001]本發(fā)明涉及抗生素領(lǐng)域,更具體而言,涉及牽涉(甲基)淺灰霉素的生物合成的基因和蛋白質(zhì)。本發(fā)明提供通過重組DNA技術(shù)產(chǎn)生(甲基)淺灰霉素的重組方法。
[0002]發(fā)明背景
[0003]淺灰霉素是一種由鏈霉菌屬(Streptomyces)微生物產(chǎn)生的、天然存在的抗生素,所述鏈霉菌屬是放線菌(Actinobacteria)中最大的一個屬,也是鏈霉菌科(Streptomycetaceae)的模式屬。鏈霉菌(Streptomycetes)是革蘭氏陽性的,具有高GC-含量的基因組。鏈霉菌以復(fù)雜的次生代謝為特征。它們產(chǎn)生在臨床上有用的天然來源的抗生素的超過三分之二。淺灰霉素是由Terlain和Thomas在1971年首次描述的抗生素。其是由10個氨基酸依照如下次序構(gòu)成,即:N-乙?;腖-N-甲基纈氨酸、L-反式-4-甲基脯氨酸、L-N-甲基蘇氨酸、L-亮氨酸、L-反式-4-甲基脯氨酸、L-亮氨酸、L-N-甲基纈氨酸、L-脯氨酸、D-N-甲基亮氨酸和甘氨酸。所述肽鏈在甘氨酸和L-N-甲基蘇氨酸之間通過酯鍵環(huán)化,形成由N-乙?;腖-N-甲基纈氨酸和L-反式-4-甲基脯氨酸所組成的非環(huán)化尾。
[0004]淺灰霉素屬于非核糖體合成的微生物肽組,所述肽組顯示顯著的結(jié)構(gòu)多樣性,并包含很多種極有效的抗生素和其他重要的藥物。盡管結(jié)構(gòu)多樣,但非核糖體合成的微生物肽具有共同的合成模式,即多酶硫模板(thiotemplate)機制。由此,肽鍵的形成發(fā)生在同時代表模板和生物合成機器(machinery)的大的多酶復(fù)合物上。這類多酶復(fù)合物被命名為非核糖體肽合成酶(NRPSs)。對編碼NRPS的基因進行測序揭示出其模塊化的組織形式。模塊(module)是負責(zé)將一個確定的單體并入生長中的多肽鏈的NRPS多肽鏈的一部分。因此,NRPS被同時用作模板(因 為待并入的氨基酸由所述模塊確定)和生物合成機器(因為所述模塊攜帶了所有必需的催化功能)。可以將模塊進一步分成幾個催化域。這些域至少催化底物活化,共價結(jié)合以及肽鍵形成步驟。功能等同的域分享許多高度保守的序列基序(motif)??梢詫λ鼈冞M行修飾以供多肽鏈內(nèi)的活性改變,這開啟了對NRPS機器進行操縱的前景。
[0005]在每個模塊內(nèi),特定底物(氨基酸)的選擇是由腺苷?;颍ˋ-域)介導(dǎo)的。這種A-域負責(zé)選擇構(gòu)成產(chǎn)物的氨基酸,由此控制產(chǎn)物的一級序列。A-域在消耗ATP的同時將氨基酸以及一些羧基底物活化為氨酰腺苷酸。這一反應(yīng)性中間物進一步被轉(zhuǎn)運到Ppan輔基(Ppan prosthetic group)的末端半胱胺巰基部分(moiety)上,所述Ppan輔基附接于位于同一模塊中的A-域下游的肽基載體蛋白(PCP)域,PCP域也被稱作巰基化(T)域。PCP域代表接受經(jīng)活化氨基酸的轉(zhuǎn)運單元,所述經(jīng)活化的氨基酸共價地束縛(tether)于它的4' PP輔因子硫酯。這一輔因子充當靈活的臂,以使結(jié)合的氨?;碗幕孜镌诓煌拇呋行闹g行進。由于A-域和T-域均需要活化并共價束縛用于隨后肽合成的第一構(gòu)件,所以這兩個域的組合定義為引發(fā)模塊。脂肽途徑的引發(fā)模塊攜帶附加的N-末端C-域,其用于使?;鶄?cè)鏈和第一氨基酸的氨基基團縮合。所述縮合或C-域是非核糖體肽合成的中心實體,這是因為其負責(zé)使相鄰模塊中結(jié)合于T-域的氨?;孜镏g形成肽鍵。所述酶催化結(jié)合于下游(就C-域而言)模塊的活化氨基酸的氨基(或亞氨基,羥基)親核攻擊到束縛于上游模塊的氨基酸或酰基基團上。然后,所得的肽基中間物順著用于隨后的縮合和進一步的修飾步驟的組裝線易位(translocate)。在合成過程中,生長中的肽鏈由一個模塊移交給下一個模塊直至其到達最后一個模塊的T-域。大多數(shù)情況下,此模塊包含對于產(chǎn)物的釋放而言重要的TE (硫酯酶)-域。產(chǎn)物的釋放通過兩步驟過程實現(xiàn),其涉及?;?O-TE-酶中間物,后者隨后被肽-內(nèi)部親核物質(zhì)或水所攻擊,分別產(chǎn)生大環(huán)產(chǎn)物或線性肽。
[0006]非核糖體肽的一個尤其顯著的特點是出現(xiàn)D-氨基酸。并入D-氨基酸的一種方式是使用D-氨基酸選擇性A-域。然而,更為常見的方式是通過使用E (差向異構(gòu)化)-域,其出現(xiàn)在負責(zé)并入D-氨基酸的模塊的C-末端。所述酶催化結(jié)合于生長中肽鏈的L-氨基酸的T-域的差向異構(gòu)化。通過下游縮合域供體位點的對映異構(gòu)選擇性對結(jié)合L-氨基酸的T-域的區(qū)分,得到干凈的D-構(gòu)型的產(chǎn)物。
[0007]一些NRPS包含甲基轉(zhuǎn)移酶(MT域),其負責(zé)氨基酸殘基的N-或C-甲基化,由此使得所述肽不易被蛋白水解分解。兩種類型的甲基轉(zhuǎn)移酶(N-或C-甲基轉(zhuǎn)移酶,或縮寫為N-MT或C-MT)均使用S-腺苷甲硫氨酸作為甲基供體。經(jīng)常發(fā)現(xiàn)所述MT域作為A-域的插入物(Finking et Marahiel, 2004 ;Marahiel, 2009)。甚至更加引人注目的是非天然氨基酸如甲基-脯氨酸的并入,所述非天然氨基酸通常是在它們應(yīng)用于組裝線之前生物合成的。或者,在經(jīng)NRPS組裝后酶促修飾并入的氨基酸。
[0008]淺灰霉素天然地通過鏈霉菌屬的微生物產(chǎn)生。然而,盡管現(xiàn)有技術(shù)中已知鏈霉菌產(chǎn)生淺灰霉素,但是負責(zé)淺灰霉素生物合成的遺傳位點目前尚未鑒定。因此,對淺灰霉素生物合成進行靶向和修飾仍然受到限制。所以,需要有關(guān)淺灰霉素生物合成的遺傳信息。
【發(fā)明內(nèi)容】
[0009]除了淺灰霉素之外,鏈霉菌還產(chǎn)生淺灰霉素的變體形式,稱作甲基淺灰霉素。甲基淺灰霉素包含L-反式-4-甲基脯氨酸代替L-脯氨酸。甲基淺灰霉素在其用作抗菌劑時相對于淺灰霉素具有一些優(yōu)勢,如不同的抗菌特異性,但是其由鏈霉菌類僅作為副組分(sidecomponent)產(chǎn)生。因此,需要有關(guān)甲基淺灰霉素生物合成的遺傳信息。
[0010]淺灰霉素和甲基淺灰霉素所包含的甲基脯氨酸部分,即L-反式-4-甲基脯氨酸的產(chǎn)生是完全未知的。因此,需要有關(guān)L-反式-4-甲基脯氨酸生物合成的遺傳信息。
[0011]現(xiàn)在,已鑒定了編碼牽涉(甲基)淺灰霉素生物合成途徑的多肽的遺傳座位。本發(fā)明的發(fā)明人由鏈霉菌DSM26643基因組DNA成功地分離并克隆出整個淺灰霉素生物合成基因簇。本發(fā)明的發(fā)明人也成功地闡明了編碼牽涉(甲基)淺灰霉素生物合成途徑的多肽(包括負責(zé)L-反式-4-甲基脯氨酸形成的多肽)的開放閱讀框(ORF)。這允許在分子水平確認并影響不同的生物合成步驟。
[0012]因此,在一個方面,本發(fā)明提供核酸,其包含選自下述的至少一種核酸:
[0013](a)核酸,其包含SEQ ID NO: I中所包含的、編碼SEQ ID No:2-27的蛋白質(zhì)的開放閱讀框(ORF) 1-26中的至少一個ORF或其變體或片段,由此所述變體或片段編碼SEQ IDNo:2-27的蛋白質(zhì)的功能活性變體或片段,
[0014](b)核酸,其編碼SEQ ID No:2-27的蛋白質(zhì)中的至少一種蛋白質(zhì)或其功能活性變體或片段,
[0015](C)核酸,其編碼氨基酸序列與(a)或(b)的核酸所編碼的蛋白質(zhì)或片段至少70%、80%、90%、95%或 97% 同一的蛋白質(zhì),[0016](d)核酸,其在嚴格條件下與(a)-(c)的核酸雜交,
[0017](e)核酸,其在嚴格條件下與(a)-(d)的核酸雜交,且有長10_50個核苷酸組成,或
[0018](f)核酸,其與(a)-(f)的核酸互補。
[0019]發(fā)明詳述
[0020]包含在本發(fā)明中的核酸,在一個實施方案中,是包含SEQ ID NO:1或由SEQ ID NO:1組成的核酸,SEQ ID NO:1作為鏈霉菌DSM26643基因組的一部分包含長66,868個核苷酸的淺灰霉素生物合成基因簇。這一新近發(fā)現(xiàn)的基因簇包含至少26個0RF,被命名為ORFl到 0RF26(0RF1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26)或分別用基因名 orf-1、orf-2、orf-3、orf-4、orf-5、orf-6、orf-7、nrps-1、int_l、tnp-1、int-2、tnp-2、tnp-3、dna、nrps-2、nrps-3、mbtH、mps-l、mps-2、mps-3、mps-4、orf-8、orf-9、orf-10、orf-1 U orf-12來命名,從SEQ ID NO:1的第837位核苷酸到第66108位核苷酸,長65272個核苷酸。這些ORF分別編碼牽涉(甲基)淺灰霉素生物合成的、SEQ IDNo:2-27(SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27)的蛋白質(zhì)。下面給出由淺灰霉素生物合成基因簇編碼的蛋白質(zhì)的結(jié)構(gòu)和功能表征。 [0021]在本發(fā)明中,術(shù)語“(甲基)淺灰霉素”指淺灰霉素,也指甲基淺灰霉素。淺灰霉素是一種由下述10個氨基酸構(gòu)成的抗生素,即:乙?;腖-N-甲基纈氨酸(I)、L-反式-4-甲基脯氨酸⑵、L-N-甲基蘇氨酸(3)、L-亮氨酸(4)、L-反式-4-甲基脯氨酸(5)、L-亮氨酸(6) ,L-N-甲基纈氨酸(7)、L-脯氨酸⑶、D-N-甲基-D-亮氨酸(9)和甘氨酸(10)。圖1給出了淺灰霉素以及甲基淺灰霉素的結(jié)構(gòu)式。淺灰霉素及其變體甲基淺灰霉素由牽涉本發(fā)明鑒定的(甲基)淺灰霉素生物合成基因簇的相同基因的相同生物合成途徑以不同的量產(chǎn)生。甲基淺灰霉素因在第8位存在L-反式-4-甲基脯氨酸而非L-脯氨酸而不同于淺灰霉素。負責(zé)將L-反式-4-甲基脯氨酸并入甲基淺灰霉素與將L-脯氨酸并入淺灰霉素的多域-酶是相同的酶,即NRPS-2,且為本發(fā)明鑒定的基因nrps-2的蛋白質(zhì)產(chǎn)物。
[0022]在本發(fā)明中,術(shù)語“基因簇”指位于基因組中鄰接的一段序列上的幾個基因的組,且其指導(dǎo)(甲基)淺灰霉素的合成。屬于該基因簇的基因中的一些是相關(guān)并歸入基因家族的基因。它們編碼結(jié)構(gòu)和功能上相似的蛋白質(zhì)。其余的基因在結(jié)構(gòu)上不相關(guān)且編碼具有不同結(jié)構(gòu)和功能的蛋白質(zhì)。所編碼的蛋白質(zhì)或是催化反應(yīng)的酶,或是涉及調(diào)節(jié)或轉(zhuǎn)運之類??傊?,所述基因簇所包含的基因編碼用于(甲基)淺灰霉素生物合成目的的蛋白質(zhì)。
[0023]術(shù)語“核酸”涵蓋分別編碼SEQ ID No:2-27的蛋白質(zhì)的0RF1-26所定義的核酸,以及天然出現(xiàn)的和非天然出現(xiàn)的變體及其片段(如本發(fā)明所定義的)。所述核酸可以是任何由載有遺傳信息或在細胞內(nèi)形成結(jié)構(gòu)的單體核苷酸的鏈構(gòu)成的大分子。最常見(因此優(yōu)選的)核酸是脫氧核糖核酸(DNA)和核糖核酸(RNA)。所述核酸可以是DNA分子,如基因組DNA分子如SEQ ID NO: 1,或為單鏈或雙鏈cDNA分子如代表ORF并編碼蛋白質(zhì)的核酸,還可為合成的DNA,如合成的單鏈多核苷酸如引物或探針。本發(fā)明的核酸也可為RNA分子。優(yōu)選地,所述術(shù)語也涉及基因的非編碼區(qū),其中,這些部分具有特異于該基因的相關(guān)大小。這些區(qū)的實例是調(diào)節(jié)元件如啟動子。更優(yōu)選地,術(shù)語“核酸”涉及基因、0RF、啟動子、DNA、cDNA或mRNA。編碼所需遺傳信息的核酸(優(yōu)選DNA)可包含所關(guān)注的基因,啟動子區(qū),起始密碼子和終止密碼子,和可用于調(diào)節(jié)所述基因的表達的可能的其他區(qū)。所述調(diào)節(jié)區(qū)與各基因可為異源的,或可與其天然相關(guān)。遺傳信息可以是持久表達的,或在導(dǎo)入了本發(fā)明的核酸的細胞中的阻抑蛋白和/或啟動子區(qū)的控制下表達。所獲得的細胞或直接使用,或用于組織培養(yǎng),或者可收獲所述細胞并通過破壞所述細胞獲得包含各蛋白質(zhì)的樣品。或者,DNA或RNA可用于細胞中或用于無細胞表達系統(tǒng),例如微陣列系統(tǒng),其中將DNA或RNA固定,并通過添加包含轉(zhuǎn)錄和/或翻譯所需的因子(酶、核糖體、tRNA、氨基酸、核苷酸、ATP等)的功能性細胞裂解物進行翻譯和/或轉(zhuǎn)錄。還包括的是人工核酸,包括肽核酸(PNA)、嗎啉代(morpholino)和鎖定核酸(LNA),以及乙二醇核酸(GNA)和蘇糖核酸(TM)。這些的每一種均通過對分子骨架的改變而區(qū)別于天然存在的DNA或RNA。
[0024]本申請中所用的術(shù)語“包含/包括(comprising) ”意指“包括(include)或涵蓋(encompass) ”所需的特征和不必要特別提及的另外的特征。所述術(shù)語“包含/包括”也意指由所需的特征組成(“consist of”),且不包含所需特征之外的另外的特征。由此,本申請的核酸或蛋白質(zhì)可以由除所指示的定義之外(例如除了通過ORF或SEQ ID號定義之外)的其他特征所定義,或者僅由所指示的特征組成。
[0025]術(shù)語“異源的”在涉及核酸序列如編碼或控制序列時,指通常不與重組構(gòu)建體和/或具體細胞的區(qū)相關(guān)聯(lián)的序列?!爱愒吹摹眳^(qū)是另一核酸內(nèi)或附接于另一核酸的可鑒定的核酸區(qū)段,未發(fā)現(xiàn)其在自然界中與所述其他分子相關(guān)聯(lián)。例如,構(gòu)建體的異源區(qū)可為未發(fā)現(xiàn)其在自然界中與本發(fā)明所鑒定的基因相關(guān)聯(lián)的調(diào)節(jié)區(qū)。類似地,異源序列可為編碼序列,其本身因包含例如具有不同于天然基因的密碼子的合成序列而未在自然界中被發(fā)現(xiàn)。而且,用通常不存在于宿主細胞中的構(gòu)建體轉(zhuǎn)化的宿主細胞,就本發(fā)明而言被認為是異源的。同源核酸序列是如本申請所定義的是變體序列。術(shù)語“同源的”可與變體互換使用。術(shù)語“同源的”也可以指同一的序列。
[0026]在本發(fā)明的一個實施方案中,所述核酸包含一種核酸分子,其編碼SEQ ID No :2-27的序列所包含的至少 一個獨特的蛋白質(zhì)。在一個實施方案中,SEQ ID NO: I所包含的(甲基)淺灰霉素基因簇的整個序列包含在本發(fā)明的核酸中。在另一實施方案中,所述核酸是編碼SEQ ID No:2-27的至少一種蛋白質(zhì)的功能活性變體或片段的0RF1-26的變體或片段。最優(yōu)選的核酸編碼如下詳述的天然存在的0RF1-26的變體蛋白質(zhì),更優(yōu)選天然存在的鏈霉菌屬蛋白,更優(yōu)選SEQ IDNo:2-27的蛋白質(zhì),其牽涉(甲基)淺灰霉素的合成。
[0027]術(shù)語“核酸”可包括本申請所公開的全長0RF1-26,也可包含0RF1-26的片段或部分序列。所述0RF1-26的片段或部分序列分別編碼具有SEQ ID No :2-27所示的氨基酸序列的蛋白質(zhì)的片段。這可包括具有短的內(nèi)部和/或C-和/或N-末端缺失的片段化蛋白質(zhì),由此本申請定義的所得蛋白質(zhì)的活性保留至如0RF1-26所編碼的野生型蛋白質(zhì)的活性的5%以上,10%以上,20%以上,30%以上,40%以上,50%以上,60%以上,70%以上,80%以上,90%以上,95%以上,97%以上,或100%以上,例如多于150 %,200 %,300 %,400 %或500%。因此,編碼此種片段的各核酸包含0RF1-26之內(nèi)和/或5’和/或3’末端的缺失,例如缺失最多50%,45%,40%,35%,30%,25%,20%,15%,10%,5%或更少。在本發(fā)明語境中,編碼SEQ ID No:2-27的蛋白質(zhì)的功能活性片段的片段化核酸序列意指編碼片段的序列,所述片段指導(dǎo)(甲基)淺灰霉素的合成和/或可取代編碼SEQ ID No:2-27的蛋白質(zhì)的各ORF以指導(dǎo)(甲基)淺灰霉素的合成。
[0028]術(shù)語“核酸”可指本申請所公開的0RF1-26的變體,其編碼本申請所定義的SEQ IDNo:2-27的蛋白質(zhì)的功能活性變體。此種功能活性變體與SEQ ID No:2-27具有高于50%,高于60 %,優(yōu)選高于70 %,更優(yōu)選高于80 %,更優(yōu)選高于85 %,更優(yōu)選高于90 %,更優(yōu)選高于95 %,最優(yōu)選高于97 %的序列同一性,和/或具有SEQ ID No: 2-27的蛋白質(zhì)的活性的5 %以上,10%以上,20%以上,30%以上,40%以上,50%以上,60%以上,70%以上,80%以上,90%以上,95%以上,97%以上,或100%以上,例如SEQ ID No :2-27的蛋白質(zhì)的活性的多于150 %,200 %,300 %,400 %或500 %。因此,編碼此類變體的核酸包含在ORF1-26之內(nèi)和/或5'和/或3'末端的缺失、插入、取代和/或添加,同時顯示出與ORF1-26的序列50%以上,60%以上,70%以上,優(yōu)選80%以上,更優(yōu)選85%,更優(yōu)選90%以上,更優(yōu)選95%以上,最優(yōu)選97%以上的同一性。在本發(fā)明的語境中,編碼SEQ ID No:2-27的蛋白質(zhì)的功能活性變體的變體核酸序列意指編碼變體的序列,所述變體指導(dǎo)(甲基)淺灰霉素的合成和/或取代編碼SEQ ID No:2-27的蛋白質(zhì)的各ORF以指導(dǎo)(甲基)淺灰霉素的合成。
[0029]需注意的是以上所提及的修飾可組合。例如,本發(fā)明所包含的核酸可為包含0RF1-26的一個或多個變異的片段。還應(yīng)注意的是,片段或變體包括本申請所定義的與0RF1-26或其片段或變體天然相關(guān)聯(lián)的啟動子或調(diào)節(jié)序列的片段或變體。這些變體具有功能活性,因為它們調(diào)節(jié)與之相關(guān)聯(lián)的基因的轉(zhuǎn)錄或翻譯。
[0030]ORF是開放閱讀框,其是可潛在地編碼蛋白質(zhì)的DNA序列。在本發(fā)明的語境中,術(shù)語“0RF”表示分離自鏈霉菌DSM22643的(甲基)淺灰霉素生物合成基因簇中的開放閱讀框(0RF1-26)。本發(fā)明人成功地鑒定了鏈霉菌DSM22643的淺灰霉素生物合成基因簇,并在65272個核苷酸的一段鑒定出26個0RF。將這些ORF分別命名為orf-1、orf-2、orf-3、orf-4> orf-5> orf-6> orf-7> nrps-1 > int_l、tnp-1、int_2、tnp_2、tnp_3、dna、nrps_2、nrps-3、mbtH、mps-l、mps-2、mps-3、mps-4、orf-8> orf-9、orf-10、orf-11 或 orf-12。鏈霉菌DSM22643的整個淺灰霉 素生物合成基因簇長66868個核苷酸,包含0RF1-26以及分別位于ORFl和0RF26的5,和3,端的另外的核苷酸。
[0031]SEQ ID NO: I 所包含的 26 個 ORF 從鏈霉菌 DSM26643 的 SEQ ID NO: I 中第 837 位的核苷酸延伸至第66108位的核苷酸。表1中顯示了具體的推定0RF,相應(yīng)基因的名稱,SEQ ID NO: I內(nèi)的起始和終止核苷酸,以核苷酸(nt)表示的基因的長度,鏈型,推定所編碼的蛋白質(zhì)的氨基酸數(shù)(aa),蛋白質(zhì)名稱以及所述蛋白質(zhì)的SEQ ID號的列表。表2顯示以可從 NCBI (National Centre for Biotechnology Information ;National Library ofMedicine38A, Bethesda, MD20894 ;USA ;www. ncbi. nih. gov)獲得的其 GenBank 登錄號命名的蛋白質(zhì)。已基于同源性搜索對這些蛋白質(zhì)進行了鑒定,顯示出其與SEQ IDNo:2-27的蛋白質(zhì)的最高同一性/相似性。這些蛋白質(zhì)通過它們的功能、它們的登錄號以及它們的來源進行定義。表2還顯示e-值以及SEQ ID No:2-27的蛋白質(zhì)和上述通過同源性搜索鑒定的蛋白質(zhì)之間的同一'I"生和相似性程度。所述e-值涉及預(yù)計數(shù)目的隨機比對(chance alignment),所述隨機比對具有至少等于所觀察到的比對分數(shù)的比對分數(shù)。e_值為0. 00指示完全同源。e_值的計算如Altschul S. F.等1997中所述。e_值幫助確定兩條序列是否顯示充分的相似性,以證明同源性推斷的正確性。同一性指示在相比較的蛋白質(zhì)中各自位點上存在同一的氨基酸,而相似性顯示在各自的位點上存在如下述定義的保守氨基酸取代。而且,還指示由0RF1-26編碼的蛋白質(zhì)的推定的功能。
[0032]變體核酸取代0RF1-26以指導(dǎo)(甲基)淺灰霉素的合成意指此變體核酸可插入鏈霉菌DSM22643的基因組中代替變體所來源的ORF(C)RF to which it is a variant),由此表達變體蛋白,所述變體蛋白接管了 SEQ ID No:2-27的各蛋白質(zhì)的功能并指導(dǎo)(即參與)(甲基)淺灰霉素的合成。所述變體接管所述功能的程度如本申請中所定義。
[0033]在另一個實施方案中,所述核酸編碼SEQ ID No:2-27的蛋白質(zhì)。如表1所示,所述核酸可包含帶有起始和終止核苷酸(nt)的SEQ ID NO:1中所包含的0RF1-26的序列。所述核酸也可編碼與SEQ ID No:2-27的蛋白質(zhì)具有相同氨基酸的蛋白質(zhì),但是由于遺傳密碼的簡并性所述核酸在其核苷酸組成上不同。
[0034]在又一個實施方案中,所述核酸在嚴格條件下與核酸雜交,所述核酸包含于SEQID NO:1所鑒定的(甲基)淺灰霉素基因簇,或構(gòu)成0RF1-26,或編碼具有SEQ IDN0:2_27或其功能活性變體或者片段的蛋白質(zhì)。在本發(fā)明中,術(shù)語“在嚴格條件下雜交”指在兩個核酸分子之間在允許形成所謂特異性雜合體而基本上不形成非特異性雜合體的條件下形成雜合體。所述條件的例子包括如下條件,在該條件下高度同一的核酸的互補鏈,即由與SEQ IDN0.1或0RF1-26中所示的核苷酸序列具有70%或以上,優(yōu)選80%或以上,更優(yōu)選85%或以上,還更優(yōu)選90%或以上,甚至更優(yōu)選95%或以上同一性的核苷酸序列構(gòu)成的DNA雜交,而低于上述的同一性程度的互補 性較低的核酸鏈不雜交。更具體而言,所述嚴格條件指鈉鹽濃度為15-750mM,優(yōu)選50_750mM,更優(yōu)選300-750mM,溫度為25_70°C,優(yōu)選50_70°C,更優(yōu)選55-65°C,且甲酰胺濃度為0-50 %,優(yōu)選20-50%,更優(yōu)選35-45 %的條件。此外,在嚴格條件下,雜交后洗滌濾器的條件通常包括下述:鈉鹽濃度為15-600mM,優(yōu)選50-600mM,更優(yōu)選300-600mM,溫度為50_70°C,優(yōu)選55_70°C,更優(yōu)選60°C??衫缤ㄟ^升高反應(yīng)溫度和/或降低反應(yīng)緩沖液的離子濃度來提高嚴格性從而提高特異性。例如,低嚴格條件包括在3xSSC中在室溫到65°C雜交,高度嚴格條件包含在0.1x SSC中在68°C雜交。示例性的中等嚴格條件(就核酸的密碼子組成而言,如果它們?yōu)樽畲笙薅群啿?,則核酸在中等嚴格條件下雜交)包括50%甲酰胺,5x SSC和1% SDS于42°C,并在Ix SSC中于45°C洗滌。高度嚴格條件包括于42 °C,50%甲酰胺,5x SSC和I % SDS溫育(例如50%甲酰胺,5x SSC和I %SDS, 50mM磷酸鈉,5x登哈特氏(Denhardt,s)溶液,1x硫酸右旋糖酐,20mg/ml經(jīng)剪切的鮭魚精DNA)或5x SSC和1% SDS于65°C溫育,并于0.2x SSC和0.1% SDS中于約65°C洗滌(lx SSC代表0.15M氯化鈉和0.015M檸檬酸三鈉緩沖液)。在本發(fā)明中優(yōu)選的是中等和高度嚴格條件,最優(yōu)選高度嚴格條件。在本發(fā)明的語境中,“雜交(hybridizing) ”序列意指序列,所述序列編碼指導(dǎo)(甲基)淺灰霉素合成的蛋白質(zhì),和/或可替代能與其特異性雜交的ORF從而指導(dǎo)(甲基)淺灰霉素的合成。
[0035]在本發(fā)明的又一優(yōu)選實施方案中提供了與上述鑒定的核酸在嚴格條件下雜交并由長5到100個核苷酸組成的核酸。本申請所提供的序列信息可用來設(shè)計特異的核苷酸探針和引物,后者可用于鑒定和分離產(chǎn)生(甲基)淺灰霉素并攜帶SEQ ID No:2-27的任意蛋白質(zhì)或其變體的微生物。因此,所述核酸探針具有序列,其見于或因遺傳密碼子的簡并性衍生自SEQ ID NO:1或其變體所包含的(甲基)淺灰霉素基因簇中的序列,或編碼任意SEQ IDNo: 2-27或其功能活性變體。術(shù)語“探針”指DNA,優(yōu)選單鏈的,或者RNA分子,或其修飾物或組合,其在上述定義的嚴格條件下與核酸分子或它們的互補或有義序列雜交,所述核酸分子包含于SEQ ID NO:1或其變體所鑒定的(甲基)淺灰霉素基因簇中或編碼SEQ ID No:2-27的任何蛋白質(zhì)或其功能活性變體。通常,探針顯著短于全長序列。它們可包含5-100,優(yōu)選10-80個核苷酸,更優(yōu)選10-50個核苷酸,還更優(yōu)選10-40個核苷酸且還更優(yōu)選15-25個核苷酸。具體而言,此種探針可具有序列,其與SEQ ID NO:1所包含的編碼序列(ORF1-26)或非編碼序列至少70 %,至少75 %,優(yōu)選至少85 %,更優(yōu)選至少95 %并最優(yōu)選100 %同源,或依上述程度與其互補。它們可包含經(jīng)修飾的堿基,例如肌苷、甲基-5-脫氧胞苷、脫氧尿苷、二甲基氨基-5-脫氧尿苷或二氨基_2,6-嘌呤。糖或磷酸殘基也可如本領(lǐng)域已知的修飾或取代。例如,脫氧核糖殘基可以被聚酰胺替代,磷酸殘基可被酯基如二磷酸酯、烷基(alky)、芳基磷酸酯或硫代磷酸酯替代??商鎿Q地或此外,核糖核苷酸上的2’ -羥基基團可通過包括基團如烷基、O-烷基或鹵素基團而修飾。本發(fā)明的探針可用于任何常規(guī)的雜交技術(shù),例如斑點印跡、Southern印跡、Northern印跡或夾心技術(shù),后者為使用具有彼此間至少部分不同的核苷酸序列的特異捕獲和/或檢測探針的技術(shù)(Sambrook等,Molecularcloning:A laboratory manual.Cold Spring Harbor, NY:Cold Spring Harbor LaboratoryPress, 2001) 0引物用于在擴增(例如PCR)、延長或反轉(zhuǎn)錄方法中起始DNA的酶促聚合反應(yīng)。用于涉及PCR的診斷方法的引物通過本領(lǐng)域已知的方法標記。它們也可被用作探針。原則上,引物可具有與探針相同的特征。它們可包含5-100個,優(yōu)選10-80個核苷酸,更優(yōu)選10-50個核苷酸,還更優(yōu)選10-40個核苷酸,且還更優(yōu)選15-25個核苷酸。在本發(fā)明的語境中,所述引物或探針可用于檢測、鑒定和/或分離產(chǎn)生(甲基)淺灰霉素特別是包含SEQID No:2-27的任何蛋白質(zhì)或其功能活性變體的微生物,用于檢測、鑒定和/或分離編碼SEQID No: 2-27的蛋白質(zhì)或其功能活性變體的DNA或RNA,和/或用于擴增編碼SEQ ID No: 2-27的蛋白質(zhì)或其功能活性變體的DNA或RNA。因此,在本發(fā)明的一個實施方案中包含一種試劑,所述試劑含有用于以上概述的檢測、鑒定和/或純化目的的引物或探針。
[0036]或者,鑒定編碼在(甲基)淺灰霉素生物合成途徑中具有活性的蛋白質(zhì)的核酸可以通過篩選與抗體的反應(yīng)性或交叉反應(yīng)性來實現(xiàn),所述抗體是針對具有SEQ ID No:2-27或其功能活性變體或片段的氨基酸序列的蛋白質(zhì)產(chǎn)生的。所述步驟如下:針對SEQ ID No:2-27的蛋白質(zhì)或其功能活性變體或片段、融合多肽(例如,MBP、GST或His-標簽系統(tǒng)的表達產(chǎn)物)或由SEQ ID No:2-27的蛋白質(zhì)或其已知變體或片段衍生的合成肽特異地產(chǎn)生抗體。可通過多種方法包括Western印跡,斑點印跡和ELISA確定特異的抗原性。一旦產(chǎn)生了特異性的抗體,此抗體即可用于鑒定編碼蛋白質(zhì)的核酸,所述蛋白質(zhì)攜帶產(chǎn)生所述抗體所針對的免疫源性肽,由此鑒定本申請所定義的作為SEQ ID No:2-27的蛋白質(zhì)或其功能活性片段或其變體的蛋白質(zhì)。本申請所使用的特異的抗原性或特異性抗體的意指所述抗體僅與產(chǎn)生該抗體所針對的免疫源性肽結(jié)合。
[0037]在又一實施方案中,所述核酸互補于核酸序列,所述核酸序列包含于SEQ ID NO:1中,或編碼SEQ ID NO:2-27的蛋白質(zhì)或其功能活性片段或變體。
[0038]在一個實施方案中,所述核酸包含至少一個,至少兩個,至少三個,至少四個,至少五個或以上的0RF,所述ORF選自編碼淺灰霉素生物合成基因簇的SEQ ID No: 2_27所示的多肽的0RF1-26,或其功能活性片段或其變體。在一個優(yōu)選的實施方案中,所述核酸包含特定的ORF或特定ORF的組合,所述ORF或其組合牽涉(甲基)淺灰霉素生物合成過程中限定的步驟,或者一起在(甲基)淺灰霉素生物合成過程中限定的步驟中起作用。在一個更優(yōu)選的實施方案中提供了選 自0RF1-27的ORF的組合,其編碼管理(甲基)淺灰霉素生物合成的多肽。在一個還更優(yōu)選的實施方案中,所述ORF是0RF8,15或16,或者所述組合包含編碼非核糖體蛋白質(zhì)合成酶(NRPS)的亞基分別命名為nrps-1、nrps-2和nrps_3的0RF8、15或16中的至少兩個。在另一實施方案中,所述核酸包含0RF18、19或21,或L-反式-4-甲基脯氨酸生物合成所需的構(gòu)成分別命名為mps-l、mps-2、mps-3和mps_4的基因的0RF18-21中至少兩個或者構(gòu)成分別命名為mps-l、mps-2和mps_4的基因的0RF18、19和21中至少兩個的組合。在又一實施方案中,0RF8、15和/或16可與0RF18、19、20和/或21,或與0RF18、19和/或21組合以增強L-反式-4-甲基脯氨酸和(甲基)淺灰霉素(特別是甲基淺灰霉素)的產(chǎn)生。由此,任何0RF1-26均可與0RF1-26的任何變體或片段組合以指導(dǎo)(甲基)淺灰霉素的合成。在本發(fā)明的又一實施方案中,所述ORF可能是不變的,但是控制元件(例如,啟動子,核糖體結(jié)合位點,終止子,增強子等)可被修飾。
[0039]在另一實施方案中提供了一種核酸,其包含淺灰霉素生物合成基因簇或由淺灰霉素生物合成基因簇組成,所述淺灰霉素生物合成基因簇具有SEQ ID NO:1的序列或含有ORF1-26中至少一個的變體或片段的SEQ ID NO:1的變體序列,所述變體或片段編碼SEQ IDNo:2-27的蛋白質(zhì)的功能活性變體或片段。SEQ ID NO:1的(甲基)淺灰霉素基因簇內(nèi)任何ORF1-26的變體或片段化序列處于不被另外修飾的狀態(tài)可導(dǎo)致SEQ ID No:2-27的一個或多個變體蛋白質(zhì),其修飾(甲基)淺灰霉素合成途徑中的特定步驟。這可導(dǎo)致增強的(甲基)淺灰霉素或L-反式-4-甲基脯氨酸的產(chǎn)生,或?qū)е戮哂性鰪姷目股鼗钚缘?甲基)淺灰霉素的經(jīng)修飾的結(jié)構(gòu)。例如,0RF8、15和16和/或18、19、20和21中的任何ORF均可在上述SEQ ID NO:1所包含的淺灰霉素簇內(nèi)被修飾,而剩余的ORF保持不變??商鎿Q地或此外,可對控制元件進行修飾導(dǎo)致0RF1-26中至少一個的經(jīng)修飾的表達。
[0040]由此,在本發(fā)明的一個實施方案中提供一種核酸,其包含牽涉(甲基)淺灰霉素生物合成的至少一個ORF,例如0RF18、19、20和21 (或另外稱為ORF18-21),或0RF18、19和/或21,和/或0RF8、15和/ 或16,或者如本申請所定義的這些ORF的功能活性變體或片段??稍诋愒醇毎斜磉_或過表達一個ORF或者ORF的組合以允許產(chǎn)生各蛋白質(zhì),所述蛋白質(zhì)可例如用作發(fā)酵輔助物以增強淺灰霉素,特別是甲基淺灰霉素在內(nèi)源或異源產(chǎn)生淺灰霉素和/或甲基淺灰霉素的生物中的產(chǎn)生?;蛘?,可在產(chǎn)生(甲基)淺灰霉素的細胞或生物中表達或過表達本發(fā)明包含的ORF或者ORF的組合以增強各蛋白質(zhì)的產(chǎn)生,從而增強(甲基)淺灰霉素的產(chǎn)生和/或有利于甲基淺灰霉素的產(chǎn)生。例如,0RF18-21或者0RFsl8、19和21可伴隨表達以允許合成L-反式-4-甲基脯氨酸。L-反式-4-甲基脯氨酸的增強產(chǎn)生可用于增強相對于淺灰霉素產(chǎn)生的甲基淺灰霉素產(chǎn)生,如可通過下述證明的:提供4-甲基脯氨酸而獲得5倍高量的甲基淺灰霉素。因此,在本發(fā)明的一個優(yōu)選的實施方案中,可通過根據(jù)本領(lǐng)域已知或本申請描述的方法引入核酸并允許表達所述基因以及(甲基)淺灰霉素基因簇的基因來增強鏈霉菌DSM22643或者產(chǎn)生(甲基)淺灰霉素的其他生物中甲基淺灰霉素的產(chǎn)量/產(chǎn)率(yield),所述核酸包含牽涉L-反式-4-甲基脯氨酸生物合成的基因,特別是0RF18-21,更特別是0RF18、19和21??商鎿Q地或此外,可表達至少一個nrps核酸(0RF8、15和/或16)用于在異源生物中合成(甲基)淺灰霉素,或者在內(nèi)源表達(甲基)淺灰霉素的生物中增強其表達??商鎿Q地或此外,可表達調(diào)節(jié)(甲基)淺灰霉素合成的變體核酸以增強(甲基)淺灰霉素的合成,從而有利于甲基淺灰霉素的合成或者產(chǎn)生氨基酸組成不同于(甲基)淺灰霉素的(甲基)淺灰霉素的衍生物,其為例如更有效的抗生素。例如,可通過誘變或通過肽合成酶之間的域交換來改變NRPS蛋白質(zhì)的A域的氨基酸的特異性,由此允許選擇不同的氨基酸并產(chǎn)生天然(甲基)淺灰霉素的衍生物?;蛘撸墒咕幋aNRPS2的模塊8的A-域的核酸突變以產(chǎn)生變體核酸,其導(dǎo)致增強L-反式-4-甲基脯氨酸插入到新生肽鏈中,由此導(dǎo)致與野生型相比增強的甲基淺灰霉素的產(chǎn)生?;蛘?,可交換整個模塊8,或者交換或突變模塊8的C-域以優(yōu)選地濃縮甲基脯氨酸。
[0041]在淺灰霉素的第2位和第5位,甲基淺灰霉素的第2、5和8位包含L-反式_4_甲基脯氨酸。L-反式-4-甲基脯氨酸可通過化學(xué)產(chǎn)生,然而,化學(xué)產(chǎn)生是成本密集型的且耗費時間。因而,本發(fā)明的一方面提供包含牽涉L-反式-4-甲基脯氨酸生物合成的基因的核酸,特別是0RF18-21或0RF18、19和21,或是本申請所定義的這些ORF的功能活性變體或片段??稍诋愒醇毎斜磉_或過表達這些ORF的組合以允許產(chǎn)生L-反式-4-甲基脯氨酸,用作例如發(fā)酵輔助物以增強淺灰霉素,特別是甲基淺灰霉素在內(nèi)源或異源產(chǎn)生淺灰霉素和/或甲基淺灰霉素的生物中的產(chǎn)生。或者,在天然產(chǎn)生(甲基)淺灰霉素的細胞或生物中表達或過表達這些基因的組合以增強L-反式-4-甲基脯氨酸的產(chǎn)生從而有利于甲基淺灰霉素的產(chǎn)生。因此,在本發(fā)明的一個優(yōu)選實施方案中,可通過根據(jù)本領(lǐng)域已知或本申請所述的方法,向內(nèi)源或異源產(chǎn)生淺灰霉素和/或甲基淺灰霉素的生物,例如鏈霉菌DSM22643中引入包含牽涉L-反式-4-甲基脯氨酸的生物合成的基因,特別是0RF18-21,更特別是0RF18、19和21的核酸,并允許表達所述基因以及淺灰霉素生物合成基因簇的基因,從而在鏈霉菌DSM22643中增強甲基淺灰霉素的產(chǎn)量。
[0042]可通過任何已知的方法提供本發(fā)明的核酸。使用本申請所提供的序列信息,可根據(jù)本領(lǐng)域技術(shù)人員已知的標準方法確定適合于擴增/分離一個或多個ORF的引物。本申請所定義的適合于擴增/分 離一個或多個ORF的引物根據(jù)序列表中提供的核苷酸序列信息設(shè)計。所述步驟如下:選擇可由10-40個,優(yōu)選15-25個核苷酸組成的引物。有利的是選擇以足以保證有效雜交的比例包含C和G核苷酸的引物;即C和G核苷酸的量為總核苷酸含量的至少40%,優(yōu)選50%。通常,所述擴增將利用包含必需基因的生物(如鏈霉菌屬,尤其是鏈霉菌DSM22643)的DNA或RNA作為模板。將進行標準的PCR反應(yīng),其通常含有O. 5_5個單位的Taq DNA聚合酶每100 μ I體積,20-200 μ M每種脫氧核苷酸,優(yōu)選以相同的濃度,高于總脫氧核苷酸濃度的鎂O. 5-2. 5mM, 105-106個靶分子,以及每種引物約20pmol。進行約25-50個PCR循環(huán)。更嚴格的退火溫度提高對不正確地退火的引物的辨別力并減少不正確的核苷酸在引物的3’端并入。95°C _97°C的變性溫度是典型的,盡管更高的溫度可適合于富含G+C的靶物的變性。所實施的循環(huán)數(shù)依賴于靶物分子的起始濃度,盡管通常不建議多于40個循環(huán),因為往往會積累非特異性背景產(chǎn)物。使用本申請所定義的引物和探針對DNA或RNA文庫進行雜交篩選是用于提取編碼本申請所定義的變體多肽的多核苷酸的替代方法。雜交步驟是已知的,且在本領(lǐng)域和本申請中描述。
[0043]可替換地或此外,所述核酸可通過克隆由此將其引入細胞并在細胞中進行擴增來提供。由此,在本發(fā)明的另一方面提供包含本申請所定義的核酸的載體以及用所述表達載體轉(zhuǎn)化的宿主細胞。將基因引入受體細胞的過程稱作轉(zhuǎn)化。可通過本領(lǐng)域已知的多種手段將所述基因引入所述細胞并適于各細胞類型。術(shù)語“細胞”或“宿主細胞”指所述基因在其中表達的細胞,而無論是原核細胞還是真核細胞,也無論所述細胞是否天然表達各基因。由此,在一個優(yōu)選的實施方案中,所述細胞可以是天然攜帶表達本發(fā)明所包含的蛋白質(zhì)的基因的細胞,例如鏈霉菌DSM22643。本領(lǐng)域中公知的用于引入并表達核酸分子的重組DNA克隆技術(shù)可用于引入和表達所述基因,如果所述細胞攜帶各基因則所述基因是內(nèi)源的,或者如果所述基因?qū)τ谒黾毎皇莾?nèi)源的則該基因是異源的??墒褂萌魏芜m當手段包括基于病毒或噬菌體的載體、化學(xué)試劑、電穿孔、磷酸鈣共沉淀或者DNA直接擴散轉(zhuǎn)化細胞。載體是將內(nèi)源或異源基因轉(zhuǎn)運到細胞中的物質(zhì),且可包括適當?shù)霓D(zhuǎn)錄和翻譯控制信號如啟動子。載體可為質(zhì)粒、病毒(例如噬菌體)或本領(lǐng)域已知的其他形式。載體能夠在宿主細胞中自發(fā)復(fù)制或可并入染色體DNA中。術(shù)語“載體”包括那些主要作用在于將核酸插入到細胞中的載體,或那些主要作用在于細胞中核酸復(fù)制的載體(復(fù)制載體),或那些主要作用在于細胞中DNA或RNA的轉(zhuǎn)錄和/或翻譯的載體。載體的實例包括pBTrp2、pBTaCl、pBTaC2 (全部由 Boehringer Mannheim 制造),pKK263_2 (由 Pharmacia 制造)、pGEX(由 Pharmacia 制造)、pSE280 (由 Invitrogen 制造)、pGEMEX-Ι (由 Promega 制造)、pQE-8 (由 Qiagene 制造)、pET-3 (由 Novagen 制造)、pBluescriptll SK+ (由 Stratagene 制造)、pBluescriptII SK(-)(由 Stratagene 制造)、pTrS30[由大腸桿菌 JM109/pTrS30 (FERM BP-5407)制備]、pTrS32 [由大腸桿菌 JM109/pTrS32 (FERM BP-5408)制備]、pSTV28 (由 Takara BioInc.制造)、pUC118(由 Takara Bio Inc.制造)、pHW1520(由 MoBiTec 制造)、pSET152、P0J436 和 pOJ446 (Bierman M,等,1992)、pSH19 (Herai S,等,2004)、pUWL199、pUWL218 和PUWL219 (Wehmeier U. F.,1995)以及 pIJ6021 (Takano E.等,1995)。
[0044]所述啟動子可以是誘導(dǎo)型的或組成型的,通用的或者細胞特異性的,細胞核或細胞質(zhì)特異性的,異源的或與所述基因天然相關(guān)的??墒褂萌魏晤愋偷膯幼又灰淠茉谒拗骷毎衅鹱饔谩幼拥膶嵗▉碜源竽c桿菌或噬菌體的啟動子,如trp啟動子(Ptrp)、Iac啟動子(Plac)、PL啟動子、PR啟動子或PSE啟動子、SPOl啟動子、SP02啟動子和penP啟動子。此外,也可以使用人工設(shè)計和修飾的啟動子,如通過將兩個Ptrp串連放置的啟動子(Ptrp*2)、tac啟動子、lacT7啟動子或let I啟動子。而且,也可以使用用于在芽孢桿菌屬(Bacillus)的細菌中表達的xylA啟動子,用于在棒狀桿菌屬(Corynebacterium)的細菌中表達的P54-6啟動子。其他有用的啟動子為PermE (Bibb等,1985) ,PermE* (Bibb等,1994),PtipA (Mur akami 等,1989)、PnitA-NitR 表達系統(tǒng)(Herai 等,2004)和actII-0RF4/PactI激活子-啟動子系統(tǒng)(Ferna' ndez-Moreno等,1991)。啟動子、載體和其他元件的選擇是常規(guī)設(shè)計的問題。眾多此類元件在文獻中有描述并可通過供應(yīng)商獲得。可將單個的基因引入細胞。也可以將多于一個基因引入細胞并在其中表達。當要表達大的基因簇時,優(yōu)選的是使用噬菌粒、粘粒、PI s、YACs、BACs、PACs、HACs,或類似的克隆載體。如果將多于一個基因引入細胞,所述基因可能受相同的啟動子和/和調(diào)控元件的調(diào)節(jié)?;蛘?,所述基因可受不同的啟動子和/和調(diào)控元件調(diào)節(jié)。通常,轉(zhuǎn)移方法包括將選擇性標記轉(zhuǎn)移到細胞。一般而言,可通過上述的任何手段轉(zhuǎn)化細胞系,其中所述轉(zhuǎn)基因可操作地連接于選擇性標記。轉(zhuǎn)化后使細胞生長一段適應(yīng)期的時間。經(jīng)轉(zhuǎn)化的細胞顯示對選擇的抗性并且能夠生長,而非轉(zhuǎn)化細胞通常死亡。選擇性標記的實例包括嘌呤霉素、零霉素、新霉素和潮霉素B,其分別賦予對嘌呤霉素、零霉素、氨基糖苷G-418和潮霉素B的抗性。
[0045]適合本發(fā)明語境的宿主細胞的實例源自具有攜帶并表達重組的淺灰霉素生物合成基因簇,或淺灰霉素生物合成基因簇的一個或多個基因的能力的任何生物。實例包括細菌、酵母、絲狀真菌、動物細胞和植物細胞,如但不限于,大腸桿菌菌株的細胞,放線菌目(Actinomycetales)如鏈霉菌屬菌種如鏈霉菌DSM22643或天藍色鏈霉菌(Streptomycescoelicolor)的細胞,酵母菌株如釀酒酵母(Streptomyces coelicolor)的細胞,昆蟲細胞系鱗翅目(Lepidoptera)如來自草地貪夜蛾(Spodopterafrugiperda)的細胞,植物細胞或哺乳動物細胞,如L6細胞、3T3脂肪細胞、HEK293、745-A、A-431、心房肌細胞、BxPC3、C5N、Caco-2、Capan-U CC531、CFPAC、CHO, CHO Kl、COS-1、COS-7、CV-U EAHY, EAHY926。優(yōu)選的實施方案是細菌細胞,如放線菌目如鏈霉菌DSM22643或天藍色鏈霉菌的細胞,或者大腸桿菌菌株的細胞。特別優(yōu)選的實施方案是放線菌目,特別是鏈霉菌DSM26643的細胞。
[0046]如上所述,用于攜帶并表達本發(fā)明所包含的基因的優(yōu)選的宿主細胞是細菌細胞。適合攜帶并表達本發(fā)明所包含的基因的其它宿主細胞是經(jīng)建立的或無限增殖化的細胞系,所述細胞系通過隨機突變或有意修飾如端粒酶基因的人工表達而獲得無限增殖的能力。存在眾多代表特定細胞類型的已建立好的細胞系,而且選擇合適的細胞系屬于技術(shù)人員的知識范圍。細胞系是在培養(yǎng)物中繁殖的細胞群體,其源自單個共同的祖細胞并因此在遺傳上與其同一。適合于本發(fā)明的細胞系是HEK293細胞(原始人胚腎(primary human embryonickidney))、3T3細胞(鼠胚成纖維細胞)、CHO細胞(中國倉鼠卵巢)、C0S-7細胞(非洲綠猴細胞系)、HeLa 細胞(人上皮樣宮頸癌瘤(human epithel1id cervical carcinoma))、JURKAT細胞(人T-細胞白血病)、BHK21細胞(倉鼠正常腎,成纖維細胞),和MCF-7細胞(人乳腺癌)。
[0047]或者,可在組織培養(yǎng)物中克隆并表達本申請所定義的核酸。術(shù)語“組織培養(yǎng)”指一種方法,其中培養(yǎng)形成三維網(wǎng)絡(luò)的細胞的組。所述組織可在培養(yǎng)物中由細胞自身形成,或由所述細胞產(chǎn)生的胞外基質(zhì)形成,所述培養(yǎng)物可在天然的或人工的胞外基質(zhì)(例如,膠原,彈性蛋白,聚苯乙烯,尼龍,聚賴氨酸)上培養(yǎng),或者所述組織可由動物包括人獲得。所述組織培養(yǎng)物可在合適的溫度在培養(yǎng)基中培養(yǎng)。所述培養(yǎng)基可包含營養(yǎng)物(例如糖,鹽,氨基酸和脂質(zhì)),緩沖系統(tǒng)(常常包含一種或多種無毒或低毒的化學(xué)緩沖物質(zhì),例如磷酸鹽/酯、磷酸氫鹽/酯和/或TrisjP /或二氧化碳(CO2)氣處理)和/或任選一種或多種抗生素。為了提供足量的營養(yǎng)物和/或去除代謝物,當需要時可改變所述培養(yǎng)基。任選地,所述組織培養(yǎng)可用培養(yǎng)基灌注。所述灌注可以是永久或脈沖灌注。
[0048]可通過設(shè)計將變異引入核酸,例如對核酸內(nèi)的核苷酸以特定方式進行修飾,例如將單個的取代基用另外的取代基替代,并由此造成淺灰霉素的部分或全部人工(artificelle)生物合成基因簇。作為另一個示例,技術(shù)人員知道稱作“合成生物學(xué)”的領(lǐng)域,其涉及設(shè)計和構(gòu)建未在自然界中發(fā)現(xiàn)的新的生物功能和系統(tǒng)。例如,技術(shù)人員能夠在計算機芯片上設(shè)計并合成與野生型序列在核酸水平?jīng)]有相似性但編碼與野生型序列相同的蛋白質(zhì)的DNA序列?;蛘?,也可隨機地制造變異,例如通過系統(tǒng)地或偶然地替代生物合成途徑中一個或多個的ORF來制成(甲基)淺灰霉素分子變體文庫。而且,使用已知的方法設(shè)計非自然存在的核酸的有用變體和片段。所述變異可為以上概述的任何修飾,例如將單個的取代基用另外的取代基替代。例如,鑒定了可能耐受氨基酸序列改變和/或缺失的多肽的區(qū)。作為示例,比較了牽涉從產(chǎn)生(甲基)淺灰霉素的不同物種(species)合成(甲基)淺灰霉素的變體多肽;鑒定了保守序列。相差較大的序列最有可能耐受序列改變??墒褂帽绢I(lǐng)域已知的方法分析序列間的同源性。向核酸中引入突變的方法包括易錯PCR,定點誘變,使用羥胺的方法,或允許突變劑如UV作用于具有所關(guān)注的核酸的細胞的方法。使用易錯PCR時,例如用并入了所關(guān)注的核酸的質(zhì)粒作為模板,在錳(Mn)鹽濃度高于通常的PCR反應(yīng)的反應(yīng)溶液中進行PCR反應(yīng)。
[0049]使用本發(fā)明所提供的信息和其它方法克隆所需的序列對本領(lǐng)域技術(shù)人員而言是顯然的,例如使用重組方法,如通過篩選源自表達所述基因的細胞的cDNA或基因組文庫或是從已知包含所述基因的載體中得到該基因,可由表達所述核酸的生物獲得包括包含ORFI-26的全部淺灰霉素生物合成基因簇的0RF1-26中的至少一個,和/或任選地編碼所關(guān)注的NRPS模塊或酶促域的核酸。然后可使用標準的技術(shù)分離所述基因或簇并將其與其他所需的生物合成元件組合。如果所討論的基因或簇已經(jīng)存在于合適的表達載體中,那么它們可在原位與例如所需的其他域或亞基組合。所關(guān)注的基因可合成地而非克隆地產(chǎn)生??捎脤τ谒璧奶囟ò被嵝蛄羞m當?shù)拿艽a子設(shè)計核苷酸序列。一般而言,可選擇對于將在其中表達所述序列的意欲的宿主優(yōu)選的密碼子。此外,注意的是訂制基因合成是商業(yè)上可獲得的。
[0050]在另一方面,本發(fā)明涉及蛋白質(zhì),其包含選自SEQ ID No:2-27或其功能活性片段或變體的至少一個氨基酸序列或由上述核酸編碼。所述蛋白質(zhì)可以是單個的蛋白質(zhì)或可為蛋白質(zhì)的混合物或可為SEQ ID No:2-27中的至少兩種蛋白質(zhì)的融合蛋白。所述蛋白質(zhì)可以是分離的,其意指其基本上是純的并且不與與其天然相關(guān)的成分相關(guān),或者所述蛋白質(zhì)存在于產(chǎn)生所述蛋白質(zhì)的細胞的裂解物中。SEQ ID No:2-27的蛋白質(zhì)分別由推定的0RF1-26編碼。這些ORF屬于并構(gòu)成淺灰霉素生物合成基因簇。基于序列分析和同源性搜索,本發(fā)明人成功地鑒定淺灰霉素生物合成基因簇,成功地鑒定所述基因簇中特異性的推定的0RF,并成功地將鑒定的ORF分配于特定的蛋白質(zhì)功能和/或分配于編碼已知或假定的蛋白質(zhì)的特定的同源核苷酸序列。
[0051]本發(fā)明所包含的蛋白質(zhì)涵蓋由SEQ ID NO: I的序列的鏈霉菌DSM26643的淺灰霉素生物合成基因簇所編碼的SEQ ID No:2-27的蛋白質(zhì),并涵蓋其存在于產(chǎn)生(甲基)淺灰霉素的其為直向同源物或同源物的其他鏈霉菌屬菌種和菌株和非鏈霉菌屬菌種中的蛋白質(zhì),由此這些直向同源物或同源物與鏈霉菌DSM26643的SEQ ID No:2-27的蛋白質(zhì)具有相同的功能。優(yōu)選地,其直向同源物或同源物例如通過添加、缺失、取代和/或插入氨基酸而與SEQ IDNo: 2-27的序列不同,并與SEQ ID No: 2-27具有高于50 %,高于60 %,高于70 %,優(yōu)選高于80 %,更優(yōu)選高于85 %,甚至更優(yōu)選高于90 %,甚至更優(yōu)選高于95 %,最優(yōu)選高于97 %的序列同一性,和/或具有SEQ ID No :2-27的蛋白質(zhì)活性的5%以上,10%以上,20%以上,30%以上,40%以上,50%以上,60%以上,70%以上,80%以上,90%以上,95%以上,97%以上,或100%以上,例如150%,200%,300%,400%^; 500%以上的酶活性。
[0052]在本發(fā)明的語境中,包含于本發(fā)明的SEQ ID No:2-27的蛋白質(zhì)的天然或非天然存在的變體是功能活性蛋白質(zhì),因為其保持SEQ ID No:2-27的參照蛋白質(zhì)的生物功能,即,涉及在自然條件下牽涉參照蛋白質(zhì)的反應(yīng)(在非天然變體的情況下,參照蛋白質(zhì)的生物功能),如公開了 SEQ ID No:2-27的蛋白質(zhì)的功能的相關(guān)章節(jié)中所提及的,并如本申請所定義的可以取代SEQ ID No:2-27的蛋白質(zhì)。
[0053]SEQ ID No:2-27的蛋白質(zhì)的非天然存在的變體和其天然存在的變體可通過有限數(shù)目的氨基酸缺失、插入和/或取代獲得,特別是缺失、插入和/或取代,例如最多10、9、8、7、
6、5、4、3、2或I個氨基酸由此獲得各野生型蛋白質(zhì)例如如上所述關(guān)于SEQ ID No:2-27的活性或序列同一性。[0054]所述變體可能是經(jīng)修飾的蛋白質(zhì)或者是包含其他組分的經(jīng)修飾的蛋白質(zhì)的變體。因此,所述變體可能是具有天然存在的SEQ IDNo:2-27的蛋白質(zhì)所包含的域的分子,或者本申請所詳細論述的變體以及至少一種附加組分。在一個優(yōu)選的實施方案中,所述變體可能是融合蛋白,其包含(i)SEQ IDNo:2-27的蛋白質(zhì)或功能活性變體,和(ii)其他的蛋白質(zhì)或肽組分。例如,所述蛋白質(zhì)可與標記偶聯(lián),如用于純化目的的標簽(例如6His (或HexaHis)標簽、Strep標簽、HA標簽、c-myc標簽或谷胱甘肽S-轉(zhuǎn)移酶(GST)標簽)。如果需要例如高度純化的SEQ ID No:2-27的蛋白質(zhì)或變體,可使用兩個或多個標記(例如上述標記或標簽的組合)。在此種情況下,所述蛋白質(zhì)在兩個或以上的分離層析步驟中純化,在每一種情況下使用第一標簽然后是第二標簽的親和力。此種雙重或串連標簽的實例為GST-His-標簽(谷胱甘肽-S-轉(zhuǎn)移酶融合于多組氨酸-標簽)、6XHis-Str印-標簽出個組氨酸殘基融合于Str印-標簽)、6xHis-標簽100-標簽(6個組氨酸殘基融合于哺乳動物MAP-激酶2的12-氨基酸蛋白)、8XHis-HA-標簽(8個組氨酸殘基融合于血凝素-表位-標簽)、His-MBP(His-標簽融合于麥芽糖-結(jié)合蛋白、FLAG-HA-標簽(FLAG-標簽融合于血凝素-表位-標簽),以及FLAG-Strep-標簽??墒褂盟鰳擞泚頇z測經(jīng)標簽標記的蛋白質(zhì),其中可使用特異性的抗體。合適的抗體包括抗-HA (例如12CA5或3F10),抗_6His、抗-c-myc和抗-GST。此外,所述蛋白質(zhì)可以連接于不同類別的標記,如熒光標記如綠色熒光蛋白,結(jié)合蛋白如抗生蛋白鏈菌素(steptavidin),—種或多種的小分子染料如Cy染料,或者放射性標記,其允許本發(fā)明所包含的蛋白質(zhì)被檢測出來。在另一個實施方案中,SEQ ID No:2-27的蛋白質(zhì)可為融合蛋白的部分,其中第二部分可用于檢測,如具有酶促活性的蛋白質(zhì)組分。
[0055]在本發(fā)明的另一個實施方案中,SEQ ID No:2-27的蛋白質(zhì)的變體可能是片段,其中,所述片段仍是功能活性的。這可包括SEQ ID No:2-27的蛋白質(zhì)或其如上詳述的具有短的內(nèi)部和/或C-和/或N-末端缺失的變體(例如,在所述變體內(nèi)和/或在C-和/或N-末端缺失最多 20、19、18、17、16、15、14、13、12、11、10、9、8、7、65、4、3、2 或 I 個氨基酸,或者總共缺失5 %、10 %、20 %、30 %、40 %、50 %、60 %、70 %或上述數(shù)值之間的任意數(shù)值的氨基酸)。此外,如以上對SEQ ID NO:2-27的蛋白質(zhì)詳述的,所述片段可被進一步修飾。
[0056]可替換地或此外,上述SEQ ID No:2-27的蛋白質(zhì)或其變體可包含一個或多個氨基酸取代。然而,優(yōu)選半保守尤其是保守氨基酸取代,其中用化學(xué)上相關(guān)的氨基酸取代某種氨基酸。典型地取代是在脂族氨基酸之間、具有脂族羥基側(cè)鏈的氨基酸之間、具有酸性殘基的氨基酸之間、酰胺衍生物之間、具有堿性殘基的氨基酸之間、或具有芳族殘基的氨基酸之間的。典型的半保守和保守取代為:
[0057]
【權(quán)利要求】
1.核酸,其包含選自下述的至少一種核酸: (a)核酸,其包含SEQID NO:1中所包含的、編碼SEQ ID No:2_27的蛋白質(zhì)的開放閱讀框(ORFs) 1-26中的至少一個ORF或其變體或片段,由此所述變體或片段編碼SEQ ID No:2-27的蛋白質(zhì)的功能活性變體或片段, (b)核酸,其編碼SEQID No:2-27的蛋白質(zhì)中的至少一種蛋白質(zhì)或其功能活性變體或片段, (c)核酸,其編碼氨基酸序列與(a)或(b)的核酸所編碼的蛋白質(zhì)或片段至少70% ,80% ,90%,95%或 97% 同一的蛋白質(zhì), (d)核酸,其在嚴格條件下與(a)-(c)的核酸 雜交, (e)核酸,其在嚴格條件下與(a)-(d)的核酸雜交,且由長10-50個核苷酸組成,或 (f)核酸,其與(a)-(f)的核酸互補。
2.權(quán)利要求1的核酸,其中所述核酸包含至少2個0RF,優(yōu)選至少3個0RF,所述ORF編碼SEQ ID No:2-27的任意蛋白質(zhì),或如權(quán)利要求1的(a)-(d)項中所述其功能活性變體或片段。
3.權(quán)利要求1或2的核酸,其中所述核酸包含分別編碼SEQID NO: 19、20、21和22的蛋白質(zhì)的、0RF18、19、20和21中的至少一個0RF,或如權(quán)利要求1的(a)-(d)項中所述其功能活性變體或片段。
4.權(quán)利要求1-3中任一項的核酸,其中所述核酸包含分別編碼SEQID NO: 9、16和17的蛋白質(zhì)的0RF8、15和16中的至少一個0RF,或如權(quán)利要求1的(a)-(d)項中所述其功能活性變體或片段。
5.權(quán)利要求1-4中任一項的核酸,其包含下述的淺灰霉素生物合成基因簇或由下述的淺灰霉素生物合成基因簇組成,所述淺灰霉素生物合成基因簇具有SEQ ID NO:1的序列或具有SEQ ID NO:1的變體序列,所述SEQ ID NO:1的變體序列攜帶0RF1-26中至少一個ORF的變體或片段,由此所述變體或片段編碼SEQ ID No:2-27的蛋白質(zhì)的功能活性變體或片段。
6.表達載體,其包含權(quán)利要求1-5中任一項的核酸。
7.宿主細胞,其被權(quán)利要求6的表達載體轉(zhuǎn)化。
8.蛋白質(zhì),其包含至少一個氨基酸序列,該氨基酸序列選自SEQID No:2-27或其功能活性變體或片段、或由權(quán)利要求1-5中任一項的核酸所編碼。
9.抗體,其特異性地針對權(quán)利要求8中的至少一種蛋白質(zhì)或其功能活性變體或片段。
10.權(quán)利要求1到5中任一項的核酸,權(quán)利要求6的表達載體,權(quán)利要求7的宿主細胞或權(quán)利要求8的蛋白質(zhì),特別是SEQ ID NOs: 9、16和17中的至少一種蛋白質(zhì),用于淺灰霉素和/或甲基淺灰霉素的產(chǎn)生的用途。
11.權(quán)利要求3的核酸,包含權(quán)利要求3的核酸的權(quán)利要求6的表達載體,由所述表達載體轉(zhuǎn)化的權(quán)利要求7的宿主細胞,或SEQ ID NOs: 19,20,21和22中的至少一種蛋白質(zhì),用于L-反式-4-甲基脯氨酸的產(chǎn)生的用途。
12.產(chǎn)生權(quán)利要求8中的至少一種蛋白質(zhì)或其功能活性變體或片段的方法,所述方法包括: a)表達權(quán)利要求1-5中任一項的核酸,和 b)任選地,分離所述蛋白質(zhì)或其功能活性變體或片段。
13.確定調(diào)節(jié)淺灰霉素和/和甲基淺灰霉素的產(chǎn)生的、ORF1-26的變體的方法,所述ORF1-26包含于SEQ ID NO: 1、編碼SEQ ID No:2-27的蛋白質(zhì)或SEQ ID No:2-27的蛋白質(zhì)中的蛋白質(zhì),所述方法包括: a)產(chǎn)生0RF1-26中任意ORF的變體, b)將所述變體表達為蛋白質(zhì), c)允許使用b)的蛋白質(zhì)產(chǎn)生淺灰霉素和/或甲基淺灰霉素或其衍生物,和 dl)確定淺灰霉素和/或甲基淺灰霉素的量, 其中淺灰霉素和/或甲基淺灰霉素的量與不存在b)的蛋白質(zhì)時產(chǎn)生的量相比增加但存在所述蛋白質(zhì)的相應(yīng)非變體(invariant)形式,這指示所述變體能夠增加淺灰霉素和/或甲基淺灰霉素的產(chǎn)生,或 d2)確定所述淺灰霉素和/或甲基淺灰霉素的衍生物的抗生素活性, 其中抗生素活性與不存在b)的蛋白質(zhì)時的抗生素活性相比增加,但存在所述蛋白質(zhì)的相應(yīng)非變體形式,這指示所述變體能夠產(chǎn)生具有增加的抗生素活性的淺灰霉素和/或甲基淺灰霉素的衍生物, 而且其中所述衍生物在氨基酸的組成上區(qū)別于淺灰霉素和/或甲基淺灰霉素,并顯示相對于淺灰霉素和/或甲基淺灰霉素增強的抗生素活性。
14.確定增強L-反式- -甲基脯氨酸的產(chǎn)生的、0RF1-26的變體的方法,所述0RF1-26包含于SEQ ID NO: 1、編碼SEQ ID No:2_27的蛋白質(zhì)或SEQ ID No:2_27的蛋白質(zhì)中的蛋白質(zhì),所述方法包括: a)產(chǎn)生0RF1-26中任意ORF的變體, b)將所述變體表達為蛋白質(zhì), c)允許使用b)的蛋白質(zhì)產(chǎn)生L-反式-4-甲基脯氨酸,和 d)確定L-反式-4-甲基脯氨酸的量, 其中,L-反式-4-甲基脯氨酸的量與不存在b)的蛋白質(zhì)時產(chǎn)生的量相比增加但存在所述蛋白質(zhì)的相應(yīng)非變體形式,這指示所述變體能夠增加L-反式-4-甲基脯氨酸的產(chǎn)生。
15.產(chǎn)生淺灰霉素和/或甲基淺灰霉素的方法,所述方法包括: a)提供權(quán)利要求8的至少一種蛋白質(zhì)或其功能活性變體或片段,或提供可由權(quán)利要求13或14的方法獲得的變體蛋白,和 b)將a)的至少一種蛋白質(zhì)與L-N-甲基纈氨酸、L-亮氨酸、L-N-甲基蘇氨酸、L-脯氨酸、L-N-甲基亮氨酸和甘氨酸一起溫育,以產(chǎn)生淺灰霉素和/或甲基淺灰霉素。
16.產(chǎn)生L-反式-4-甲基脯氨酸的方法,所述方法包括: a)提供權(quán)利要求8的至少一種蛋白質(zhì)或其功能活性變體或片段,或提供可由權(quán)利要求14的方法獲得的變體蛋白,和 b)將a)的至少一種蛋白質(zhì)與L-亮氨酸、5-羥基亮氨酸、Y-甲基谷氨酸Y-半醛和/或3-甲基-Λ L吡咯啉-5-羧酸一起溫育,以產(chǎn)生L-反式-4-甲基脯氨酸。
17.鏈霉菌(Streptomyces)DSM22643。
【文檔編號】C07K14/36GK104024272SQ201280061301
【公開日】2014年9月3日 申請日期:2012年10月11日 優(yōu)先權(quán)日:2011年10月12日
【發(fā)明者】M.布洛恩斯特拉普, C.凱尼格, L.托蒂, J.溫克, W.勒希納, J.加森休伯, R.米勒, S.溫策爾, T.賓茲, C.沃爾茲 申請人:賽諾菲