本發(fā)明屬于診斷標志物篩選,具體涉及一種診斷標志物組合、卵巢子宮內(nèi)膜異位癥預測模型的構建方法和應用。
背景技術:
1、子宮內(nèi)膜異位癥是一種常見的雌激素依賴的慢性炎癥婦科疾病,通常累及卵巢、子宮韌帶、直腸、膀胱等(giudice?lc.clinical?practice.endometriosis.n?engl?j?med2010,362(25):2389-2398.)。其突出臨床表現(xiàn)為慢性盆腔痛、痛經(jīng)、性交困難及不孕,嚴重影響了女性的工作和日常生活(vercellini?p,vigano?p,somigliana?e,fedelel.endometriosis:pathogenesis?and?treatment.nat?rev?endocrinol?2014,10(5):261-275.)。
2、尤其是異位到卵巢的子宮內(nèi)膜異位癥(ovarian?endometriosis,ove),是卵巢癌發(fā)生的高危因素之一(vercellini?p,vigano?p,somigliana?e,fedele?l.endometriosis:pathogenesis?and?treatment.nat?rev?endocrinol?2014,10(5):261-275.)。因此ove早診斷早治療對于女性健康生活異常重要。然而盡管ove延遲診斷的普遍性卻不容樂觀。研究表明ove通常會延遲8-10年才被發(fā)現(xiàn)(hudelist?g,fritzer?n,thomas?a,niehues?c,oppelt?p,haas?d,tammaa?a,salzer?h.diagnostic?delay?for?endometriosis?inaustria?and?germany:causes?and?possible?consequences.hum?reprod?2012,27(12):3412-3416.)。而延遲診斷不僅直接影響到疾病治療與預后,還可能增加ove復發(fā)的風險。因此,ove的診斷對于疾病治療與提升患者生命質(zhì)量均具有重要意義。目前,可結合臨床表現(xiàn)、體征及影像學檢查和生物標志物等檢查進行ove的臨床診斷(giudice?lc,kaolc.endometriosis.lancet?2004,364(9447):1789-1799.),但ove的臨床表現(xiàn)不典型、婦科檢查以及超聲檢查和磁共振成像(mri)的結果受醫(yī)師的經(jīng)驗及技巧影響極大。此外,目前尚無一種能準確診斷ove的生物標志物。雖然血清ca125雖與ove存在一定的相關性,其特異性和敏感性均有限,不是ove的特異性指標。該指標檢測對于ove的診斷意義有限(hirsch?m,duffy?j,davis?cj,nieves?plana?m,khan?ks,international?collaboration?toharmonise?o,measures?for?e.diagnostic?accuracy?of?cancer?antigen?125forendometriosis:a?systematic?review?and?meta-analysis.bjog?2016,123(11):1761-1768.),其水平升高更多見于重度ove、子宮腺肌病者、盆腔存在明顯炎癥以及合并ove囊腫破裂者。臨床診斷對于ove的早期干預和治療具有非常重要的意義,而生物標志物作為一種不受醫(yī)師經(jīng)驗、技巧影響的客觀指標(df,flores?i,waelkens?e,d'hooghe?t.noninvasivediagnosis?of?endometriosis:review?of?current?peripheral?blood?and?endometrialbiomarkers.best?pract?res?clin?obstet?gynaecol?2018,50:72-83.),因此急需篩選可輔助提升ove早期無創(chuàng)診斷的新指標。
3、代謝組學作為近年來興起的研究領域,通過全面分析生物體內(nèi)小分子代謝物的變化,為疾病機制的解析和生物標志物的挖掘提供了強有力的工具。該技術能夠捕捉到生物體在疾病狀態(tài)下代謝途徑的微妙變化,為理解ove提供了新的視角。在此背景下,機器學習技術的引入為代謝組學數(shù)據(jù)的深度挖掘提供了可能。特別是lasso方法,作為一種先進的特征選擇技術,能夠在高維數(shù)據(jù)中有效篩選出最具預測價值的特征,同時處理數(shù)據(jù)中的復共線性問題,提高模型的穩(wěn)定性和準確性。通過結合代謝組學與lasso機器學習算法,本發(fā)明旨在從復雜的代謝物數(shù)據(jù)中篩選出關鍵代謝生物標志物。
技術實現(xiàn)思路
1、發(fā)明目的:本發(fā)明所要解決的技術問題是提供卵巢子宮內(nèi)膜異位癥診斷標志物及其篩選方法和應用。
2、為了實現(xiàn)上述目的,本發(fā)明采用以下技術方案:本發(fā)明提供了一種診斷標志物組合,所述標志物組合包括n-乙酰-天冬氨酸、乳酸、(r)-3-羥基丁酸、馬尿酸、吲哚-3-乙酰纈氨酸和抗壞血酸。
3、本發(fā)明還提供了所述的診斷標志物組合在制備卵巢子宮內(nèi)膜異位癥預測和/或診斷產(chǎn)品中的應用。
4、本發(fā)明還提供了所述的診斷標志物組合在構建卵巢子宮內(nèi)膜異位癥預測模型中的應用。
5、本發(fā)明還提供了一種卵巢子宮內(nèi)膜異位癥預測模型的構建方法,包括如下步驟:
6、1)通過非靶代謝組學篩選比對卵巢子宮內(nèi)膜異位癥患者和正常健康女性的血清數(shù)據(jù)比對,通過auc>0.7的基礎篩選出差異顯著的代謝物;
7、2)進一步對差異顯著的代謝物進行權重基因共表達網(wǎng)絡分析,根據(jù)代謝物的不同表達模式將差異顯著的代謝物分別與ove臨床特征進行相關聯(lián),篩選與ove臨床特征顯著相關的參數(shù);
8、3)將auc>0.7和wgcna中的black?model取交集,進一步確定特異性差異的代謝物;
9、4)擴大樣本量進行靶向代謝組學驗證,并進一步通過多種機器學習方法驗證特異性差異的代謝物,進一步通過lasso降維,最終篩選得到卵巢子宮內(nèi)膜異位癥預測的特征參數(shù)并構建預測模型;
10、所述預測模型的計算公式為:
11、
12、其中,n=卵巢子宮內(nèi)膜異位癥預測的特征參數(shù)的數(shù)量,expi表示卵巢子宮內(nèi)膜異位癥預測的特征參數(shù)的表達值,βi表示卵巢子宮內(nèi)膜異位癥預測的特征參數(shù)的回歸系數(shù)。
13、其中,步驟2)中的與ove臨床特征顯著相關的參數(shù)包括痛經(jīng)和ca125。
14、其中,步驟3)中特異性差異的代謝物包括沒食子酸、n-乙酰-天門冬氨酸、天冬氨酸、丙氨酸、乳酸、異嗪皮啶、精氨酸、n-乙酰-dl-色氨酸、(r)-3-羥基丁酸、奎寧酸、馬尿酸、4-甲基傘形基硫酸鉀鹽、鞣花酸、秦皮素、厚樸酚、麥斯明、β-肌酐、吲哚-3-乙酰纈氨酸、抗壞血酸、褪黑素以及癸二酸。
15、其中,步驟4)中的多種機器學習方法包括卷積神經(jīng)網(wǎng)絡、樸素貝葉斯算法、隨機森林算法、支持向量機算法和lasso-logit回歸法中的一種或幾種。
16、其中,步驟4)中的卵巢子宮內(nèi)膜異位癥預測的特征參數(shù)包括n-乙酰-天冬氨酸、乳酸、(r)-3-羥基丁酸、馬尿酸、吲哚-3-乙酰纈氨酸、抗壞血酸、2個臨床指標痛經(jīng)和ca125。
17、其中,步驟4)中的預測模型的公式為:total?score=22.471×n-乙酰-天冬氨酸+0.011×乳酸+0.008×(r)-3-羥基丁酸-0.333×馬尿酸+0.204×吲哚-3-乙酰纈氨酸-0.685×抗壞血酸+13.601×痛經(jīng)+17.728×ca125+141.159,total?score的閾值為170.17,當個體患者評分中高于170.17被定義為患ove的高風險人群,低于170.17被定義為患ove的低風險人群。
18、本發(fā)明還提供了一種預測ove風險的診斷標志物試劑盒,其含有所述的診斷標志物組合。
19、本發(fā)明通過前期對ove隊列中34例ove和34例正常健康女性的血清使用高效液相色譜質(zhì)譜聯(lián)用技術行非靶代謝組學篩選,經(jīng)過數(shù)據(jù)庫比對,總共篩選出56個差異顯著的代謝物,進一步通過auc>0.7的基礎上,再輔助wgcna篩選,最后選出21個代謝物;擴大樣本(107例ove和130例hc)進行靶向代謝組學,進一步通過5種機器學習方法顯示,這21個代謝物在hc和ove中差異明顯,進一步通過lasso降維,共篩選到6個代謝物(n-乙酰-天冬氨酸、乳酸、(r)-3-羥基丁酸、馬尿酸、吲哚-3-乙酰纈氨酸和抗壞血酸)和2個臨床指標(痛經(jīng)和ca125)組成的預測模型。
20、有益效果:與現(xiàn)有技術相比,本發(fā)明具備以下優(yōu)點:本發(fā)明采用血清代謝組學技術以及人工智能數(shù)據(jù)分析技術構建ove患者發(fā)生風險的預測模型,本發(fā)明診斷標志物篩選方法可操作性強,模型構建方法簡單,所得診斷模型效果良好,僅通過取血就能進行診斷,方便快捷無內(nèi)創(chuàng),對于預測ove發(fā)生風險靈敏度高、特異性好,具有很好的臨床應用價值。本發(fā)明還提供了一種含有上述適合于預測ove風險的診斷標志物試劑盒,可用于預測ove發(fā)生的風險。