本發(fā)明涉及大數(shù)據(jù)處理,具體涉及一種anca相關性血管炎的預后輔助預測方法及系統(tǒng)。
背景技術:
1、anca相關性血管炎(aav)是一種以小血管壞死性炎癥為主要表現(xiàn)的自身免疫性疾病,它在臨床上造成不可逆的器官損害,腎臟是最常見的受累部位之一,導致死亡率增高。未經(jīng)治療的腎臟受累患者可迅速發(fā)展成為終末期腎病,在某些情況下需要腎臟替代治療,包括透析治療或腎移植。因此,aav患者的遠期預后不理想。盡管診斷和治療水平不斷提高,使aav成為慢性復發(fā)性疾病,但仍有相當比例的患者急性起病,預后較差。一項關于aav預后的薈萃分析證實,與普通人群相比,aav的死亡風險至少高出2.7倍。因此,早期正確識別危險因素對評估其病情和改善aav具有重要意義。
2、現(xiàn)有技術中,針對anca相關性血管炎的預測過程相對復雜,部分研究中,針對大量病例進行采用了多元logistic回歸模型證實心血管疾病、惡性腫瘤和腎性死亡可能是aav導致過早死亡的危險因素。同時,另有l(wèi)ogistic回歸研究表明,腎功能、疾病活動狀態(tài)和年齡是aav預后較差的重要預測因素。
3、但是,上述的判斷過程主要是基于多元logistic回歸模型實現(xiàn)。首先該模型對多重共線性數(shù)據(jù)、異常值較為敏感,準確率并不是很高;其次,形式簡單很難去擬合數(shù)據(jù)的真實分布;并且缺乏對于生存期的研究,難以準確分析患者臨床資料對預后的影響。目前aav患者發(fā)生死亡、腫瘤、腎臟替代治療結局的預測模型存在納入病例標準不同、預后結局類型較少和隨訪時間過短等問題,使得模型信息不夠完整,導致aav人群發(fā)生不良結局的預測因素(包括死亡、惡性腫瘤、腎臟替代治療)尚未得到充分的研究。
技術實現(xiàn)思路
1、針對現(xiàn)有技術中存在的上述問題,現(xiàn)提供一種anca相關性血管炎的預后輔助預測方法;
2、另一方面,還提供用于實施該預后輔助預測方法的預后輔助預測系統(tǒng)。
3、具體技術方案如下:
4、一種anca相關性血管炎的預后輔助預測方法,包括:
5、步驟s1:對預后患者采集電子病歷信息,自所述病歷信息中提取臨床數(shù)據(jù)字段;
6、步驟s2:對所述臨床數(shù)據(jù)字段進行分類,以得到關聯(lián)于替代治療的第一類型字段和關聯(lián)于死亡率的第二類型字段;
7、步驟s3:根據(jù)所述第一類型字段處理得到替代治療參數(shù),以及根據(jù)所述第二類型字段處理得到死亡率預測參數(shù)。
8、另一方面,于執(zhí)行所述步驟s1之前,還包括一個建模過程,所述建模過程包括:
9、步驟a1:對入組患者采集原始臨床數(shù)據(jù);
10、步驟a2:自所述原始臨床數(shù)據(jù)中查找得到預后結局字段,依照所述預后結局字段對所述入組患者進行分組形成預后分組;
11、所述預后分組包括高危組,所述高危組包括腫瘤、腎臟替代治療和死亡;
12、步驟a3:針對所述高危組分別分析所述原始臨床數(shù)據(jù)中每個字段所對應的數(shù)據(jù)特征的數(shù)據(jù)特征差異;
13、步驟a4:針對所述數(shù)據(jù)特征差異構建假設檢驗;
14、步驟a5:基于所述檢驗假設,針對腫瘤結局對所述原始臨床數(shù)據(jù)中每個字段進行分析,以預測得到關聯(lián)于所述腫瘤結局的第一字段組,基于正向篩選得到關聯(lián)于所述腎臟替代治療的第二字段組,以及,基于單變量和多變量cox回歸分析篩選得到關聯(lián)于死亡的第三字段組;
15、步驟a6:根據(jù)所述第一字段組、所述第二字段組和所述第三字段組生成所述第一類型字段和所述第二類型字段。
16、另一方面,所述臨床數(shù)據(jù)字段包括器官受累情況、bvas評分、血清egfr、年齡血清和總補體水平;
17、所述步驟s1包括:
18、步驟s11:針對所述預后患者采集所述電子病歷信息;
19、步驟s12:針對所述電子病歷信息,分別采用所述臨床數(shù)據(jù)字段依次進行查找以獲取病歷字段;
20、步驟s13:針對所述病歷字段進行處理以得到所述臨床數(shù)據(jù)字段。
21、另一方面,所述第一類型字段包括:首次診斷時累及心臟、首次診斷時累及腎臟臟器、bvas評分、血清egfr和總補體水平;
22、所述第二類型字段包括血清egfr、年齡;
23、所述步驟s2包括:
24、步驟s21:自所述臨床數(shù)據(jù)字段中查找器官受累情況字段,自所述器官受累情況中篩選得到所述首次診斷時累及心臟和所述首次診斷時累及腎臟臟器;
25、步驟s22:自所述臨床數(shù)據(jù)字段中查找所述bvas評分、所述血清egfr、所述年齡和所述總補體水平;
26、步驟s23:將所述首次診斷時累及心臟、所述首次診斷時累及腎臟臟器、所述bvas評分、所述血清egfr和所述總補體水平劃分至所述第一類型字段,將所述血清egfr和所述年齡劃分至所述第二類型字段。
27、另一方面,所述步驟s3包括:
28、步驟s31:依照所述第一類型字段查找得到第一評分量表,以及,根據(jù)所述第二類型字段查找得到第二評分量表;
29、步驟s32:根據(jù)所述第一評分量表對所述第一類型字段進行處理,得到所述替代治療參數(shù),以及,根據(jù)所述第二評分量表對所述第二類型字段進行處理得到所述死亡參數(shù)。
30、一種anca相關性血管炎的預后輔助預測系統(tǒng),用于實施上述的預后輔助預測方法;
31、包括:
32、數(shù)據(jù)提取模塊,所述數(shù)據(jù)提取模塊對預后患者采集電子病歷信息,自所述病歷信息中提取臨床數(shù)據(jù)字段;
33、數(shù)據(jù)分類模塊,所述數(shù)據(jù)分類模塊連接所述數(shù)據(jù)提取模塊,所述數(shù)據(jù)分類模塊對所述臨床數(shù)據(jù)字段進行分類,以得到關聯(lián)于替代治療的第一類型字段和關聯(lián)于死亡率的第二類型字段;
34、參數(shù)計算模塊,所述參數(shù)計算模塊連接所述數(shù)據(jù)分類模塊,所述參數(shù)計算模塊根據(jù)所述第一類型字段處理得到替代治療參數(shù),以及根據(jù)所述第二類型字段處理得到死亡率預測參數(shù)。
35、另一方面,還包括建模模塊;
36、所述建模模塊包括:
37、樣本采集模塊,所述樣本采集模塊對入組患者采集原始臨床數(shù)據(jù);
38、預處理模塊,所述預處理模塊連接所述樣本采集模塊,所述預處理模塊自所述原始臨床數(shù)據(jù)中查找得到預后結局字段,依照所述預后結局字段對所述入組患者進行分組形成預后分組;
39、所述預后分組包括高危組,所述高危組包括腫瘤、腎臟替代治療和死亡;
40、特征提取模塊,所述特征提取模塊連接所述預處理模塊,所述特征提取模塊針對所述高危組分別分析所述原始臨床數(shù)據(jù)中每個字段所對應的數(shù)據(jù)特征的數(shù)據(jù)特征差異;
41、假設構建模塊,所述假設構建模塊連接所述特征提取模塊,所述假設構架模塊針對所述數(shù)據(jù)特征差異構建假設檢驗;
42、樣本分析模塊,所述樣本分析模塊連接所述假設構建模塊,所述樣本分析模塊基于所述檢驗假設,針對腫瘤結局對所述原始臨床數(shù)據(jù)中每個字段進行分析,以預測得到關聯(lián)于所述腫瘤結局的第一字段組,基于正向篩選得到關聯(lián)于所述腎臟替代治療的第二字段組,以及,基于單變量和多變量cox回歸分析篩選得到關聯(lián)于死亡的第三字段組;
43、樣本輸出模塊,所述樣本輸出模塊連接所述樣本分析模塊,所述樣本輸出模塊根據(jù)所述第一字段組、所述第二字段組和所述第三字段組生成所述第一類型字段和所述第二類型字段。
44、另一方面,所述臨床數(shù)據(jù)字段包括器官受累情況、bvas評分、血清egfr、年齡血清和總補體水平;
45、所述數(shù)據(jù)提取模塊包括:
46、病歷采集模塊,所述病歷采集模塊針對所述預后患者采集所述電子病歷信息;
47、字段檢索模塊,所述字段檢索模塊連接所述病歷采集模塊,所述字段檢索模塊針對所述電子病歷信息,分別采用所述臨床數(shù)據(jù)字段依次進行查找以獲取病歷字段;
48、字段處理模塊,所述字段處理模塊連接所述字段檢索模塊,所述字段處理模塊針對所述病歷字段進行處理以得到所述臨床數(shù)據(jù)字段。
49、另一方面,所述第一類型字段包括:首次診斷時累及心臟、首次診斷時累及腎臟臟器、bvas評分、血清egfr和總補體水平;
50、所述第二類型字段包括血清egfr、年齡;
51、所述數(shù)據(jù)分類模塊包括:
52、第一查找模塊,所述第一查找模塊自所述臨床數(shù)據(jù)字段中查找器官受累情況字段,自所述器官受累情況中篩選得到所述首次診斷時累及心臟和所述首次診斷時累及腎臟臟器;
53、第二查找模塊,所述第二查找模塊連接所述第一查找模塊,所述第二查找模塊自所述臨床數(shù)據(jù)字段中查找所述bvas評分、所述血清egfr、所述年齡和所述總補體水平;
54、字段劃分模塊,所述字段劃分模塊連接所述第二查找模塊,所述字段劃分模塊將所述首次診斷時累及心臟、所述首次診斷時累及腎臟臟器、所述bvas評分、所述血清egfr和所述總補體水平劃分至所述第一類型字段,將所述血清egfr和所述年齡劃分至所述第二類型字段。
55、另一方面,所述參數(shù)計算模塊包括:
56、量表查找模塊,所述量表查找模塊依照所述第一類型字段查找得到第一評分量表,以及,根據(jù)所述第二類型字段查找得到第二評分量表;
57、參數(shù)計算模塊,所述參數(shù)計算模塊連接所述量表查找模塊,所述參數(shù)計算模塊根據(jù)所述第一評分量表對所述第一類型字段進行處理,得到所述替代治療參數(shù),以及,根據(jù)所述第二評分量表對所述第二類型字段進行處理得到所述死亡參數(shù)。
58、上述技術方案具有如下優(yōu)點或有益效果:
59、針對現(xiàn)有技術中對aav預后的判斷過程相對復雜、不夠準確的問題,本方案中,對不同預后結局(腫瘤、腎臟替代治療、死亡)和生存時間為因變量進行了相關分析,從而確定了關聯(lián)于替代治療和死亡這兩種典型預后結局的相關指標。則在實際的預后分析過程中,可自動抽取該部分指標并進行處理,從而提供給醫(yī)生相關的參考評分。