最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

基于平均測試代價的一維尺度決策樹構造算法的制作方法

文檔序號:11063701閱讀:來源:國知局

技術特征:

1.基于平均測試代價的一維尺度決策樹構造算法,該算法涉及涉及智能服務、機器學習領域,其特征是:該算法的具體實施方案如下:通過原訓練示例利用EP準則得到新背景訓練集,在每項測試成本、經(jīng)濟因子和完整闊值已知的情況下,綜合考慮和的值依次選擇屬性結點,再利用分裂抽象屬性的完整因子與給定作比較,來得到相應的分支,在決策樹生成過程中,如遇到在一個子集或分支結點中的所有樣例都屬于相同類別或是在一個子集或分支結點中沒有待分裂的候選抽象屬性,即基于平均測試代價的一維尺度決策樹模型生成。

2.根據(jù)權利要求1所述的基于平均測試代價的一維尺度決策樹構造算法,其特征是:該算法的具體實施步驟如下:

步驟1:定義L為類的種類,其中數(shù)為n,Li表示第i類,上述:根據(jù)EP結點類的分類準則得到新背景訓練樣本集ISA

步驟2:專家根據(jù)實際情況,給出每項屬性進行的測試成本;

步驟3:用戶自定義參數(shù)經(jīng)濟因子w和完整闊值ct,它們的范圍都是[0,1];

步驟4:根據(jù)信息增益與ICF(信息成本函數(shù))遍歷輸入的新背景訓練樣本集的候選屬性列表,計算每個候選屬性,得出當前選擇屬性;

步驟4.1 :遍歷所有ISA新背景訓練樣本集的屬性,計算每個屬性的ICF,并選擇ICF值最小的屬性作為平均測試代價的一維尺度決策樹的根結點;

步驟5:依據(jù)ISA層次結構歸納準則和抽象值的完整因子c與完整因子闊值的大小ct比較結果,作為基于測試代價的一維尺度決策樹的擴展結點;

步驟6:根據(jù)最優(yōu)分裂屬性選擇因子ct候選的抽象屬性得到相應的每一個屬性和觀測值,在結點下生成相應的分支;每個分支的樣本集合為所有觀測值等于對應分支的新背景訓練屬性樣本,這樣的屬性集合個數(shù)為I;

步驟7:依次為每個抽象分裂屬性的每個屬性值產(chǎn)生一個分支類,得到相應于該分支屬性值的子集,對各子集遞歸調用本算法,即重回步驟4.1,用同樣的方法將樣本子集分割,產(chǎn)生分支的分支,同時獲得相應子集的子集,直到滿足以下兩條件之一則終止建樹過程,即:

條件1:在一個子集或分支結點中所有樣例屬性都為同一抽象屬性類別,又稱之為觀測值;

條件2:在一個子集或分支結點中分裂屬性為抽象屬性的集合為空。

3.根據(jù)權利要求2所述的基于平均測試代價的一維尺度決策樹構造算法,其特征是: 所述步驟1中對于多類標號的原數(shù)據(jù)集都可以轉化為兩類情況,基于結點的歸納準則得出層次結構為:

其中ISA為新的背景樣本抽象屬性,記為,為正例個數(shù),為反例個數(shù),抽象屬性,如性別中男女;根據(jù)類的種類分類規(guī)則得到新的訓練樣本集,即為ISA背景訓練樣本集;新背景訓練樣本集葉子結點發(fā)生了變化。

4.根據(jù)權利要求2所述的基于平均測試代價的一維尺度決策樹構造算法,其特征是: 所述步驟4中,候選屬性的屬性選擇因子為:

其中為總的數(shù)據(jù)信息,為不可取數(shù)據(jù)信息;

這里為屬性i信息增量,w為檢驗經(jīng)濟標準一個變量,costi為屬性i的測試成本,costi+1>1,當cost=0時,f(cost)有意義:ICF是信息成本函數(shù),用來表征每一屬性的選擇。

當前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1