一種基于最近鄰的遙感影像單類信息提取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及的是遙感影像特定類別提取技術(shù)領(lǐng)域,具體涉及一種基于最近鄰的遙 感影像單類息提取方法。
【背景技術(shù)】
[0002] 影像分類是遙感科學(xué)與技術(shù)最重要的應(yīng)用之一,影像分類的結(jié)果用于產(chǎn)生地物類 別專題圖。在有些應(yīng)用中,人們只對影像中的某一個類別感興趣,例如植被、水田、水體、巖 礦、濕地提取等,這些都是單類信息提取問題。單類信息提取問題中,待提取的類別稱為興 趣類別,其他的類別統(tǒng)稱為非興趣類別。遙感影像單類信息提取可以通過多類分類器或者 單分類器來實現(xiàn)。采用多類分類器提取單類信息,將影像數(shù)據(jù)劃分為多個地物類別,同時獲 取興趣類別信息。例如為了能準確地提取水田信息,需要將原影像分成水田與林地、旱地、 水體和城鎮(zhèn)用地等不同的類別。遙感分類算法層出不窮,例如支持向量機,其優(yōu)點是能在樣 本較小的情況下獲得較好的分類結(jié)果,而且具有高維數(shù)據(jù)處理能力,可以用于單類信息提 取。
[0003] 采用單類分類器提取興趣類別,在不了解非興趣類別的情況下,只需興趣類別樣 本進行訓(xùn)練,例如單類支持向量機(one-classsupport-vectormachine,0CSVM),0CSVM方 法在高維空間中,尋找一個能將興趣類別分開的具有最大間隔的超平面,它的缺點是自由 參數(shù)的選擇困難。Lietal.提出了PUL(positiveandunlabeledlearning)算法進行單 類提取,在高分辨率遙感影像中進行了實驗,分別提取了影像中的各個單類,包括市區(qū)、樹 木、草地、水體、裸地。LiandGuo提出的遙感影像單類提取的MAXENT方法,在訓(xùn)練過程中 只要求正樣本,實驗結(jié)果表明其單類提取效果優(yōu)于0CSVM方法。MAXENT方法選擇具有最大 熵的分布形式作為興趣類別的數(shù)據(jù)分布,是一種參數(shù)化的方法,對于不規(guī)則的興趣類別分 布形式,效果受到影響。
[0004] 單分類器應(yīng)用是在非興趣類別樣本很難獲取的情況下使用的,而一般來說,遙感 影像中的非興趣類別樣本可以部分的提取,因此,采用多分類器進行遙感影像單類提取仍 然是一個重要方法。而且,由于提供了非興趣類別樣本參考,多類分類器的分類精度一般要 優(yōu)于單類分類器。另一方面,在單類信息提取中,對興趣類別了解的比較充分,而對于非興 趣類別的了解可能不是很充分,有時不能確定非興趣類別的特征與類別劃分情況。
【發(fā)明內(nèi)容】
[0005] 針對現(xiàn)有技術(shù)上存在的不足,本發(fā)明目的是在于提供一種基于最近鄰的遙感影像 單類信息提取方法,基于最近鄰的遙感影像單類信息提取精度高于單類支持向量機方法, 而且分類過程簡單。
[0006] 為了實現(xiàn)上述目的,本發(fā)明是通過如下的技術(shù)方案來實現(xiàn):一種基于最近鄰的遙 感影像單類信息提取方法,其包括以下步驟:(1)先對遙感影像聚類;(2)確定并選擇興趣 類別和非興趣類別訓(xùn)練樣本;(3)采用最近鄰方法進行單類分類。
[0007] 作為優(yōu)選,所述的步驟(1)為了選擇非興趣類別中每個模式的代表點作為樣本, 避免漏選,通過聚類的方法,搜尋影像數(shù)據(jù)中固有的聚類,然后從每個聚類中選擇樣本。
[0008] 作為優(yōu)選,所述的步驟(2)的非興趣類別包含興趣類別之外的所有地物類別,一 般是多模式的。
[0009] 作為優(yōu)選,所述的步驟(3)在基于最近鄰的方法中,將遙感影像數(shù)據(jù)分成兩個類 另IJ,簡化了分類過程,同時保證了分類精度。
[0010] 本發(fā)明的有益效果:基于最近鄰方法提取單類信息,由于其不受類別劃分的影響, 從而可以將分類過程簡化為二類問題,而且可以保證分類精度。
【附圖說明】
[0011] 下面結(jié)合附圖和【具體實施方式】來詳細說明本發(fā)明;
[0012] 圖1 (a)為本發(fā)明的TM原圖;
[0013] 圖1 (b)為本發(fā)明的分類測試區(qū)域圖;
[0014] 圖2為本發(fā)明的Meanshift聚類結(jié)果圖;
[0015] 圖3為本發(fā)明的單類提取結(jié)果圖,(白色為興趣類別;第1行為本發(fā)明方法,第2 行為0CSVM方法;第1-4列分別為:不透水表面、草地、林地、水體)。
【具體實施方式】
[0016] 為使本發(fā)明實現(xiàn)的技術(shù)手段、創(chuàng)作特征、達成目的與功效易于明白了解,下面結(jié)合
【具體實施方式】,進一步闡述本發(fā)明。
[0017] 參照圖1-3,本【具體實施方式】采用以下技術(shù)方案:一種基于最近鄰的遙感影像單 類信息提取方法,其包括以下步驟:(1)先對遙感影像聚類;(2)確定并選擇興趣類別和非 興趣類別訓(xùn)練樣本;(3)采用最近鄰方法進行單類分類。
[0018] 在單類提取中,由于只提取其中的一個感興趣類別,因此,影像中的類別劃分是可 以選擇的。首先,基于分類錯誤率分析最近鄰方法中類別劃分對單類信息提取結(jié)果的影響。
[0019] 單類提取中在給定樣本X時的條件錯誤概率包括兩個部分,一部分是把來自興趣 類別的樣本錯分引起的,另一部分是把來自非興趣類別的樣本錯分成興趣類別而引起的, 總的錯誤概率是這兩種錯誤的加權(quán)和。
[0020] 在最近鄰分類規(guī)則中,假設(shè)有來自Μ個類別的N個樣本,在這N個樣本中找出給定 樣本的最近鄰,那么最近鄰的類別就是未知樣本的所屬類別。給定未知樣本X,其最近鄰為 xneωi,假定Xeω],如果ω]不等于ωi,則發(fā)生一次錯誤,不失一般性,假定興趣類別為 ωi,因此在給定X和Xn時的條件錯誤概率為:
[0021] r(X,Χη)=Ρτ{ω^ω
[0022] =Ρ(ωi/XjΡ(ω2/Χ)+Ρ(ω2/Χη)Ρ(ω1;/Χ)+... + (1)
[0023] Ρ(ω/XJΡ(ωΜ/Χ)+Ρ(ωΜ/Χη)Ρ(ω/X)
[0024] 若Ν足夠大,使X與最近鄰\的距離非常接近,則有
[0025]Ρ(ωi/Xj¥Ρ(ωyx) (2)
[0026] 于是,公式(1)變成 「π⑶
[0027]
[0028] 當Ν時,可以證明公式(1)以概率1收斂于公式(3)。
[0029] 由公式(3)可見,基于最近鄰規(guī)則提取單類信息的錯誤率只與興趣類別的 條件概率相關(guān),而與其他類別無關(guān),即類別劃分對基于最近鄰規(guī)則的單類信息提取沒有影 響。因此,在基于最近鄰規(guī)則提取遙感影像中的單類信息時,可以將其視為二類分類問題, 只需標記興趣類別和非興趣類別,簡化了分類過程。
[0030] 采用最近鄰方法的單類信息提取精度與類別劃分無關(guān)。因此,在單類信息提取中, 可以將影像數(shù)據(jù)劃分成興趣類別和非興趣類別兩類,而非興趣類別包含興趣類別之外的所 有地物類別,一般是多模式的。由于非興趣類別包含了除興趣類別之外的所有區(qū)域,其樣本 的選擇應(yīng)該覆蓋興趣類別之外的所有子類。而非興趣類別的這些樣本可能屬于一般分類體 系中的某個類別,也可能不屬于任一規(guī)范的類別。為此,為了選擇非興趣類別中每個模式的 代表點作為樣本,避免漏選,可以通過聚類的方法,搜尋影像數(shù)據(jù)中固有的聚類,然后從每 個聚類中選擇樣本。
[0031] 實施例1 :實驗圖像如圖1所示為一幅專題制圖儀(ThematicMapper,ΤΜ)影像, 圖1(a)為原圖,圖1(b)為地面真值作為分類結(jié)果的測試區(qū)域,圖像大小為600X600,b、g、 r、n、m五個波段。按照一般的遙感影像類別劃分,包含四個類別:不透水表面、水體、耕地和 村莊。
[0032] 在為興趣類別和非興趣類別選擇樣本前,先作聚類處理,本實驗采用均值漂移 (Meanshift)方法對遙感影像進行聚類[11'12]。均值漂移聚類不需要預(yù)先給出地物的類別 數(shù)目,聚類過程中自動確定類別數(shù),可以更加準確的找到影像中的固有聚類。聚類結(jié)果如圖 2所示,其中包含9個聚類。
[0033] 實驗中,分別將不透水表面、水體、耕地和村莊四個類別作為興趣類別進行單獨提 取。在最近鄰分類方法中,分別選取興趣類別和非興趣類別的訓(xùn)練樣本,非興趣類別包含興 趣類別以外的所有地物類型。以如圖2所示的聚類結(jié)果為基礎(chǔ),選擇各自的訓(xùn)練樣本,分成 兩個類別,得到的單類提取結(jié)果如圖3第一行所示。圖3第一行從左到右分別為不透水表 面、水體、耕地和村莊類別的單類提取結(jié)果,其中白色為興趣類別,黑色為所有其他類別組 成的非興趣類別。在遙感影像單類信息提取中,精度評價指標包括生產(chǎn)精度、用戶精度、總 體精度和Kappa系數(shù)。根據(jù)圖1(b)所示的地面測試區(qū)域,計算各個類別提取的精度評價指 標如表1-4所示。
[0034] 表1不透水面的分類精度
[0035]
[0036] 表2水體的分類精度
[0037]
[0038]
[0039] 表3耕地的分類精度
[0040]
[0041] 表4村莊的分類精度
[0042]
[0043] 本實施例采用0CSVM方法進行實驗,0CSVM方法中選擇RBF核函數(shù),并通過10折 交叉驗證獲得各種參數(shù)。實驗結(jié)果如圖3第二行所示,對應(yīng)的分類精度估計見表1-4。從 分類結(jié)果中看出,總體上本文方法的單類提取精度略高于OCSVM方法。而且,在基于最近鄰 的方法中,將遙感影像數(shù)據(jù)分成兩個類別,簡化了分類過程,同時保證了分類精度,而0CSVM 方法對參數(shù)的依賴性強,參數(shù)選擇困難。
[0044] 以上顯示和描述了本發(fā)明的基本原理和主要特征和本發(fā)明的優(yōu)點。本行業(yè)的技術(shù) 人員應(yīng)該了解,本發(fā)明不受上述實施例的限制,上述實施例和說明書中描述的只是說明本 發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會有各種變化和改進,這些變 化和改進都落入要求保護的本發(fā)明范圍內(nèi)。本發(fā)明要求保護范圍由所附的權(quán)利要求書及其 等效物界定。
【主權(quán)項】
1. 一種基于最近鄰的遙感影像單類信息提取方法,其特征在于,其包括以下步驟:(1) 先對遙感影像聚類;(2)確定并選擇興趣類別和非興趣類別訓(xùn)練樣本;(3)采用最近鄰方法 進行單類分類。2. 根據(jù)權(quán)利要求1所述的一種基于最近鄰的遙感影像單類信息提取方法,其特征在 于,所述的步驟(1)為了選擇非興趣類別中每個模式的代表點作為樣本,避免漏選,通過聚 類的方法,搜尋影像數(shù)據(jù)中固有的聚類,然后從每個聚類中選擇樣本。3. 根據(jù)權(quán)利要求1所述的一種基于最近鄰的遙感影像單類信息提取方法,其特征在 于,所述的步驟(2)的非興趣類別包含興趣類別之外的所有地物類別,一般是多模式的。4. 根據(jù)權(quán)利要求1所述的一種基于最近鄰的遙感影像單類信息提取方法,其特征在 于,所述的步驟(3)在基于最近鄰的方法中,將遙感影像數(shù)據(jù)分成兩個類別,簡化了分類過 程,同時保證了分類精度。
【專利摘要】本發(fā)明公開了一種基于最近鄰的遙感影像單類信息提取方法,它涉及遙感影像特定類別提取技術(shù)領(lǐng)域。其包括以下步驟:(1)先對遙感影像聚類;(2)確定并選擇興趣類別和非興趣類別訓(xùn)練樣本;(3)采用最近鄰方法進行單類分類。本發(fā)明基于最近鄰方法提取單類信息,由于其不受類別劃分的影響,從而可以將分類過程簡化為二類問題,而且可以保證分類精度。
【IPC分類】G06K9/62
【公開號】CN105335761
【申請?zhí)枴緾N201510881202
【發(fā)明人】薄樹奎, 趙中堂, 劉超慧, 鄭小東, 荊永菊, 李玲玲
【申請人】鄭州航空工業(yè)管理學(xué)院
【公開日】2016年2月17日
【申請日】2015年11月27日