最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

分類與對象檢測方法和裝置以及圖像拍攝和處理設(shè)備與流程

文檔序號:12005828閱讀:428來源:國知局
分類與對象檢測方法和裝置以及圖像拍攝和處理設(shè)備與流程
本發(fā)明涉及圖像處理和模式識別領(lǐng)域,尤其涉及訓(xùn)練分類器以進(jìn)行對象檢測的方法和裝置。

背景技術(shù):
隨著計(jì)算機(jī)圖像處理技術(shù)的發(fā)展和計(jì)算機(jī)視覺原理的廣泛應(yīng)用,利用對象檢測技術(shù)來實(shí)時地從圖像和視頻場景中定位目標(biāo)越來越普遍。對象檢測技術(shù)例如在智能終端設(shè)備、智能交通系統(tǒng)、智能監(jiān)控系統(tǒng)甚至軍事目標(biāo)檢測等應(yīng)用中均具有廣泛的實(shí)用價值。在對象檢測領(lǐng)域,廣泛地采用根據(jù)單類分類方法而訓(xùn)練的分類器。如Moya,M和Hush,D.所著的“Networkconstraintsandmulti-objectiveoptimizationforone-classclassification”(NeuralNetworks,9(3):463-474.doi:10.1016/0893-6080(95)00120-4,1996)中所描述的,在單類分類器中,通過根據(jù)僅僅包含一類對象的訓(xùn)練集合進(jìn)行學(xué)習(xí),從而將該類對象與所有其它可能的對象區(qū)分開。例如,在照相機(jī)中嵌入針對臉部/貓/狗的分類器。然而,這種現(xiàn)有的單類分類器越來越不能滿足消費(fèi)者的要求。以照相機(jī)為例,用戶可能會定期拍攝某個對象,比如他的寵物。這意味著用戶所希望的分類器不再像通常的那樣,即僅僅是針對臉部/狗/貓等特定一類對象的分類器,而希望該分類器可以學(xué)習(xí)用戶自己指定的對象(例如他的寵物)的表觀特征。例如,用戶希望在舉起照相機(jī)時自動聚焦到他的寵物,或者希望從照相機(jī)拍攝的所有照片中找到關(guān)于他的寵物的照片。目前,大多數(shù)現(xiàn)有的對象檢測產(chǎn)品依賴于收集充分多的樣本以訓(xùn)練得到良好的分類器,然后再將訓(xùn)練好的分類器設(shè)置到產(chǎn)品中以定位目標(biāo)。然而,在有些實(shí)際應(yīng)用中,可能難以獲得充分多的樣本來訓(xùn)練分類器。例如,在通過交通監(jiān)視系統(tǒng)追查特定車輛時,關(guān)于該特定車輛的先驗(yàn)樣本通常非常少,甚至只有一個。而且,在消費(fèi)者產(chǎn)品中,不能單純地依賴于要求用戶收集很多的樣本,那樣會造成較差的用戶體驗(yàn)。因此,需要一種對象檢測方法,該方法:(1)不依賴于任何先驗(yàn)知識,因?yàn)榭赡艿膶ο箢悇e的數(shù)目巨大,并且其分布遵循長尾理論(long-tailtheory),因此幾乎不可能準(zhǔn)備覆蓋可能對象類別的在先學(xué)習(xí)庫;(2)僅使用一個或幾個樣本就能夠進(jìn)行檢測,但同時要求該對象檢測方法要能夠處理對象表觀特征的變化,例如照明、視角、變形、模糊、旋轉(zhuǎn)等;(3)足以將對象與同一類別中的所有其它對象進(jìn)行區(qū)分,例如,要能夠區(qū)分開用戶自己的狗與其他人的狗。現(xiàn)有技術(shù)的對象檢測方法不能滿足上述要求。例如,在V.Ferrari和A.Zisserman所著的“Learningvisualattributes”(InNIPS,2008)中公開了“屬性”的概念,但是其要求終端用戶識別對象的屬性。在L.Fei-Fei、R.Fergus和P.Perona所著的“Abayesianapproachtounsupervisedone-shotlearningofobjectcategories”(InICCV,pages1134-1141,2003)中公開了單次拍攝學(xué)習(xí)方法。在M.Lew的“Content-basedMultimediaInformationRetrieval:StateoftheArtandChallenges”(ACMTrans.MCCA,2006)以及J.Eakins和M.Graham的“Content-basedImageRetrieval”(UniversityofNorthumbriaatNewcastle)中描述了基于內(nèi)容的圖像檢索方法(CBIR)。但是,上述兩種方法的精度較低,不足以準(zhǔn)確地區(qū)分同一類別中的對象。在HaeJongSeo和PeymanMilanfar的“Training-FreeGenericObjectDetectionUsingLocallyAdaptiveRegressionKernels”(IEEETrans.PAMI,vol.32,no.9,pp.1688-1704,2010)中公開了基于無訓(xùn)練LARK的檢測方法,但這種方法不具有旋轉(zhuǎn)不變性,在類內(nèi)區(qū)分方面效果很差。Lowe,DavidG所著的“Objectrecognitionfromlocalscale-invariantfeatures”(ICCV.pp.1150-1157,1999)以及H.Bay、A.Ess、T.Tuytelaars和L.V.Gool所著的“SURF:SpeededUpRobustFeatures”(CVIU,pp.346-359,2008)公開了基于SIFT/SURF的局部點(diǎn)匹配方法。在E.Nowak,F(xiàn).Jurie和B.Triggs的“SamplingStrategiesforBag-of-FeaturesImageClassification”(ECCV,2006)中公開了基于BOW/Part的模型。這幾種方法不能很好地處理非常小的目標(biāo)以及非剛性對象變形。如上所述的各現(xiàn)有技術(shù)方法均不能在較少樣本的情況下提供滿意的檢測性能。因此,需要僅利用少量樣本就能夠?qū)崿F(xiàn)高魯棒性和高辨別力的對象檢測的方法和裝置。

技術(shù)實(shí)現(xiàn)要素:
僅僅使用一個或幾個樣本訓(xùn)練有效的分類器的瓶頸在于,如何在樣本數(shù)量少的情況下控制分類器的性能,即魯棒性和辨別力。換言之,分類器既要保證能夠覆蓋目標(biāo)對象的所有表觀特征變化,又要能夠足夠準(zhǔn)確地將目標(biāo)對象與同一類別的其他對象區(qū)分開。而在樣本數(shù)量少的情況下,樣本的分散性有限,難以覆蓋關(guān)于目標(biāo)對象的所有可能表觀特征變化,如圖1所示,例如照明、視角、變形、模糊、旋轉(zhuǎn)等。這也是現(xiàn)有技術(shù)的分類器需要足夠多的樣本進(jìn)行訓(xùn)練的一個原因。為了解決上述技術(shù)問題,本發(fā)明提出了一種全新的分類學(xué)習(xí)方法和裝置,該分類學(xué)習(xí)方法和裝置基于支撐向量估計(jì)一個判決超球面作為分類的閾值,其中該判決超球面基本上不隨樣本本身或數(shù)量而變化,即任何正樣本落在判決超球面內(nèi)的概率基本上固定。根據(jù)本發(fā)明的第一方面,提供了一種在特征空間中的分類方法,所述特征空間包括一個或多個特征向量,所述一個或多個特征向量中的一些或全部被識別為支撐向量,所述分類方法包括:最大超球面生成步驟,用于根據(jù)所述支撐向量在所述特征空間中生成可能的最大超球面;超球面中心計(jì)算步驟,用于根據(jù)所述支撐向量計(jì)算所生成的最大超球面的中心;判決超球面生成步驟,用于利用所計(jì)算的中心和所生成的最大超球面,生成判決超球面;以及分類步驟,用于將所述判決超球面內(nèi)的特征向量歸類為正特征向量。根據(jù)一些實(shí)施例,所述判決超球面被生成為使得任何正特征向量落在所生成的判決超球面內(nèi)的概率固定。根據(jù)一些實(shí)施例,所述超球面中心計(jì)算步驟包括:根據(jù)所述支撐向量,在所述特征空間中生成可能的最小超球面;判斷在所述最小超球面內(nèi)是否只有一個特征向量;如果在所述最小超球面內(nèi)只有一個特征向量,則將該特征向量確定為所述最大超球面的中心;以及如果在所述最小超球面內(nèi)有超過一個的特征向量,則估計(jì)所述最小超球面的中心,作為所述最大超球面的中心。根據(jù)一些實(shí)施例,所述判決超球面生成步驟包括:計(jì)算所述最大超球面的表面積;以及確定判決超球面,使得該判決超球面的中心即為所計(jì)算的最大超球面的中心,且該判決超球面與所述最大超球面的表面積之比是預(yù)定值。根據(jù)本發(fā)明的第二方面,提供了一種在特征空間中的分類裝置,所述特征空間包括一個或多個特征向量,所述一個或多個特征向量中的一些或全部被識別為支撐向量,所述分類裝置包括:最大超球面生成單元,配置成根據(jù)所述支撐向量在所述特征空間中生成可能的最大超球面;超球面中心計(jì)算單元,配置成根據(jù)所述支撐向量,計(jì)算由所述最大超球面生成單元生成的所述最大超球面的中心;判決超球面生成單元,配置成利用由所述超球面中心計(jì)算單元計(jì)算的中心和由所述最大超球面生成單元生成的最大超球面,生成判決超球面;以及分類單元,配置成將由所述判決超球面生成單元生成的所述判決超球面內(nèi)的特征向量歸類為正特征向量。根據(jù)本發(fā)明的第三方面,提供了一種對象檢測方法,包括:支撐向量確定步驟,用于確定一組支撐向量;分類器訓(xùn)練步驟,用于基于所述支撐向量確定步驟中確定的所述一組支撐向量,利用根據(jù)第一方面所述的分類方法來訓(xùn)練分類器;以及對象檢測步驟,用于利用所訓(xùn)練的分類器,從圖像或視頻中檢測對象。根據(jù)本發(fā)明的第四方面,提供了一種對象檢測裝置,包括:支撐向量確定單元,配置成確定一組支撐向量;分類器訓(xùn)練單元,配置成基于所述支撐向量確定單元中確定的所述一組支撐向量,利用根據(jù)第一方面所述的分類方法來訓(xùn)練分類器;以及對象檢測執(zhí)行單元,配置成利用所訓(xùn)練的分類器,從圖像或視頻中檢測對象。根據(jù)本發(fā)明的第五方面,提供了一種圖像拍攝設(shè)備,包括:光學(xué)系統(tǒng),配置成拍攝圖像或視頻;根據(jù)第四方面所述的對象檢測裝置;以及控制單元,配置成控制所述光學(xué)系統(tǒng),以聚焦于由所述對象檢測裝置檢測到的對象。根據(jù)本發(fā)明的第六方面,提供了一種圖像處理設(shè)備,包括根據(jù)第四方面所述的對象檢測裝置。無論樣本本身及其數(shù)量如何,本發(fā)明的分類和檢測方法都能夠?qū)z測性能(例如,虛檢率(falsepositiverate)或檢出率(detectionrate))保持在預(yù)定水平,從而能夠提供有效的對象檢測。從參照附圖的以下描述中,本發(fā)明的其他特性特征和優(yōu)勢將變得清晰。附圖說明并入說明書并且構(gòu)成說明書的一部分的附圖圖示本發(fā)明的實(shí)施例,并且與描述一起用于說明本發(fā)明的原理。圖1是示出了示例目標(biāo)對象的可能表觀特征變化的示意圖。圖2A是示出了描述現(xiàn)有技術(shù)的支撐向量數(shù)據(jù)描述(SVDD)方法的示意圖。圖2B示意性地示出了現(xiàn)有技術(shù)的基于SVDD的分類方法的閾值隨樣本數(shù)量的變化趨勢。圖3A是示出了根據(jù)本發(fā)明的分類方法的原理的示意圖。圖3B示意性地示出了根據(jù)本發(fā)明的分類方法的閾值隨樣本數(shù)量的變化趨勢。圖4是例示了根據(jù)本公開實(shí)施例的分類方法的流程圖。圖5是例示了根據(jù)本公開實(shí)施例的超球面中心估計(jì)步驟的流程圖。圖6例示了根據(jù)本公開實(shí)施例如何判斷最小可能超球面內(nèi)是否只有一個特征向量。圖7是例示了根據(jù)本公開實(shí)施例的判決超球面生成步驟的流程圖。圖8是例示了根據(jù)本公開實(shí)施例的對象檢測方法的流程圖。圖9A和9B給出了利用本公開實(shí)施例的對象檢測方法識別目標(biāo)的示例。圖10示出了根據(jù)本公開實(shí)施例的分類裝置的功能框圖。圖11示出了根據(jù)本公開實(shí)施例的對象檢測裝置的功能框圖。圖12示出了可以實(shí)施本公開實(shí)施例的計(jì)算機(jī)系統(tǒng)的硬件配置的框圖。圖13是示出可以實(shí)施本公開實(shí)施例的圖像拍攝設(shè)備的功能框圖。具體實(shí)施方式現(xiàn)在將參照附圖來詳細(xì)描述本發(fā)明的各種示例性實(shí)施例。應(yīng)注意到:除非另外具體說明,否則在這些實(shí)施例中闡述的部件和步驟的相對布置、數(shù)字表達(dá)式和數(shù)值不限制本發(fā)明的范圍。以下對至少一個示例性實(shí)施例的描述實(shí)際上僅僅是說明性的,決不作為對本發(fā)明及其應(yīng)用或使用的任何限制。對于相關(guān)領(lǐng)域普通技術(shù)人員已知的技術(shù)、方法和設(shè)備可能不作詳細(xì)討論,但在適當(dāng)情況下,所述技術(shù)、方法和設(shè)備應(yīng)當(dāng)被視為授權(quán)說明書的一部分。在這里示出和討論的所有示例中,任何具體值應(yīng)被解釋為僅僅是示例性的,而不是作為限制。因此,示例性實(shí)施例的其它示例可以具有不同的值。應(yīng)注意到:相似的標(biāo)號和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個附圖中被定義,則在隨后的附圖中不需要對其進(jìn)行進(jìn)一步討論。如前所述,為了實(shí)現(xiàn)僅基于少量樣本就獲得高魯棒性和高辨別力的對象檢測,需要提供一種分類器,其既能夠覆蓋目標(biāo)對象的幾乎所有表觀特征變化,又能夠足夠準(zhǔn)確地將目標(biāo)對象與同一類別的其他對象區(qū)分開。支撐向量數(shù)據(jù)描述(supportvectordatadescription,SVDD)方法是單類分類方法的核心技術(shù)。如D.Tax和R.Duin在“Supportvectordomaindescription”(PatternRecognit.Lett.,vol.20,pp.1191-1199,1999)中所述,SVDD方法旨在找到一個包圍盡可能多目標(biāo)訓(xùn)練樣本的最小體積的球面。圖2A示出了描述SVDD法的示意圖。在圖2A所示的特征空間中,空心圓點(diǎn)(ο)代表對應(yīng)于訓(xùn)練樣本的特征向量,位于球面邊界上的實(shí)心圓點(diǎn)(·)代表支撐向量。如圖所示,支撐向量界定了SVDD方法獲得的超球面,即確定了SVDD分類器的閾值。換言之,SVDD方法的目的在于求得如圖所示的支撐向量。基于SVDD的傳統(tǒng)對象檢測方法的性能和精度依賴于訓(xùn)練樣本集的可獲得性。圖2B示意性地示出了現(xiàn)有技術(shù)的基于SVDD的分類方法的閾值隨樣本數(shù)量的變化趨勢。圖2B中,空心圓點(diǎn)(ο)代表原始訓(xùn)練樣本,實(shí)心方形(■)代表新添加的訓(xùn)練樣本;實(shí)線圈代表基于原始訓(xùn)練樣本獲得的SVDD超球面,虛線圈代表在添加了新的訓(xùn)練樣本之后獲得的SVDD超球面。從圖2B中可以看出,在較少數(shù)量的訓(xùn)練樣本的情況下,一般來說訓(xùn)練樣本的分散度較小,因此定義分類器閾值的SVDD超球面也比較小,如圖2B中實(shí)線圈所示。顯然,在這種情況下,訓(xùn)練出的分類器無法識別目標(biāo)對象的很多表觀特征變化,即檢出率非常低,對象檢測操作可能失敗。例如,在諸如視頻監(jiān)測、圖像檢索等一些在線應(yīng)用中,由于在初始狀態(tài)下沒有足夠多的訓(xùn)練樣本,因此傳統(tǒng)的分類方法會因檢出率過低而導(dǎo)致無法檢測到目標(biāo)對象。隨著樣本數(shù)量的增加,SVDD超球面不斷增大,即分類器的閾值增大,如圖2B中虛線圈所示。在超球面增大的情況下,檢出率得到了提高,但虛檢率也隨之增大,即,將負(fù)樣本判定為正樣本的概率也增大。因此,傳統(tǒng)的基于SVDD的對象檢測方法的性能不穩(wěn)定,而且在樣本數(shù)量不夠多時無法工作。如上面針對圖1所述,在樣本的特征空間中,一個樣本(例如,圖1中的矩形實(shí)線框所示的訓(xùn)練樣本)僅占據(jù)很小的一個區(qū)域或者僅由一個特征向量來表征,而該樣本的表觀特征變化會占據(jù)特征空間中該樣本周圍的較大區(qū)域。為了僅根據(jù)一個或幾個樣本來檢測出所有可能的表觀特征變化,我們需要估計(jì)表觀特征變化所占據(jù)的區(qū)域,即如圖1中的實(shí)線橢圓圈所示出的區(qū)域。為了適當(dāng)?shù)毓烙?jì)特征空間中目標(biāo)對象的表觀特征變化所占據(jù)的區(qū)域,在本發(fā)明中,如圖3A所示,首先基于支撐向量生成表觀特征變化所占據(jù)的最大可能超球面(半徑為Rmax);接著估計(jì)最小可能超球面(半徑為Rmin),即估計(jì)出超球面的中心點(diǎn);最后,利用生成的最大可能超球面和估計(jì)出的中心點(diǎn),按照統(tǒng)計(jì)概率,生成判決超球面(半徑為RT)作為分類器的閾值。無論樣本數(shù)量如何,所生成的判決超球面的大小都基本上保持恒定。圖3A右下角的圖示意性地示出了f=R2在范圍內(nèi)的分布。如圖3B所示,在添加了新訓(xùn)練樣本之后,盡管支撐向量界定的超球面明顯增大(如圖3B中的實(shí)線圈與點(diǎn)劃虛線圈所示),但新計(jì)算的判決超球面與原始的判決超球面相比大小基本上相同(如圖3B中的兩個虛點(diǎn)線圈所示)。下面將詳細(xì)描述如何基于支撐向量生成判決超球面。需要說明的是,盡管在本公開中采用SVDD為例說明了如何訓(xùn)練分類器,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本公開的分類方法也可以適用于采用支撐向量機(jī)(SupportVectorMachine,SVM)的分類器。圖4例示了根據(jù)本公開實(shí)施例的分類方法的流程圖。在獲得目標(biāo)訓(xùn)練樣本之后,構(gòu)建樣本的特征空間。然后,利用SVDD方法獲得包圍盡可能多目標(biāo)訓(xùn)練樣本的最小體積的超球面邊界,即,確定特征空間中的支撐向量。然后根據(jù)所確定的支撐向量生成可能的最大超球面(步驟10)?;赟VDD方法確定的超球面由下式表示:minR2+C∑iξi條件是||xi-a||2≤R2+ξi且ξi≥0(1)其中,a表示該超球面的中心,R表示該超球面的半徑;C是懲罰因子,ξi是松弛誤差,xi表示界定超球面的支撐向量。對公式(1)應(yīng)用拉哥朗日(Lagrangian)乘子,可以得到下面的對偶問題:min∑i,jαiαjK(xi·xj)-∑iαiK(xi·xi)條件是0≤αi≤C且∑iαi=1(2)其中,K(·)是核函數(shù),而且該函數(shù)值為非負(fù)。在本文中,核函數(shù)K(·)被選擇為針對特征空間中的任意歸一化特征向量z是恒定的,即K(z,z)是固定的。在一個實(shí)施例中,可以選擇直方圖交叉核(HIK)函數(shù)(參見http://c2inet.sce.ntu.edu.sg/Jianxin/projects/libHIK/libHIK_v2.pdf):其中,T和Q是特征的直方圖,N是直方圖維數(shù)。需要注意的是,盡管在本實(shí)施例中以公式(3)給出的HIK函數(shù)為例進(jìn)行了說明,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,還可以選擇Hellinger’s核函數(shù)和Jensen-Shannon核函數(shù)。求解公式(2)的對偶優(yōu)化問題,可以得到支撐向量集xi∈SVs和對應(yīng)的權(quán)重αi。利用上述SVDD方法求得的支撐向量xi和權(quán)重αi,我們就可以計(jì)算最大可能超球面半徑Rmax。對于給定的歸一化特征向量z,其到超球面中心的距離計(jì)算如下:如果則特征向量z就位于該超球面內(nèi),并被分類為目標(biāo)對象類。為了求解最大可能超球面的半徑Rmax,根據(jù)上面的公式(4),我們得到:(5)如前所述,針對任意歸一化特征向量z,K(z,z)是固定的。在根據(jù)公式(2)計(jì)算得出支撐向量xi∈SVs和對應(yīng)的權(quán)重αi的情況下,是固定值。因此,求解fmax的關(guān)鍵在于求得的最小值。如前所述,核函數(shù)K(·)非負(fù),因而故而,公式(5)簡化為:至此,上述公式(6)確定了最大超球面的半徑Rmax。接著,參照圖4中的步驟20,計(jì)算所生成的最大超球面的中心,即確定最小距離fmin。圖5是例示了根據(jù)本公開實(shí)施例的超球面中心估計(jì)步驟的流程圖。如圖5所示,首先,根據(jù)基于公式(2)計(jì)算得到的支撐向量,生成可能的最小超球面(步驟210)。根據(jù)上述公式(4),最小距離fmin表示如下:如前所述,在所有支撐向量確定的情況下,針對任何歸一化特征向量z,fmax是固定的。因此,求解fmin就轉(zhuǎn)變?yōu)榍蠼獾淖畲笾?。根?jù)核函數(shù)的定義可知,必然是一個特定值,但不會是正無窮大。接下來,判斷在最小超球面內(nèi)是否只有一個特征向量(步驟220),即在特征空間中,是否只有一個特征向量z到超球面中心的距離滿足如果在最小超球面內(nèi)只有一個特征向量,這意味著該特征向量就是最小超球面和最大超球面的中心。如果不止有一個特征向量,則需要估計(jì)最小超球面和最大超球面的中心(步驟230),如下將更詳細(xì)地描述。在本例中,選擇HIK函數(shù)進(jìn)行描述。為了加速計(jì)算,我們定義一個查找表lut:其中,xij∈Xi,XiSVs,M是支撐向量的個數(shù),而N是特征向量的維數(shù)。如上述(8)可知,但是max(lut)不總是等于下面將詳細(xì)說明。當(dāng)max(lut)可以取到時,意味著在最小超球面內(nèi)只有一個特征向量。這種情況下,我們將該特征向量確定為超球面的中心,并確定參照圖6,在最小超球面中的特征向量不是唯一的時,在這種情況下,需要估計(jì)fmin,即,估計(jì)max(lut)。在HIK核函數(shù)的示例中,針對第j維,定義如下:j=1,2,3......N(9)定義Hj的平均值為根據(jù)公式(8),因此,針對N維特征向量zj來說,估計(jì)lut的最大值等同于估計(jì)lut的在N個維度上的平均值的最大值,即估計(jì)下面采用統(tǒng)計(jì)學(xué)上的樣本估計(jì)理論來估計(jì)的范圍。根據(jù)中心極限定律,在樣本空間中的分布滿足正態(tài)分布。因此,概率Φz是累積分布,具體地如下:根據(jù)中心極限定律,根據(jù)標(biāo)準(zhǔn)誤和以及概率Φz,利用標(biāo)準(zhǔn)正態(tài)累積分布函數(shù)的查找表,可以求得λz,由此確定的范圍在[μ-λzσe,μ+λzσe]之間,最后可以確定最后,將公式(11)的結(jié)果代入公式(7)中,我們可以估計(jì)得到fmin。接下來,返回到圖4,在步驟30中,利用在步驟20中計(jì)算的fmin和在步驟10中計(jì)算的fmax,生成判決超球面。圖7是例示了根據(jù)本公開實(shí)施例的判決超球面生成步驟的流程圖。參見圖7,在步驟310中,計(jì)算最大超球面的表面積:f(z)在[fmin,fmax]范圍內(nèi)是大體相同類型的分布。下面,假定參數(shù)P,即描述判決超球面與最大超球面的表面積之比的預(yù)定值,利用在步驟20中計(jì)算的Rmin和在步驟10中計(jì)算的Rmax,來生成判決超球面的半徑RT(步驟320)。參數(shù)P定義如下:P=(fT(z)-fmin)/(fmax-fmin)(13)根據(jù)公式(13),可以確定判決超球面的半徑RT為:根據(jù)上述公式(14),我們針對一個特征向量z估計(jì)了一個適當(dāng)?shù)拈撝?,即fT(z)。最后,針對所有的支撐向量Xi∈SVs來估計(jì)fT:fT即為經(jīng)訓(xùn)練分類器的閾值,無論訓(xùn)練樣本有多少或怎樣,都能夠通過參數(shù)P將分類器的虛檢率控制在穩(wěn)定的水平下,即任何正特征向量落在所生成的判決超球面內(nèi)的概率固定。需要說明的是,參數(shù)P本身并非表示任何正特征向量落在判決超球面內(nèi)的概率,但是在參數(shù)P給定的情況下,上述概率也是固定的。最終,如圖4的步驟40所示,如果特征空間中的一個特征向量處于判決超球內(nèi),則將其判定為正特征向量;反之,則將其判定為負(fù)特征向量。利用如上所述的分類方法,能夠僅利用少量樣本實(shí)現(xiàn)高魯棒性和高辨別力的對象檢測。圖8是例示了根據(jù)本公開實(shí)施例的對象檢測方法的流程圖。首先,在步驟50中確定一組支撐向量。在一個實(shí)施例中,該組支撐向量是基于接收的一個或幾個樣本確定的。在另一實(shí)施例中,該組支撐向量是從其他訓(xùn)練好的分類器提取出的。為了保證經(jīng)訓(xùn)練的分類器具有較高的辨別力和魯棒性,支撐向量的數(shù)量要保持在預(yù)定水平之上。在一個示例中,要求支撐向量的個數(shù)不少于30個。因?yàn)橐话銇碚f一個特征向量對應(yīng)于一個樣本,所以要求樣本的個數(shù)不少于預(yù)定值。在樣本個數(shù)少于預(yù)定值的情況下,可以基于已有樣本進(jìn)行模擬操作,以擴(kuò)展樣本集直至樣本個數(shù)滿足預(yù)定值。例如,可以采用在M.Sheelagh、T.Carpendale、DavidJ.Cowperthwaite和F.DavidFracchia的“InformationVisualization“(SimonFraserUniversity,1997)中描述的3D變形方法來模擬樣本集。接著,設(shè)置固定的概率參數(shù)P,并利用在圖4中描述的分類方法來訓(xùn)練分類器,由此獲得無論輸入樣本數(shù)量如何均保持穩(wěn)定的檢測性能的分類器(步驟60)。利用在步驟60中訓(xùn)練好的分類器,就能夠從圖像或視頻中檢測對象(步驟70)。首先根據(jù)圖像或視頻幀生成多個局部區(qū)域。在一個實(shí)施例中,可以先設(shè)定大小與正樣本相同的搜索窗。接著,在圖像或視頻的幀上逐步移動搜索窗,并提取搜索窗內(nèi)包含的像素以生成輸入圖像的一部分。在搜索窗移動通過整個輸入圖像之后,重新調(diào)整輸入圖像的尺寸。重復(fù)尺寸調(diào)整和移動步驟,直到達(dá)到預(yù)定限值。其次,從每個生成的局部區(qū)域提取特征向量,并將其輸入到訓(xùn)練好的分類器。最后,記錄所有檢測到正樣本的局部區(qū)域,并對對象的位置和大小進(jìn)行分組。由此,可以利用少量樣本就能夠?qū)崿F(xiàn)高魯棒性和高辨別力的對象檢測。圖9A和9B給出了利用本公開實(shí)施例的對象檢測方法識別目標(biāo)的示例。選取一只波美拉尼亞狗在諸如背景、照明條件和視角等不同情形下的7個視頻進(jìn)行試驗(yàn)。從每個視頻中選擇一個訓(xùn)練樣本,如圖9A所示。圖9B示出了本發(fā)明的方法與現(xiàn)有技術(shù)基于SVDD的方法相比的性能差別,其中橫坐標(biāo)表示每圖像的虛檢率,即將負(fù)樣本誤判為正樣本的概率,縱坐標(biāo)表示檢出率,即正樣本被檢出的概率。虛檢率越低且檢出率越高,表明對象檢測方法的性能越好。從圖9B可見,現(xiàn)有技術(shù)的方法隨著樣本數(shù)量增加而虛檢率增大,而在本發(fā)明中,虛檢率基本上保持穩(wěn)定。另外,現(xiàn)有技術(shù)的方法在樣本數(shù)量較少時檢出率非常低,而本發(fā)明的方法的檢出率保持在較高的水平。圖10示出了根據(jù)本公開實(shí)施例的分類裝置2000的功能框圖。分類裝置2000的功能模塊可以由實(shí)現(xiàn)本發(fā)明原理的硬件、軟件或硬件和軟件的結(jié)合來實(shí)現(xiàn)。本領(lǐng)域技術(shù)人員可以理解的是圖10中所描述的功能模塊可以組合起來或者劃分成子模塊,從而實(shí)現(xiàn)上述發(fā)明的原理。因此,本文的描述可以支持對本文描述的功能模塊的任何可能的組合、或者劃分、或者更進(jìn)一步的限定。分類裝置2000能夠識別出特征空間中的正特征向量。特征空間可以包括一個或多個特征向量。在一個實(shí)施例中,可以利用SVDD方法來基于輸入樣本的特征向量而確定支撐向量。在另一實(shí)施例中,支撐向量可以是從其他訓(xùn)練好的分類器提取出的。分類裝置2000可以包括最大超球面生成單元2010、超球面中心計(jì)算單元2020、判決超球面生成單元2030以及分類單元2040。最大超球面生成單元2010可以根據(jù)支撐向量在特征空間中生成可能的最大超球面。超球面中心計(jì)算單元2020可以根據(jù)支撐向量,計(jì)算由最大超球面生成單元2010生成的最大超球面的中心。判決超球面生成單元2030可以利用由超球面中心計(jì)算單元2020計(jì)算的中心和由最大超球面生成單元2010生成的最大超球面,生成判決超球面。該判決超球面即為分類裝置2000的閾值。分類單元2040可以將由判決超球面生成單元2030生成的判決超球面內(nèi)的特征向量歸類為正特征向量。在一個實(shí)施例中,判決超球面被生成為使得特征空間中的任何正特征向量落在所生成的判決超球面內(nèi)的概率固定。在一個實(shí)施例中,超球面中心計(jì)算單元2020進(jìn)一步可以包括最小超球面生成單元2022、超球面中心判斷單元2024和超球面中心確定單元2026。最小超球面生成單元2022可以根據(jù)支撐向量,在特征空間中生成可能的最小超球面。超球面中心判斷單元2024可以判斷在最小超球面內(nèi)是否只有一個特征向量。如果在最小超球面內(nèi)只有一個特征向量,則超球面中心確定單元2026將該特征向量確定為最大超球面的中心。如果在最小超球面內(nèi)有超過一個的特征向量,則超球面中心確定單元2026估計(jì)最小超球面的中心,作為最大超球面的中心。在一個實(shí)施例中,判決超球面生成單元2030進(jìn)一步包括最大超球面表面積計(jì)算單元2032和判決超球面確定單元2034。最大超球面表面積計(jì)算單元2032可以計(jì)算最大超球面的表面積。判決超球面確定單元2034可以將判決超球面確定為使得該判決超球面的中心即為所計(jì)算的最大超球面的中心,且該判決超球面與最大超球面表面積計(jì)算單元2032計(jì)算出的最大超球面的表面積之比是預(yù)定值。在一個實(shí)施例中,最大超球面生成單元2010、超球面中心計(jì)算單元2020和判決超球面生成單元2030采用核函數(shù)K(·)。該核函數(shù)被選擇為針對所述特征空間中的任意歸一化特征向量z是恒定的。例如,核函數(shù)K(·)包括直方圖交叉核。圖11示出了根據(jù)本公開實(shí)施例的對象檢測裝置3000的功能框圖。對象檢測裝置3000的功能模塊可以由實(shí)現(xiàn)本發(fā)明原理的硬件、軟件或硬件和軟件的結(jié)合來實(shí)現(xiàn)。本領(lǐng)域技術(shù)人員可以理解的是圖11中所描述的功能模塊可以組合起來或者劃分成子模塊,從而實(shí)現(xiàn)上述發(fā)明的原理。因此,本文的描述可以支持對本文描述的功能模塊的任何可能的組合、或者劃分、或者更進(jìn)一步的限定。對象檢測裝置3000可以包括支撐向量確定單元3010、分類器訓(xùn)練單元3020和對象檢測執(zhí)行單元3030。支撐向量確定單元3010可以確定一組支撐向量。在一個實(shí)施例中,支撐向量確定單元3010可以包括用于接收一個或多個樣本的樣本接收單元3012和用于基于樣本接收單元3012接收到的樣本計(jì)算所述一組支撐向量的支撐向量計(jì)算單元3014。另選地或另外地,支撐向量確定單元3010可以包括用于從其他訓(xùn)練好的分類器提取支撐向量的支撐向量提取單元3016和用于基于支撐向量提取單元3016提取出的訓(xùn)練好的分類器的支撐向量而選擇一組支撐向量的支撐向量選擇單元3018。分類器訓(xùn)練單元3020可以基于支撐向量確定單元3010確定的一組支撐向量,利用圖4所述的分類方法來訓(xùn)練分類器。對象檢測執(zhí)行單元3030可以利用訓(xùn)練好的分類器,從圖像或視頻中檢測對象。圖12示出了可以實(shí)施本公開實(shí)施例的計(jì)算機(jī)系統(tǒng)1000的硬件配置的框圖。例如,計(jì)算機(jī)系統(tǒng)1000可以被實(shí)現(xiàn)為諸如臺式計(jì)算機(jī)、平板計(jì)算機(jī)、膝上型計(jì)算機(jī)、報警設(shè)備、智能手機(jī)、游戲機(jī)等的圖像處理設(shè)備。如圖12所示,計(jì)算機(jī)系統(tǒng)包括計(jì)算機(jī)1110。計(jì)算機(jī)1110包括經(jīng)由系統(tǒng)總線1121連接的處理單元1120、系統(tǒng)存儲器1130、固定非易失性存儲器接口1140、可移動非易失性存儲器接口1150、用戶輸入接口1160、網(wǎng)絡(luò)接口1170、視頻接口1190和輸出外圍接口1195。系統(tǒng)存儲器1130包括ROM(只讀存儲器)1131和RAM(隨機(jī)存取存儲器)1132。BIOS(基本輸入輸出系統(tǒng))1133駐留在ROM1131中。操作系統(tǒng)1134、應(yīng)用程序1135、其它程序模塊1136和某些程序數(shù)據(jù)1137駐留在RAM1132中。諸如硬盤之類的固定非易失性存儲器1141連接到固定非易失性存儲器接口1140。固定非易失性存儲器1141例如可以存儲操作系統(tǒng)1144、應(yīng)用程序1145、其它程序模塊1146和某些程序數(shù)據(jù)1147。例如,如關(guān)于圖11所述的對象檢測裝置3000可以作為一個應(yīng)用程序模塊而駐留在系統(tǒng)存儲器1130或固定非易失性存儲器1141中。諸如軟盤驅(qū)動器1151和CD-ROM驅(qū)動器1155之類的可移動非易失性存儲器連接到可移動非易失性存儲器接口1150。例如,軟盤1152可以被插入到軟盤驅(qū)動器1151中,以及CD(光盤)1156可以被插入到CD-ROM驅(qū)動器1155中。諸如鼠標(biāo)1161和鍵盤1162之類的輸入設(shè)備被連接到用戶輸入接口1160。計(jì)算機(jī)1110可以通過網(wǎng)絡(luò)接口1170連接到遠(yuǎn)程計(jì)算機(jī)1180。例如,網(wǎng)絡(luò)接口1170可以經(jīng)由局域網(wǎng)1171連接到遠(yuǎn)程計(jì)算機(jī)1180。或者,網(wǎng)絡(luò)接口1170可以連接到調(diào)制解調(diào)器(調(diào)制器-解調(diào)器)1172,以及調(diào)制解調(diào)器1172經(jīng)由廣域網(wǎng)1173連接到遠(yuǎn)程計(jì)算機(jī)1180。遠(yuǎn)程計(jì)算機(jī)1180可以包括諸如硬盤之類的存儲器1181,其存儲遠(yuǎn)程應(yīng)用程序1185。視頻接口1190連接到監(jiān)視器1191。輸出外圍接口1195連接到打印機(jī)1196和揚(yáng)聲器1197。圖12所示的計(jì)算機(jī)系統(tǒng)僅僅是說明性的并且決不意圖對本發(fā)明、其應(yīng)用或用途的任何限制。圖12所示的計(jì)算機(jī)系統(tǒng)可以被實(shí)施于任何實(shí)施例,可作為獨(dú)立計(jì)算機(jī),或者也可作為設(shè)備中的處理系統(tǒng),可以移除一個或更多個不必要的組件,也可以向其添加一個或更多個附加的組件。在一個示例中,計(jì)算機(jī)系統(tǒng)1000的用戶可以通過諸如鍵盤1162的輸入設(shè)備與計(jì)算機(jī)系統(tǒng)1000交互,來指定例如固定非易失性存儲器1141中存儲的一個或幾個圖像樣本作為要檢測的目標(biāo)對象,并且指定要檢測的樣本范圍。然后,系統(tǒng)存儲器1130或固定非易失性存儲器1141中存儲的對象檢測模塊按照圖4所示的方法進(jìn)行學(xué)習(xí)。接著,利用學(xué)習(xí)好的對象檢測模塊,從用戶指定的樣本范圍中檢測目標(biāo)對象。最后,將樣本范圍中檢測出的目標(biāo)對象呈現(xiàn)給用戶。圖13是示出可以實(shí)施本公開實(shí)施例的圖像拍攝設(shè)備4000的功能框圖。例如,圖像拍攝設(shè)備4000可以被實(shí)現(xiàn)為照相機(jī)、攝像機(jī)等。如圖13所示,圖像拍攝設(shè)備4000包括配置成拍攝圖像或視頻的光學(xué)系統(tǒng)4010、能夠根據(jù)圖8所示的方法操作的對象檢測裝置4020,以及配置成控制光學(xué)系統(tǒng)4010以聚焦于由對象檢測裝置4020檢測到的對象的控制單元4030。在一個示例中,圖像拍攝設(shè)備4000的用戶可以在圖像拍攝設(shè)備4000開機(jī)后且在進(jìn)行圖像拍攝之前,指定圖像拍攝設(shè)備4000的存儲設(shè)備(未示出)中存儲的一個或幾個圖像樣本作為要追蹤的目標(biāo)對象,然后根據(jù)圖4所示的方法訓(xùn)練對象檢測裝置4020中包括的分類器。接下來,在圖像拍攝期間,對象檢測裝置4020可以自動搜索預(yù)覽圖像(例如,照相機(jī)的取景器中呈現(xiàn)的圖像)以確定其中是否包括要檢測的目標(biāo)對象,如果包括的話則定位該目標(biāo)對象的位置。最后,控制單元4030控制光學(xué)系統(tǒng)4010以聚焦于由對象檢測裝置4020檢測到的目標(biāo)對象。在另一示例中,用戶對于某一目標(biāo)對象的指定可以記錄在圖像拍攝設(shè)備4000的存儲設(shè)備中??梢酝ㄟ^許多方式來實(shí)施本發(fā)明的方法和設(shè)備。例如,可以通過軟件、硬件、固件、或其任何組合來實(shí)施本發(fā)明的方法和設(shè)備。上述的方法步驟的次序僅是說明性的,本發(fā)明的方法步驟不限于以上具體描述的次序,除非以其他方式明確說明。此外,在一些實(shí)施例中,本發(fā)明還可以被實(shí)施為記錄在記錄介質(zhì)中的程序,其包括用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因而,本發(fā)明還覆蓋存儲用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。雖然已通過示例詳細(xì)展示了本發(fā)明的一些具體實(shí)施例,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述示例僅意圖是說明性的而不限制本發(fā)明的范圍。本領(lǐng)域技術(shù)人員應(yīng)該理解,上述實(shí)施例可以被修改而不脫離本發(fā)明的范圍和實(shí)質(zhì)。本發(fā)明的范圍是通過所附的權(quán)利要求限定的。
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1