專利名稱:圖像識別方法和系統(tǒng)的制作方法
圖像識別方法和系統(tǒng)技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理領(lǐng)域,特別是涉及一種基于動態(tài)影像的圖像識別方法和系統(tǒng)。
背景技術(shù):
近年來,隨著智能終端設(shè)備的普及,尋求一種更自然更簡單的人機(jī)交互方式已然成為科研和產(chǎn)業(yè)領(lǐng)域的熱點問題??v觀人機(jī)交互技術(shù)的發(fā)展歷史,已逐漸從鼠標(biāo)、鍵盤、遙控器等方式發(fā)展為視覺、語音、姿態(tài)等非接觸式的操作方式,而且視覺技術(shù)作為其中最為重要的手段。隨著3D技術(shù)的發(fā)展,微軟推出了 Kinect系統(tǒng),其通過動態(tài)三維重建技術(shù),將人機(jī)交互由2D的圖像空間拓展到真實的3D空間,3D空間的深度信息有效的解決了 2D空間中較為復(fù)雜的背景分割問題,使得該技術(shù)趨于成熟,并已應(yīng)用到電視機(jī)、游戲機(jī)等設(shè)備中,用做外置的人機(jī)交互設(shè)備。但這種基于3D技術(shù)的手勢和姿態(tài)體感控制系統(tǒng)受限于其昂貴的硬件成本和巨大的運算量,以及其體積較大,很難集成到現(xiàn)有智能終端設(shè)備中。為了減少數(shù)據(jù)處理量,通常是通過攝像頭獲取2D畫面,基于2D圖像智能分析技術(shù)判斷操作者的動作和意圖,進(jìn)而控制機(jī)器。但其所面臨最大的問題是環(huán)境的復(fù)雜性和不確定性,使得圖像識別準(zhǔn)確性不高,誤判較多,導(dǎo)致整個圖像識別系統(tǒng)不穩(wěn)定。
發(fā)明內(nèi)容基于傳統(tǒng)技術(shù)的圖像識別系統(tǒng)不穩(wěn)定的問題,有必要提供一種基于動態(tài)影像的圖像識別方法和系統(tǒng)。一種圖像識別方法,包括如下步驟:步驟SlOl,獲取動態(tài)影像;
步驟S102,提取所述動態(tài)影像中的多幀靜態(tài)圖像;步驟S103,分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像;步驟S104,在識別結(jié)果為包含所述目標(biāo)圖像的所述靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時,判定所述動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中,所述步驟S104是在所述多幀靜態(tài)圖像的頭尾二幀所述靜態(tài)圖像和中間一幀所述靜態(tài)圖像識別到同一所述目標(biāo)圖像時,判定所述動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中,所述步驟S103進(jìn)一步包括在一幀所述靜態(tài)圖像中識別到兩種所述目標(biāo)圖像時,當(dāng)?shù)谝环N目標(biāo)圖像的相似度超過第二種目標(biāo)圖像的相似度達(dá)到預(yù)設(shè)差值時,選擇所述第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像,反之選擇所述第二種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。本發(fā)明一較佳實施例中,還包括如下步驟:步驟S201,提取所述靜態(tài)圖像中識別出的目標(biāo)圖像的坐標(biāo);步驟S202,根據(jù)預(yù)設(shè)方式定義識別出的所述目標(biāo)圖像上某一點為基準(zhǔn)點;
步驟S203,當(dāng)相鄰二幀所述靜態(tài)圖像中識別到的所述目標(biāo)圖像不同時,通過預(yù)設(shè)參數(shù)調(diào)整后一幀所述靜態(tài)圖像中識別到的所述目標(biāo)圖像的基準(zhǔn)點位置;步驟S204,記錄所述多幀靜態(tài)圖像中所述目標(biāo)圖像的所述基準(zhǔn)點的移動軌跡,生成所述目標(biāo)圖像的移動信息。一種圖像識別裝置,包括影像攝取單元、圖像提取單元,所述影像攝取單元用于獲取動態(tài)影像,所述圖像提取單元用于提取所述動態(tài)影像中的多幀靜態(tài)圖像,所述圖像識別裝置還包括:圖像識別單元,用于分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像。識別判定單元,用于在識別結(jié)果為包含所述目標(biāo)圖像的所述靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時,判定所述動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中,所述識別判定單元是在所述多幀靜態(tài)圖像的頭尾二幀所述靜態(tài)圖像和中間一幀所述靜態(tài)圖像識別到同一目標(biāo)圖像時,判定所述動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中,所述圖像識別單元進(jìn)一步用于在一幀所述靜態(tài)圖像中識別到兩種目標(biāo)圖像時,當(dāng)?shù)谝环N目標(biāo)圖像的相似度超過第二種目標(biāo)圖像的相似度達(dá)到預(yù)設(shè)差值時,選擇所述第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像,反之選擇所述第二種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。上述圖像識別方法和裝置是通過多幀靜態(tài)圖像的成功識別的比例,判定動態(tài)影像中是否包含目標(biāo)圖像,這樣便可以 減小單幀圖像誤判帶來的不良問題,提高系統(tǒng)穩(wěn)定性。
圖1為一實施例的圖像識別方法步驟流程圖;圖2為一實施例的基于圖像識別的軌跡記錄方法步驟流程圖;圖3為一實施例的圖像識別裝置的功能模塊圖。
具體實施方式為了解決傳統(tǒng)技術(shù)的圖像識別系統(tǒng)不穩(wěn)定的問題,提出了一種基于動態(tài)影像的圖像識別方法和系統(tǒng)。在圖像識別之前,都需要設(shè)置目標(biāo)圖像,而用戶最方便且最常使用的就是“手”,本發(fā)明一較佳實施例以各個手勢作為目標(biāo)圖像,包括手掌、拳頭、八字、食指等。以便圖像識別成功后分別控制其他設(shè)備執(zhí)行預(yù)設(shè)的對應(yīng)指令,如若識別到手掌,則控制鼠標(biāo)左鍵單擊,識別到拳頭,控制鼠標(biāo)右鍵單擊等。如圖1所示,其為本發(fā)明一較佳實施例的圖像識別方法步驟流程圖,包括如下步驟:步驟S101,獲取動態(tài)影像。該步驟可以是通過攝像頭拍攝得到。步驟S102,提取動態(tài)影像中的多幀靜態(tài)圖像。因為動態(tài)影像是由多幀圖像組成,圖像識別動作是在各幀靜態(tài)圖像中進(jìn)行。步驟S103,分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像。步驟S104,在識別結(jié)果為包含目標(biāo)圖像的靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時,判定動態(tài)影像中包含所述目標(biāo)圖像。因為在圖像識別過程中,單獨一幀靜態(tài)圖像的識別容易產(chǎn)生誤判。本發(fā)明一實施例是在連續(xù)的5幀靜態(tài)圖像中,只要有3幀識別到同一目標(biāo)圖像,步驟S104即判定動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中,是在5幀靜態(tài)圖像中的第I,3,5幀識別到同一目標(biāo)圖像時,即頭尾二幀靜態(tài)圖像和中間一幀靜態(tài)圖像識別到同一目標(biāo)圖像時,步驟S104判定動態(tài)影像中包含所述目標(biāo)圖像。這樣便可以減小單幀圖像誤判帶來的不良問題,提高系統(tǒng)穩(wěn)定性。在使用手掌和拳頭作為目標(biāo)圖像時,因為手掌的下部分(除去手指后的部分)跟拳頭的形狀非常相似,所以有時會識別到同時存在兩個目標(biāo)圖像。本發(fā)明一較佳實施例中,步驟S103進(jìn)一步包括在一幀靜態(tài)圖像中識別到兩種目標(biāo)圖像時,當(dāng)?shù)谝环N目標(biāo)圖像(拳頭)的相似度超過第二種目標(biāo)圖像(手掌)的相似度達(dá)到預(yù)設(shè)差值時,選擇第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像,反之選擇第二種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。如:第一種目標(biāo)圖像的相似度大于三倍的第二種目標(biāo)圖像的相似度時,選擇第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。在判定動態(tài)影像中包含所述目標(biāo)圖像后,若希望能夠根據(jù)目標(biāo)圖像在動態(tài)影像中的移動,產(chǎn)生控制命令(如控制鼠標(biāo)指針的移動),則必須得到目標(biāo)圖像的移動軌跡,如圖2所示,其為識別到目標(biāo)圖像之后的軌跡記錄方法,包括如下步驟:步驟S201,提取靜態(tài)圖像中識別出的目標(biāo)圖像的坐標(biāo)。步驟S202,根據(jù)預(yù)設(shè)方式定義識別出的目標(biāo)圖像上某一點為基準(zhǔn)點。步驟S203,當(dāng)相鄰二幀靜態(tài)圖像中識別到的目標(biāo)圖像不同時,通過預(yù)設(shè)參數(shù)調(diào)整后一幀靜態(tài)圖像中識別到的目標(biāo)圖像的基準(zhǔn)點位置,以保證移動軌跡的平滑度。如,假設(shè)前一幀的目標(biāo)圖像是手掌,基準(zhǔn)點為手掌圖像的中心點,后一幀目標(biāo)圖像為拳頭,若還以拳頭的中心點作為基準(zhǔn)點,那么基準(zhǔn)點就等于突然往下移動,這個時候可以將拳頭圖像的基準(zhǔn)點定位在拳頭圖像的頂端,即盡可能地與原手掌圖像的中心位置靠近。
步驟S204,記錄多幀靜態(tài)圖像中目標(biāo)圖像的基準(zhǔn)點的移動軌跡,生成目標(biāo)圖像的移動信息。這樣就減小/避免了切換目標(biāo)圖像后移動軌跡的跳動/抖動情況,使得在控制鼠標(biāo)指針的移動時,減少/避免切換目標(biāo)圖像時導(dǎo)致的鼠標(biāo)指針的抖動。在后續(xù)利用步驟S204的軌跡控制鼠標(biāo)指針的移動時,因為用戶手勢在動態(tài)影象中的移動范圍和鼠標(biāo)指針在屏幕上的移動范圍并非一致。為此,本發(fā)明一較佳實施例中,將目標(biāo)圖像的移動信息通過預(yù)設(shè)比例換算后,產(chǎn)生控制鼠標(biāo)指針移動的控制信息。該預(yù)設(shè)比例可以根據(jù)目標(biāo)圖像和所在的靜態(tài)圖像的尺寸比例關(guān)系獲得。如圖3所述,其為本發(fā)明一實施例的圖像識別裝置30的功能模塊圖,包括:影像攝取單元300、圖像提取單元302、圖像識別單元304和識別判定單元306。影像攝取單元300用于獲取動態(tài)影像。如通過攝像頭拍攝動態(tài)影像。圖像提取單元302用于提取動態(tài)影像中的多幀靜態(tài)圖像。圖像識別單元304用于分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像。識別判定單元306用于在識別結(jié)果為包含目標(biāo)圖像的靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時,判定動態(tài)影像中包含所述目標(biāo)圖像。
因為在圖像識別過程中,單獨一幀靜態(tài)圖像的識別容易產(chǎn)生誤判。本發(fā)明一實施例的識別判定單元306是在連續(xù)的5幀靜態(tài)圖像中,只要有3幀識別到同一目標(biāo)圖像,即判定動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中,是在5幀靜態(tài)圖像中的第1,3,5幀識別到同一目標(biāo)圖像時,即頭尾2幀靜態(tài)圖像和中間幀靜態(tài)圖像識別到同一目標(biāo)圖像時,判定動態(tài)影像中包含所述目標(biāo)圖像。這樣便可以減小單幀圖像誤判帶來的不良問題,提高系統(tǒng)穩(wěn)定性在使用手掌和拳頭作為目標(biāo)圖像時,因為手掌的下部分(除去手指后的部分)跟拳頭的形狀非常相似,所以有時會識別到同時存在兩個目標(biāo)圖像。本發(fā)明一較佳實施例中,圖像識別單元304進(jìn)一步用于在一幀靜態(tài)圖像中識別到兩種目標(biāo)圖像時,當(dāng)?shù)谝环N目標(biāo)圖像(拳頭)的相似度超過第二種目標(biāo)圖像(手掌)的相似度達(dá)到預(yù)設(shè)差值時,選擇第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。如:第一種目標(biāo)圖像的相似度大于三倍的第二種目標(biāo)圖像的相似度時,選擇第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。以上所述實施例僅表達(dá)了本發(fā)明的幾種實施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
權(quán)利要求
1.一種圖像識別方法,其特征在于,包括如下步驟: 步驟SlOl,獲取動態(tài)影像; 步驟S102,提取所述動態(tài)影像中的多幀靜態(tài)圖像; 步驟S103,分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像; 步驟S104,在識別結(jié)果為包含所述目標(biāo)圖像的所述靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時,判定所述動態(tài)影像中包含所述目標(biāo)圖像。
2.根據(jù)權(quán)利要求1所述的圖像識別方法,其特征在于,所述步驟S104是在所述多幀靜態(tài)圖像的頭尾二幀所述靜態(tài)圖像和中間一幀所述靜態(tài)圖像識別到同一所述目標(biāo)圖像時,判定所述動態(tài)影像中包含所述目標(biāo)圖像。
3.根據(jù)權(quán)利要求1所述的圖像識別方法,其特征在于,所述步驟S103進(jìn)一步包括在一幀所述靜態(tài)圖像中識別到兩種所述目標(biāo)圖像時,當(dāng)?shù)谝环N目標(biāo)圖像的相似度超過第二種目標(biāo)圖像的相似度達(dá)到預(yù)設(shè)差值時,選擇所述第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像,反之選擇所述第二種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。
4.根據(jù)權(quán)利要求1所述的圖像識別方法,其特征在于,還包括如下步驟: 步驟S201,提取所述靜態(tài)圖像中識別出的目標(biāo)圖像的坐標(biāo); 步驟S202,根據(jù)預(yù)設(shè)方式定義識別出的所述目標(biāo)圖像上某一點為基準(zhǔn)點; 步驟S203,當(dāng)相鄰二幀所述靜態(tài)圖像中識別到的所述目標(biāo)圖像不同時,通過預(yù)設(shè)參數(shù)調(diào)整后一幀所述靜態(tài)圖像中識別到的所述目標(biāo)圖像的基準(zhǔn)點位置; 步驟S204,記錄所述多幀靜態(tài)圖像中所述目標(biāo)圖像的所述基準(zhǔn)點的移動軌跡,生成所述目標(biāo)圖像的移動信息。
5.一種圖像識別裝置,包括影像攝取單元、圖像提取單元,所述影像攝取單元用于獲取動態(tài)影像,所述圖像提取單元用于提取所述動態(tài)影像中的多幀靜態(tài)圖像,其特征在于,所述圖像識別裝置還包括: 圖像識別單元,用于分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像。
識別判定單元,用于在識別結(jié)果為包含所述目標(biāo)圖像的所述靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時,判定所述動態(tài)影像中包含所述目標(biāo)圖像。
6.根據(jù)權(quán)利要求5所述的圖像識別裝置,其特征在于,所述識別判定單元是在所述多幀靜態(tài)圖像的頭尾二幀所述靜態(tài)圖像和中間一幀所述靜態(tài)圖像識別到同一目標(biāo)圖像時,判定所述動態(tài)影像中包含所述目標(biāo)圖像。
7.根據(jù)權(quán)利要求5所述的圖像識別裝置,其特征在于,所述圖像識別單元進(jìn)一步用于在一幀所述靜態(tài)圖像中識別到兩種目標(biāo)圖像時,當(dāng)?shù)谝环N目標(biāo)圖像的相似度超過第二種目標(biāo)圖像的相似度達(dá)到預(yù)設(shè)差值時,選擇所述第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像,反之選擇所述第二種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。
全文摘要
一種圖像識別方法包括如下步驟獲取動態(tài)影像;提取所述動態(tài)影像中的多幀靜態(tài)圖像分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像;在識別結(jié)果為包含所述目標(biāo)圖像的所述靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時,判定所述動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明還提供一種圖像識別裝置。上述圖像識別方法和裝置是通過多幀靜態(tài)圖像的成功識別的比例,判定動態(tài)影像中是否包含目標(biāo)圖像,這樣便可以減小單幀圖像誤判帶來的不良問題,提高系統(tǒng)穩(wěn)定性。
文檔編號G06K9/32GK103106388SQ20111036112
公開日2013年5月15日 申請日期2011年11月15日 優(yōu)先權(quán)日2011年11月15日
發(fā)明者宋展, 鄭鋒, 趙顏果 申請人:中國科學(xué)院深圳先進(jìn)技術(shù)研究院