圖像識別方法和系統(tǒng)的制作方法

文檔序號：6438398閱讀：563來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：圖像識別方法和系統(tǒng)的制作方法
圖像識別方法和系統(tǒng)技術(shù)領(lǐng)域：
本發(fā)明涉及圖像處理領(lǐng)域，特別是涉及一種基于動態(tài)影像的圖像識別方法和系統(tǒng)。
背景技術(shù)：
近年來，隨著智能終端設(shè)備的普及，尋求一種更自然更簡單的人機(jī)交互方式已然成為科研和產(chǎn)業(yè)領(lǐng)域的熱點問題?？v觀人機(jī)交互技術(shù)的發(fā)展歷史，已逐漸從鼠標(biāo)、鍵盤、遙控器等方式發(fā)展為視覺、語音、姿態(tài)等非接觸式的操作方式，而且視覺技術(shù)作為其中最為重要的手段。隨著3D技術(shù)的發(fā)展，微軟推出了 Kinect系統(tǒng)，其通過動態(tài)三維重建技術(shù)，將人機(jī)交互由2D的圖像空間拓展到真實的3D空間，3D空間的深度信息有效的解決了 2D空間中較為復(fù)雜的背景分割問題，使得該技術(shù)趨于成熟，并已應(yīng)用到電視機(jī)、游戲機(jī)等設(shè)備中，用做外置的人機(jī)交互設(shè)備。但這種基于3D技術(shù)的手勢和姿態(tài)體感控制系統(tǒng)受限于其昂貴的硬件成本和巨大的運算量，以及其體積較大，很難集成到現(xiàn)有智能終端設(shè)備中。為了減少數(shù)據(jù)處理量，通常是通過攝像頭獲取2D畫面，基于2D圖像智能分析技術(shù)判斷操作者的動作和意圖，進(jìn)而控制機(jī)器。但其所面臨最大的問題是環(huán)境的復(fù)雜性和不確定性，使得圖像識別準(zhǔn)確性不高，誤判較多，導(dǎo)致整個圖像識別系統(tǒng)不穩(wěn)定。

發(fā)明內(nèi)容基于傳統(tǒng)技術(shù)的圖像識別系統(tǒng)不穩(wěn)定的問題，有必要提供一種基于動態(tài)影像的圖像識別方法和系統(tǒng)。一種圖像識別方法，包括如下步驟:步驟SlOl，獲取動態(tài)影像；

步驟S102，提取所述動態(tài)影像中的多幀靜態(tài)圖像；步驟S103，分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像；步驟S104，在識別結(jié)果為包含所述目標(biāo)圖像的所述靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時，判定所述動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中，所述步驟S104是在所述多幀靜態(tài)圖像的頭尾二幀所述靜態(tài)圖像和中間一幀所述靜態(tài)圖像識別到同一所述目標(biāo)圖像時，判定所述動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中，所述步驟S103進(jìn)一步包括在一幀所述靜態(tài)圖像中識別到兩種所述目標(biāo)圖像時，當(dāng)?shù)谝环N目標(biāo)圖像的相似度超過第二種目標(biāo)圖像的相似度達(dá)到預(yù)設(shè)差值時，選擇所述第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像，反之選擇所述第二種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。本發(fā)明一較佳實施例中，還包括如下步驟:步驟S201，提取所述靜態(tài)圖像中識別出的目標(biāo)圖像的坐標(biāo)；步驟S202，根據(jù)預(yù)設(shè)方式定義識別出的所述目標(biāo)圖像上某一點為基準(zhǔn)點；
步驟S203，當(dāng)相鄰二幀所述靜態(tài)圖像中識別到的所述目標(biāo)圖像不同時，通過預(yù)設(shè)參數(shù)調(diào)整后一幀所述靜態(tài)圖像中識別到的所述目標(biāo)圖像的基準(zhǔn)點位置；步驟S204，記錄所述多幀靜態(tài)圖像中所述目標(biāo)圖像的所述基準(zhǔn)點的移動軌跡，生成所述目標(biāo)圖像的移動信息。一種圖像識別裝置，包括影像攝取單元、圖像提取單元，所述影像攝取單元用于獲取動態(tài)影像，所述圖像提取單元用于提取所述動態(tài)影像中的多幀靜態(tài)圖像，所述圖像識別裝置還包括:圖像識別單元，用于分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像。識別判定單元，用于在識別結(jié)果為包含所述目標(biāo)圖像的所述靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時，判定所述動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中，所述識別判定單元是在所述多幀靜態(tài)圖像的頭尾二幀所述靜態(tài)圖像和中間一幀所述靜態(tài)圖像識別到同一目標(biāo)圖像時，判定所述動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中，所述圖像識別單元進(jìn)一步用于在一幀所述靜態(tài)圖像中識別到兩種目標(biāo)圖像時，當(dāng)?shù)谝环N目標(biāo)圖像的相似度超過第二種目標(biāo)圖像的相似度達(dá)到預(yù)設(shè)差值時，選擇所述第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像，反之選擇所述第二種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。上述圖像識別方法和裝置是通過多幀靜態(tài)圖像的成功識別的比例，判定動態(tài)影像中是否包含目標(biāo)圖像，這樣便可以減小單幀圖像誤判帶來的不良問題，提高系統(tǒng)穩(wěn)定性。

圖1為一實施例的圖像識別方法步驟流程圖；圖2為一實施例的基于圖像識別的軌跡記錄方法步驟流程圖；圖3為一實施例的圖像識別裝置的功能模塊圖。
具體實施方式為了解決傳統(tǒng)技術(shù)的圖像識別系統(tǒng)不穩(wěn)定的問題，提出了一種基于動態(tài)影像的圖像識別方法和系統(tǒng)。在圖像識別之前，都需要設(shè)置目標(biāo)圖像，而用戶最方便且最常使用的就是“手”，本發(fā)明一較佳實施例以各個手勢作為目標(biāo)圖像，包括手掌、拳頭、八字、食指等。以便圖像識別成功后分別控制其他設(shè)備執(zhí)行預(yù)設(shè)的對應(yīng)指令，如若識別到手掌，則控制鼠標(biāo)左鍵單擊，識別到拳頭，控制鼠標(biāo)右鍵單擊等。如圖1所示，其為本發(fā)明一較佳實施例的圖像識別方法步驟流程圖，包括如下步驟:步驟S101，獲取動態(tài)影像。該步驟可以是通過攝像頭拍攝得到。步驟S102，提取動態(tài)影像中的多幀靜態(tài)圖像。因為動態(tài)影像是由多幀圖像組成，圖像識別動作是在各幀靜態(tài)圖像中進(jìn)行。步驟S103，分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像。步驟S104，在識別結(jié)果為包含目標(biāo)圖像的靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時，判定動態(tài)影像中包含所述目標(biāo)圖像。因為在圖像識別過程中，單獨一幀靜態(tài)圖像的識別容易產(chǎn)生誤判。本發(fā)明一實施例是在連續(xù)的5幀靜態(tài)圖像中，只要有3幀識別到同一目標(biāo)圖像，步驟S104即判定動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中，是在5幀靜態(tài)圖像中的第I，3，5幀識別到同一目標(biāo)圖像時，即頭尾二幀靜態(tài)圖像和中間一幀靜態(tài)圖像識別到同一目標(biāo)圖像時，步驟S104判定動態(tài)影像中包含所述目標(biāo)圖像。這樣便可以減小單幀圖像誤判帶來的不良問題，提高系統(tǒng)穩(wěn)定性。在使用手掌和拳頭作為目標(biāo)圖像時，因為手掌的下部分(除去手指后的部分)跟拳頭的形狀非常相似，所以有時會識別到同時存在兩個目標(biāo)圖像。本發(fā)明一較佳實施例中，步驟S103進(jìn)一步包括在一幀靜態(tài)圖像中識別到兩種目標(biāo)圖像時，當(dāng)?shù)谝环N目標(biāo)圖像(拳頭)的相似度超過第二種目標(biāo)圖像(手掌)的相似度達(dá)到預(yù)設(shè)差值時，選擇第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像，反之選擇第二種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。如:第一種目標(biāo)圖像的相似度大于三倍的第二種目標(biāo)圖像的相似度時，選擇第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。在判定動態(tài)影像中包含所述目標(biāo)圖像后，若希望能夠根據(jù)目標(biāo)圖像在動態(tài)影像中的移動，產(chǎn)生控制命令(如控制鼠標(biāo)指針的移動)，則必須得到目標(biāo)圖像的移動軌跡，如圖2所示，其為識別到目標(biāo)圖像之后的軌跡記錄方法，包括如下步驟:步驟S201，提取靜態(tài)圖像中識別出的目標(biāo)圖像的坐標(biāo)。步驟S202，根據(jù)預(yù)設(shè)方式定義識別出的目標(biāo)圖像上某一點為基準(zhǔn)點。步驟S203，當(dāng)相鄰二幀靜態(tài)圖像中識別到的目標(biāo)圖像不同時，通過預(yù)設(shè)參數(shù)調(diào)整后一幀靜態(tài)圖像中識別到的目標(biāo)圖像的基準(zhǔn)點位置，以保證移動軌跡的平滑度。如，假設(shè)前一幀的目標(biāo)圖像是手掌，基準(zhǔn)點為手掌圖像的中心點，后一幀目標(biāo)圖像為拳頭，若還以拳頭的中心點作為基準(zhǔn)點，那么基準(zhǔn)點就等于突然往下移動，這個時候可以將拳頭圖像的基準(zhǔn)點定位在拳頭圖像的頂端，即盡可能地與原手掌圖像的中心位置靠近。
步驟S204，記錄多幀靜態(tài)圖像中目標(biāo)圖像的基準(zhǔn)點的移動軌跡，生成目標(biāo)圖像的移動信息。這樣就減小/避免了切換目標(biāo)圖像后移動軌跡的跳動/抖動情況，使得在控制鼠標(biāo)指針的移動時，減少/避免切換目標(biāo)圖像時導(dǎo)致的鼠標(biāo)指針的抖動。在后續(xù)利用步驟S204的軌跡控制鼠標(biāo)指針的移動時，因為用戶手勢在動態(tài)影象中的移動范圍和鼠標(biāo)指針在屏幕上的移動范圍并非一致。為此，本發(fā)明一較佳實施例中，將目標(biāo)圖像的移動信息通過預(yù)設(shè)比例換算后，產(chǎn)生控制鼠標(biāo)指針移動的控制信息。該預(yù)設(shè)比例可以根據(jù)目標(biāo)圖像和所在的靜態(tài)圖像的尺寸比例關(guān)系獲得。如圖3所述，其為本發(fā)明一實施例的圖像識別裝置30的功能模塊圖，包括:影像攝取單元300、圖像提取單元302、圖像識別單元304和識別判定單元306。影像攝取單元300用于獲取動態(tài)影像。如通過攝像頭拍攝動態(tài)影像。圖像提取單元302用于提取動態(tài)影像中的多幀靜態(tài)圖像。圖像識別單元304用于分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像。識別判定單元306用于在識別結(jié)果為包含目標(biāo)圖像的靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時，判定動態(tài)影像中包含所述目標(biāo)圖像。
因為在圖像識別過程中，單獨一幀靜態(tài)圖像的識別容易產(chǎn)生誤判。本發(fā)明一實施例的識別判定單元306是在連續(xù)的5幀靜態(tài)圖像中，只要有3幀識別到同一目標(biāo)圖像，即判定動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明一較佳實施例中，是在5幀靜態(tài)圖像中的第1，3，5幀識別到同一目標(biāo)圖像時，即頭尾2幀靜態(tài)圖像和中間幀靜態(tài)圖像識別到同一目標(biāo)圖像時，判定動態(tài)影像中包含所述目標(biāo)圖像。這樣便可以減小單幀圖像誤判帶來的不良問題，提高系統(tǒng)穩(wěn)定性在使用手掌和拳頭作為目標(biāo)圖像時，因為手掌的下部分(除去手指后的部分)跟拳頭的形狀非常相似，所以有時會識別到同時存在兩個目標(biāo)圖像。本發(fā)明一較佳實施例中，圖像識別單元304進(jìn)一步用于在一幀靜態(tài)圖像中識別到兩種目標(biāo)圖像時，當(dāng)?shù)谝环N目標(biāo)圖像(拳頭)的相似度超過第二種目標(biāo)圖像(手掌)的相似度達(dá)到預(yù)設(shè)差值時，選擇第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。如:第一種目標(biāo)圖像的相似度大于三倍的第二種目標(biāo)圖像的相似度時，選擇第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。以上所述實施例僅表達(dá)了本發(fā)明的幾種實施方式，其描述較為具體和詳細(xì)，但并不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是，對于本領(lǐng)域的普通技術(shù)人員來說，在不脫離本發(fā)明構(gòu)思的前提下，還可以做出若干變形和改進(jìn)，這些都屬于本發(fā)明的保護(hù)范圍。因此，本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
權(quán)利要求
1.一種圖像識別方法，其特征在于，包括如下步驟: 步驟SlOl，獲取動態(tài)影像；步驟S102，提取所述動態(tài)影像中的多幀靜態(tài)圖像；步驟S103，分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像；步驟S104，在識別結(jié)果為包含所述目標(biāo)圖像的所述靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時，判定所述動態(tài)影像中包含所述目標(biāo)圖像。
2.根據(jù)權(quán)利要求1所述的圖像識別方法，其特征在于，所述步驟S104是在所述多幀靜態(tài)圖像的頭尾二幀所述靜態(tài)圖像和中間一幀所述靜態(tài)圖像識別到同一所述目標(biāo)圖像時，判定所述動態(tài)影像中包含所述目標(biāo)圖像。
3.根據(jù)權(quán)利要求1所述的圖像識別方法，其特征在于，所述步驟S103進(jìn)一步包括在一幀所述靜態(tài)圖像中識別到兩種所述目標(biāo)圖像時，當(dāng)?shù)谝环N目標(biāo)圖像的相似度超過第二種目標(biāo)圖像的相似度達(dá)到預(yù)設(shè)差值時，選擇所述第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像，反之選擇所述第二種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。
4.根據(jù)權(quán)利要求1所述的圖像識別方法，其特征在于，還包括如下步驟: 步驟S201，提取所述靜態(tài)圖像中識別出的目標(biāo)圖像的坐標(biāo)；步驟S202，根據(jù)預(yù)設(shè)方式定義識別出的所述目標(biāo)圖像上某一點為基準(zhǔn)點；步驟S203，當(dāng)相鄰二幀所述靜態(tài)圖像中識別到的所述目標(biāo)圖像不同時，通過預(yù)設(shè)參數(shù)調(diào)整后一幀所述靜態(tài)圖像中識別到的所述目標(biāo)圖像的基準(zhǔn)點位置；步驟S204，記錄所述多幀靜態(tài)圖像中所述目標(biāo)圖像的所述基準(zhǔn)點的移動軌跡，生成所述目標(biāo)圖像的移動信息。
5.一種圖像識別裝置，包括影像攝取單元、圖像提取單元，所述影像攝取單元用于獲取動態(tài)影像，所述圖像提取單元用于提取所述動態(tài)影像中的多幀靜態(tài)圖像，其特征在于，所述圖像識別裝置還包括: 圖像識別單元，用于分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像。
識別判定單元，用于在識別結(jié)果為包含所述目標(biāo)圖像的所述靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時，判定所述動態(tài)影像中包含所述目標(biāo)圖像。
6.根據(jù)權(quán)利要求5所述的圖像識別裝置，其特征在于，所述識別判定單元是在所述多幀靜態(tài)圖像的頭尾二幀所述靜態(tài)圖像和中間一幀所述靜態(tài)圖像識別到同一目標(biāo)圖像時，判定所述動態(tài)影像中包含所述目標(biāo)圖像。
7.根據(jù)權(quán)利要求5所述的圖像識別裝置，其特征在于，所述圖像識別單元進(jìn)一步用于在一幀所述靜態(tài)圖像中識別到兩種目標(biāo)圖像時，當(dāng)?shù)谝环N目標(biāo)圖像的相似度超過第二種目標(biāo)圖像的相似度達(dá)到預(yù)設(shè)差值時，選擇所述第一種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像，反之選擇所述第二種目標(biāo)圖像作為該幀靜態(tài)圖像中的目標(biāo)圖像。
全文摘要
一種圖像識別方法包括如下步驟獲取動態(tài)影像；提取所述動態(tài)影像中的多幀靜態(tài)圖像分別識別所述多幀靜態(tài)圖像中是否包含同一目標(biāo)圖像；在識別結(jié)果為包含所述目標(biāo)圖像的所述靜態(tài)圖像的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閥值時，判定所述動態(tài)影像中包含所述目標(biāo)圖像。本發(fā)明還提供一種圖像識別裝置。上述圖像識別方法和裝置是通過多幀靜態(tài)圖像的成功識別的比例，判定動態(tài)影像中是否包含目標(biāo)圖像，這樣便可以減小單幀圖像誤判帶來的不良問題，提高系統(tǒng)穩(wěn)定性。
文檔編號G06K9/32GK103106388SQ20111036112
公開日2013年5月15日申請日期2011年11月15日優(yōu)先權(quán)日2011年11月15日
發(fā)明者宋展, 鄭鋒, 趙顏果申請人:中國科學(xué)院深圳先進(jìn)技術(shù)研究院

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：宋展;鄭鋒;趙顏果;
技術(shù)所有人：中國科學(xué)院深圳先進(jìn)技術(shù)研究院;
我是此專利的發(fā)明人

上一篇：具有語義分析能力的、數(shù)據(jù)敏感的協(xié)商與合作引擎及方法
上一篇：人機(jī)交互方法和裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

圖像識別方法和系統(tǒng)的制作方法