本發(fā)明涉及耳機控制,具體涉及一種基于多模態(tài)交互手勢識別的耳機控制方法及系統(tǒng)。
背景技術(shù):
1、耳機(earphones、headphones、?head-sets、earpieces)是一對轉(zhuǎn)換單元,它接受來自媒體播放器或接收器所發(fā)出的電訊號,利用貼近耳朵的揚聲器將其轉(zhuǎn)化成可以聽到的音波,耳機可與媒體播放器分離,僅利用一個插頭就能連接,能在不影響旁人的情況下,獨自聆聽音響,耳機原是給電話和無線電上使用的,但隨著可攜式電子裝置的盛行,耳機多用于手機、隨身聽、收音機、可攜式電玩和數(shù)位音訊播放器等;
2、然而,傳統(tǒng)耳機手勢設(shè)計多依賴工程師設(shè)計主觀經(jīng)驗,手勢數(shù)量常超出人類短期記憶容量,例如,某運動耳機為覆蓋全場景操作,設(shè)置了12種手勢,包括雙擊左耳接聽電話、三擊右耳切換降噪模式、滑動調(diào)節(jié)音量等,用戶需記憶復雜的“手勢-功能”對應關(guān)系,導致學習成本高企,在運動、通勤等高頻交互場景中,用戶因記憶模糊或操作急促,誤觸率高達30%,嚴重影響交互流暢性,更關(guān)鍵的是,現(xiàn)有方案未基于用戶實際使用數(shù)據(jù)篩選高頻手勢,將“均衡器調(diào)節(jié)”“查找耳機”等低頻功能(使用頻率<50次/月)與“播放/暫停”(使用頻率>1000次/月)設(shè)計為同級獨立手勢,導致核心功能操作路徑被冗余手勢稀釋,用戶需在復雜體系中“檢索”目標操作,進而降低效率。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于多模態(tài)交互手勢識別的耳機控制方法及系統(tǒng),以解決上述現(xiàn)有技術(shù)問題的至少之一。
2、第一方面,本發(fā)明提供了一種基于多模態(tài)交互手勢識別的耳機控制方法,包括以下步驟:
3、采集群體用戶的行為數(shù)據(jù),通過手勢使用次數(shù)以及米勒定律對采集的行為數(shù)據(jù)進行篩選分析,輸出高頻使用手勢集合;
4、基于高頻使用手勢集合,構(gòu)建多模態(tài)數(shù)據(jù)特征庫和群體用戶基礎(chǔ)模型,得到動態(tài)手勢庫;
5、獲取個體用戶的歷史使用數(shù)據(jù),將歷史數(shù)據(jù)與群體用戶基礎(chǔ)模型進行偏差分析得到差異特征,根據(jù)差異特征構(gòu)建個體用戶適配模型;
6、基于個體用戶適配模型,通過增量學習動態(tài)調(diào)整多模態(tài)權(quán)重,輸出最終的手勢識別結(jié)果。
7、第二方面,本發(fā)明提供了一種基于多模態(tài)交互手勢識別的耳機控制系統(tǒng),該系統(tǒng)包括:
8、高頻手勢篩選模塊:采集群體用戶的行為數(shù)據(jù),通過手勢使用次數(shù)以及米勒定律對采集的行為數(shù)據(jù)進行篩選分析,輸出高頻使用手勢集合;
9、手勢庫構(gòu)建模塊:基于高頻使用手勢集合,構(gòu)建多模態(tài)數(shù)據(jù)特征庫和群體用戶基礎(chǔ)模型,得到動態(tài)手勢庫;
10、個體偏差分析模塊:獲取個體用戶的歷史使用數(shù)據(jù),將歷史數(shù)據(jù)與群體用戶基礎(chǔ)模型進行偏差分析得到差異特征,根據(jù)差異特征構(gòu)建個體用戶適配模型;
11、手勢識別輸出模塊:基于個體用戶適配模型,通過增量學習動態(tài)調(diào)整多模態(tài)權(quán)重,輸出最終的手勢識別結(jié)果。
12、本發(fā)明的有益效果:
13、1、本發(fā)明通過統(tǒng)計手勢的使用次數(shù),能夠?qū)⒆⒁饬性诒挥脩纛l繁使用的手勢上,排除掉使用頻率低的手勢,減少后續(xù)處理的工作量,提高篩選效率;引入米勒定律進行篩選,保證了手勢與功能在用戶可輕松記憶的范圍內(nèi),降低了用戶的認知負荷,用戶不需要花費過多精力去記憶復雜的手勢與功能對應關(guān)系,從而使耳機的操作更加簡單便捷;
14、2、本發(fā)明解決了通用模型一刀切導致的個體操作習慣適配偏差問題,通過計算個體手勢特征與群體均值的偏差,構(gòu)建個性化適配模型,相比通用模型,個體用戶適配模型能夠更好地適應不同用戶獨特的手勢特點,從而顯著提高手勢識別的準確率;
15、3、本發(fā)明通過增量學習機制實時吸收用戶新手勢數(shù)據(jù),自動優(yōu)化多模態(tài)權(quán)重并同步至動態(tài)手勢庫,無需用戶手動配置,從而可以提高模型隨習慣進化的持續(xù)優(yōu)化能力。
1.一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,所述對采集的行為數(shù)據(jù)進行篩選分析的過程為:
3.根據(jù)權(quán)利要求2所述的一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,所述高頻候選手勢的獲取過程為:
4.根據(jù)權(quán)利要求2所述的一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,所述高頻使用手勢的過程包括:
5.根據(jù)權(quán)利要求4所述的一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,所述判斷是否可以對使用手勢進行合并的過程為:
6.根據(jù)權(quán)利要求4所述的一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,利用自然語言處理技術(shù)對使用功能的描述進行語義分析;
7.根據(jù)權(quán)利要求1所述的一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,所述動態(tài)手勢庫包括多模態(tài)數(shù)據(jù)特征庫和群體用戶基礎(chǔ)模型。
8.根據(jù)權(quán)利要求1所述的一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,對于高頻使用手勢集合中的每個手勢,采集群體用戶的歷史多模態(tài)數(shù)據(jù);
9.根據(jù)權(quán)利要求1所述的一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,所述進行偏差分析得到差異特征的過程為:
10.根據(jù)權(quán)利要求1所述的一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,所述構(gòu)建個體用戶適配模型的過程為:
11.根據(jù)權(quán)利要求1所述的一種基于多模態(tài)交互手勢識別的耳機控制方法,其特征在于,所述輸出最終的手勢識別結(jié)果的過程為:
12.一種基于多模態(tài)交互手勢識別的耳機控制系統(tǒng),其特征在于,該系統(tǒng)用于執(zhí)行上述權(quán)利要求1-11任一項所述的方法,該系統(tǒng)包括: