專利名稱:借助至少兩個電聲轉(zhuǎn)換器向數(shù)據(jù)終端設(shè)備用戶輸出可聽信息的虛擬助理和提供虛擬助理 ...的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種借助至少兩個電聲轉(zhuǎn)換器向數(shù)據(jù)終端設(shè)備的用戶輸出可聽見信息的虛擬助理,以及一種為數(shù)據(jù)終端設(shè)備的用戶提供虛擬助理的可聽見信息的方法。
背景技術(shù):
對于PC應(yīng)用程序的使用,一般公知用戶可以訪問虛擬助理、即基于計算機的幫助(程序),該虛擬助理在為了完成任務(wù)而實施必需的步驟時、或者當(dāng)用戶希望進一步了解PC應(yīng)用程序的功能時支持用戶。另一方面,在輸入錯誤時提醒用戶注意這些錯誤輸入,并由虛擬助理向用戶講解輸入建議。為用戶光學(xué)地、即借助顯示單元顯示通過虛擬助理提供的信息。
虛擬助理的這些對用戶有益的功能原理上也可以用于移動數(shù)據(jù)終端設(shè)備,例如移動電話或以個人數(shù)字助理PDA為人所熟悉的設(shè)備。但是在此對用戶來說存在缺點,即由虛擬助理提供的豐富信息必須顯示在移動數(shù)據(jù)終端設(shè)備的小顯示單元上。
此外,如果用戶必須同時將注意力集中在周圍其它光學(xué)顯示的信息或談話對象的聲音信息上,則虛擬助理提供的光學(xué)的豐富信息對于數(shù)據(jù)終端設(shè)備的用戶來說是難以處理的。在此提供了,借助聲學(xué)顯示方式實現(xiàn)由數(shù)據(jù)終端設(shè)備的虛擬助理為數(shù)據(jù)終端設(shè)備的用戶提供信息。通過這種方式,數(shù)據(jù)終端設(shè)備的用戶可以更好地同時處理聲學(xué)提供的信息和其它光學(xué)提供的信息。
另一方面,公知有這樣的數(shù)據(jù)終端設(shè)備或方法,其中為數(shù)據(jù)終端設(shè)備的用戶或該方法聲學(xué)顯示附加信息。例如助理在售票窗口通過售票窗口的相應(yīng)服務(wù)程序,借助聲學(xué)信息來引導(dǎo)售票窗口的用戶。
由于售票窗口經(jīng)常處于較吵鬧的環(huán)境中,因此對售票窗口的用戶來說,難以聽清由售票窗口助理輸出的聲音信息。還難以跟蹤由兩個不同的信號源同時作用在一個用戶身上的聲音信息。
一段時間以來對所謂的立體聲技術(shù)進行了研究。該立體聲技術(shù)的介紹例如在J.Blauert(1996)標(biāo)題為“An introduction to binaural technology”,Binaural and Spatial Hearing in Real and Virtual Enviroments,R.Gilkey &T.Anderson編輯,593-609頁,Lawrence Erlbaum,USA-Hill-dale NJ中進行了描述。
在對聲頻信息采用信號技術(shù)處理的條件下,聽眾借助立體聲技術(shù)可以將產(chǎn)生聲波的源對應(yīng)到周圍空間的任意位置。其中,在該空間中固定設(shè)置聽眾或輸出聲音信息的電聲轉(zhuǎn)換器。然后,聽眾例如可以通過對音頻信息的相應(yīng)信號技術(shù)處理形成這樣一種主觀印象,即產(chǎn)生聲波的源在其周圍或者面向他或者遠離他。也就是說,借助音頻信息的信號技術(shù)處理可以將產(chǎn)生聲波的源定位在空間的任意位置。
發(fā)明內(nèi)容
因此,本發(fā)明要解決的技術(shù)問題在于,為數(shù)據(jù)終端設(shè)備的用戶開發(fā)一種技術(shù)手段,其中對于用戶的感覺來說,可以將由數(shù)據(jù)終端設(shè)備的虛擬助理輸出的聲音信息更好地與其它同樣對數(shù)據(jù)終端設(shè)備的用戶有影響的聲源分離開來。
該技術(shù)問題是從權(quán)利要求1的上位概念中定義的虛擬助理出發(fā),通過在權(quán)利要求1的特征部分給出的特征,以及從權(quán)利要求9的上位概念中定義的方法出發(fā),通過在權(quán)利要求9的特征部分給出的特征解決的。本發(fā)明的優(yōu)選實施方式在從屬權(quán)利要求中給出。
根據(jù)本發(fā)明,借助至少兩個電聲轉(zhuǎn)換器向數(shù)據(jù)終端設(shè)備的用戶輸出可聽見信息的虛擬助理,可以由用戶在空間中定位,從而在借助電聲轉(zhuǎn)換器輸出的信息和其它由至少另一個聲源輸出的信息之間實現(xiàn)更好的立體聲分離。
本發(fā)明的一個優(yōu)點是,借助對數(shù)據(jù)終端設(shè)備的虛擬助理的音頻信息進行信號技術(shù)處理或其本地化,該數(shù)據(jù)終端設(shè)備的用戶可利用聲源的空間定位。對數(shù)據(jù)終端設(shè)備的用戶來說,可以與環(huán)境噪聲更好分離地收聽到虛擬助理的音頻信息。
此外,可以在用戶與空間中的另一位談話對象談話的同時,有目的地將虛擬助理的音頻信息從一個方向輸送給數(shù)據(jù)終端設(shè)備的用戶。在此,也可以將來自虛擬助理的影響用戶的音頻信息和來自談話對象的影響用戶的音頻信息進行較好的空間聲音分離。由此,用戶既可以接收和處理來自虛擬助理也可以接收和處理來自談話對象的信息。但至少,使用戶容易對來自虛擬助理和談話對象的信息同時接收和處理。
如果除了來自虛擬助理的音頻信息和來自存在于用戶周圍的其它聲源的環(huán)境噪聲之外,還同時顯示光學(xué)信息影響數(shù)據(jù)終端設(shè)備的用戶,則具有另一優(yōu)點。在這種情況下,數(shù)據(jù)終端設(shè)備的用戶也可以更好地接收和處理來自不同聲源的信息。
具體實施例方式
本發(fā)明的其它優(yōu)點由下面的描述給出,其借助兩個實施例解釋了本發(fā)明。
在第一實施例中,一位行人位于大街上。這位行人提著很重的購物袋。他想用他的構(gòu)造為移動電話的數(shù)據(jù)終端設(shè)備進行一次電話交談。該移動電話開機,但是放在他的一個購物袋中,因此不太容易找到。但是這位行人戴著具有受話器的輕便耳機。在該具有受話器的耳機中,集成了兩個用于輸出音頻信息的電聲轉(zhuǎn)換器。具有受話器的耳機與移動電話一樣配備了無線模塊(例如藍牙功能模塊),用于在具有受話器的耳機和移動電話之間進行短作用距離的數(shù)據(jù)交換。
行人,即該具有受話器的耳機或移動電話的用戶,激活該具有受話器的耳機,并由此實現(xiàn)了具有受話器的耳機和移動電話之間的數(shù)據(jù)交換。該用戶對具有受話器的耳機說“撥號”,對此移動電話的虛擬助理通知他“請說出姓名”。用戶說出受話者的姓名。由于用戶在具有高噪聲電平的環(huán)境中移動,因此移動電話不能以足夠的精度識別該受話者的姓名。移動電話處理用戶輸入的姓名,并將該姓名與移動電話的內(nèi)置電話簿中存儲的姓名進行比較。移動電話將輸入的姓名識別為“Schmitzer”或“Schnitzler”。對用戶來說,在移動電話的顯示單元上輸出這兩個姓名、并接著要求該用戶在這兩個姓名之間做出選擇是毫無用處的。這是因為,如已提到的,用戶的移動電話埋藏在他的一個購物袋中而難以拿到。另一方面,移動電話由用戶通過具有受話器的耳機識別該移動電話的運行,從而移動電話指示其虛擬助理,借助具有受話器的耳機,通過虛擬助理向用戶輸出所有聽起來相似的姓名。例如,用戶通過具有受話器的耳機聽到其虛擬助理下面的這番話“沒有唯一識別的名字”,“請從下面的選項中選擇”,“Schmitzer”或在短暫停頓之后接著說“Schnitzler”。
盡管環(huán)境噪聲很大,用戶還是識別出由虛擬助理提供的兩個選項,因為在移動電話的虛擬助理輸出音頻信息時,借助電聲轉(zhuǎn)換器使立體聲技術(shù)得到了應(yīng)用。立體聲技術(shù)實現(xiàn)了對移動電話中的音頻信息進行針對性的信號技術(shù)處理。在通過虛擬助理借助具有受話器的耳機再現(xiàn)該音頻信息時,移動電話的用戶可以判斷由虛擬助理輸出的音頻信息的清楚位置。在移動電話中,根據(jù)由用戶進行的預(yù)調(diào),對音頻信息進行這樣的信號技術(shù)處理,即移動電話的用戶將由虛擬助理提供的音頻信息定位為來自頭部附近的信息。該音頻信息從后面越過用戶的肩膀而在其耳畔“低語”。
移動電話的用戶例如可以借助公知的機電輸入裝置任意改變虛擬助理的位置,從該位置收聽到由虛擬助理輸出的音頻信息。
機電輸入裝置例如是底座中的圓球。由傳感器探測用戶引起的球體轉(zhuǎn)動。另一方面,虛擬助理的定位按照本身公知的方式,借助語音命令或借助在移動電話接觸靈敏的顯示單元上的輸入來進行。
此外,當(dāng)移動電話具有通過例如旋轉(zhuǎn)速率傳感器或磁場傳感器來檢測移動電話用戶的頭部運動的頭部位置傳感器時,如果在對音頻信息進行信號技術(shù)處理時考慮該頭部運動,則也可以保持所選擇的虛擬助理的位置。
通過虛擬助理的預(yù)調(diào)定位或由用戶任意改變其位置的可能性,用戶既可以按照簡單方式借助用于建立呼叫連接的語音命令操作移動電話,也可以留意到環(huán)境噪聲,例如大聲喊叫或喇叭聲等等。
為了根據(jù)該呼叫連接的建立選擇由虛擬助理提供的姓名“Schmitzer”或“Schnitzler”,用戶通過向具有受話器的耳機說出“不是”來回答姓名“Schmitzer”,而通過說出“是”來回答姓名“Schnitzler”。移動電話識別姓名“Schnitzler”,并建立呼叫。
在第二實施例中描述了遠程電信會議的情況。有多人參加該遠程電信會議,這些人大部分能說或理解不同的語言。這些人分別坐在分布在整個遠程電信會議室內(nèi)的各個桌子旁,每個人都有自己的顯示屏。一位參與者發(fā)言,則構(gòu)造為遠程電信會議系統(tǒng)的數(shù)據(jù)終端設(shè)備將該參與者投影到掛在遠程電信會議室墻上的銀幕上,從而使得其他參與者也可以看見該參與者的表情和姿勢。
另一方面,該參與者的講話通過與遠程電信會議系統(tǒng)連接的、并構(gòu)造為電聲轉(zhuǎn)換器的揚聲器傳出。
同時,將發(fā)言的參與者的講話實時翻譯為其他參與者的語言,并且參與者可以通過具有受話器的耳機收聽到該音頻信息形式的翻譯,其中在耳機中集成了兩個用于輸出音頻信息的電聲轉(zhuǎn)換器。為了向參與者提供同時專注于以發(fā)言的參與者的語言作出的講話以及以同聲翻譯后的語言作出的講話的可能性,由遠程電信會議系統(tǒng)通過虛擬助理為其他參與者輸出可聽見的同聲翻譯。遠程電信會議的每個參與者可以通過在遠程電信會議系統(tǒng)中輸入相應(yīng)的鍵組合來在空間中任意定位虛擬助理。
在此,也由各參與者借助對音頻信息的信號技術(shù)處理實現(xiàn)在遠程電信會議系統(tǒng)中對虛擬助理的定位以及對由虛擬助理輸出的音頻信息的空間聲音的感覺。參與者這樣定位虛擬助理,使得參與者通過虛擬助理收聽到音頻信息的輸出,就象從后面越過肩膀發(fā)送的和來自頭部附近的一樣。通過虛擬助理的定位,很好地實現(xiàn)了將通過揚聲器發(fā)出的講話和該講話的同聲翻譯之間的立體聲分離,從而參與者可以很好地理解通過揚聲器發(fā)出的講話和同聲翻譯,并專注于發(fā)言的參與者的表情和姿勢。也就是說,參與者可以注意力集中地同時聽取多條信息。
如果一參與者已經(jīng)知道他自己的代表團的講話,則該參與者可以將遠程電信會議系統(tǒng)用于通過虛擬助理獲得其它信息,例如關(guān)于會議日程安排的信息、關(guān)于其他參與者的背景信息或關(guān)于參與者下榻酒店的信息。
所述例子并非窮舉。將通過虛擬助理向數(shù)據(jù)終端設(shè)備的用戶輸出的音頻信息與其它對用戶來說重要的、可同時聽見或可看見的信息進行空間聲音分離的概念,可以延伸到其他例子中,尤其是在用戶采用移動通信發(fā)送設(shè)備時。在此,例如可提到導(dǎo)游,其中該導(dǎo)游向觀光者解釋博物館中以該國語言確定的展品,觀光者通過其UMTS移動電話聽見由虛擬助理以很好的空間聲音分離出的該導(dǎo)游解釋的同聲翻譯,必要時還能同時留意在其UMTS移動電話的顯示單元上的展品的其它光學(xué)顯示的信息。
權(quán)利要求
1.一種虛擬助理,借助至少兩個電聲轉(zhuǎn)換器向數(shù)據(jù)終端設(shè)備的用戶輸出可聽見的信息,其特征在于,該虛擬助理可以由數(shù)據(jù)終端設(shè)備的用戶在空間中定位,從而可實現(xiàn)在借助電聲轉(zhuǎn)換器輸出的信息和其它由至少另一個聲源輸出的信息之間的更好的空間聲音分離。
2.根據(jù)權(quán)利要求1所述的虛擬助理,其特征在于,所述虛擬助理在空間中的定位可以通過在數(shù)據(jù)終端設(shè)備中對音頻信息進行有針對性的信號技術(shù)處理來實現(xiàn)。
3.根據(jù)權(quán)利要求1或2所述的虛擬助理,其特征在于,可以這樣定位所述虛擬助理,即為數(shù)據(jù)終端設(shè)備的用戶將所述虛擬助理定位在頭部附近和該用戶的一個肩膀后面。
4.根據(jù)上述權(quán)利要求中任一項所述的虛擬助理,其特征在于,所述虛擬助理在空間中的定位可以預(yù)調(diào)。
5.根據(jù)上述權(quán)利要求中任一項所述的虛擬助理,其特征在于,所述虛擬助理的定位可以借助一個機電輸入裝置來調(diào)整。
6.根據(jù)權(quán)利要求1至4中任一項所述的虛擬助理,其特征在于,所述虛擬助理的定位可以借助語音命令來調(diào)整。
7.根據(jù)權(quán)利要求1至4中任一項所述的虛擬助理,其特征在于,所述虛擬助理的定位可以借助在接觸靈敏的顯示單元上的輸入來調(diào)整。
8.根據(jù)上述權(quán)利要求中任一項所述的虛擬助理,其特征在于,所述虛擬助理可以用在移動數(shù)據(jù)終端設(shè)備中。
9.一種用于向數(shù)據(jù)終端設(shè)備的用戶提供虛擬助理的可聽見信息的方法,其中,該虛擬助理的可聽見信息通過至少兩個電聲轉(zhuǎn)換器輸出,其特征在于,為了改善在由虛擬助理通過電聲轉(zhuǎn)換器輸出的信息和其它由至少另一個聲源輸出的信息之間的空間聲音分離,在空間中定位所述數(shù)據(jù)終端設(shè)備的虛擬助理。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述數(shù)據(jù)終端設(shè)備另外配備有接收數(shù)據(jù)終端設(shè)備用戶的頭部運動的頭部位置傳感器,其中,在對音頻信息進行信號技術(shù)處理時這樣考慮該頭部運動,即所選擇的虛擬助理在空間中的位置在頭部運動時也保持不變。
全文摘要
本發(fā)明涉及一種虛擬助理,其借助至少兩個電聲轉(zhuǎn)換器向數(shù)據(jù)終端設(shè)備的用戶輸出可聽見的信息,以及一種用于向數(shù)據(jù)終端設(shè)備的用戶提供虛擬助理的可聽見信息的方法。為了在借助電聲轉(zhuǎn)換器輸出的信息和其它由至少另一個聲源輸出的信息之間實現(xiàn)更好的立體聲分離,可以由數(shù)據(jù)終端設(shè)備的用戶在空間中定位虛擬助理。由此用戶接收和處理來自虛擬助理和其它聲源的信息。但至少,使簡化了用戶對來自虛擬助理和其它聲源的信息的同時接收和處理。
文檔編號H04M1/27GK1615671SQ03802220
公開日2005年5月11日 申請日期2003年1月13日 優(yōu)先權(quán)日2002年1月14日
發(fā)明者羅蘭·奧鮑爾, 克里斯托弗·普爾施曼, 弗蘭克·洛倫茨, 斯蒂法諾·A·克林克, 邁克爾·許爾斯肯珀, 克里斯托弗·尤謝爾 申請人:西門子公司