本發(fā)明實施例涉及信號處理技術(shù)領(lǐng)域,具體涉及一種基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模方法和系統(tǒng)。
背景技術(shù):
虛擬現(xiàn)實領(lǐng)域的爆發(fā)使得虛擬聽覺受到越來越多的關(guān)注。虛擬現(xiàn)實包含虛擬視覺和虛擬聽覺,其中,虛擬聽覺技術(shù)的重點問題是恢復(fù)與自然聽覺相同的定位特征。人類的聽覺過程通??梢暈槁曉?信道-接收模型,其中信道包含聲源經(jīng)過人體不同部位的衍射、干擾,最終到達鼓膜的過程,可看作一個空間數(shù)字濾波器,稱為頭相關(guān)傳輸函數(shù)(Head-Related Transfer Function,HRTF),它包含了聲波與身體部位之間的交互引起的所有譜特征。由于每個人的生理結(jié)構(gòu)不盡相同,HRTF譜特征是極其個性化的。然而,很難對每個個體在全空間內(nèi)測量HRTF。另一個問題是很難對密集測量的HRTF數(shù)據(jù)庫有效存儲。對此,一種解決方法是將HRTF建模到低維空間,諸如采用主成分分析方法或者空間主成分分析,將空間的變化建模為少量主成分的聯(lián)合。然而,這些方法很難將離散測量的HRTF插值成全空間的連續(xù)HRTF。另一種方法是采用基于表面球諧函數(shù)的建模(Spherical Harmonics-based Modeling,SHM))方法,它的主要優(yōu)點在于HRTF可以在全空間建模為相對少量的球諧擴展系數(shù)的線性組合,因此,整個HRTF數(shù)據(jù)庫僅需要少量數(shù)據(jù)表示。
球諧函數(shù)采用度進行截斷,度在基于球諧函數(shù)的建模中起到非常重要的作用。度的選擇影響著模型的復(fù)雜度與譜失真性能。傳統(tǒng)方法中直接選擇一個偏大的數(shù),或者根據(jù)人的主觀聽覺選擇。然而,存在兩個問題:
(1)由于人的聽覺感知中不同的子帶的重要性是不同的,因此,對所有子帶分配相同的度是不合理的,而一些子帶設(shè)置不同度數(shù)的研究沒有太多理論依據(jù);
(2)如果選擇的度數(shù)偏小,將會造成模型欠擬合,從而在插值為全空間連續(xù)HRTF時將會以高概率產(chǎn)生較大的譜失真。
有鑒于此,特提出本發(fā)明。
技術(shù)實現(xiàn)要素:
為解決上述的一個或多個問題,本發(fā)明提供了一種基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模方法,能夠簡單地得到低譜失真的全空間連續(xù)頭相關(guān)傳輸函數(shù)。此外,本發(fā)明實施例還提供一種基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模系統(tǒng)。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了以下技術(shù)方案:
一種基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模方法,所述方法至少包括:
獲取待測量的所述頭相關(guān)傳輸函數(shù);
處理所述待測量的頭相關(guān)傳輸函數(shù),生成最小相位頭相關(guān)傳輸函數(shù),并去除全測量方向的最小相位幅度均值,得到空間差異性最小相位頭相關(guān)傳輸函數(shù);
對所述空間差異性最小相位頭相關(guān)傳輸函數(shù)進行建模,得到稀疏球諧系數(shù);
通過所述稀疏球諧系數(shù)插值,并根據(jù)空間的方位生成全空間的連續(xù)頭相關(guān)傳輸函數(shù)。
進一步地,所述處理所述待測量的頭相關(guān)傳輸函數(shù),生成最小相位頭相關(guān)傳輸函數(shù),并去除全測量方向的最小相位幅度均值,得到空間差異性最小相位頭相關(guān)傳輸函數(shù),具體包括:
去除所述待測量的頭相關(guān)傳輸函數(shù)中非最小相位部分,得到最小相位頭相關(guān)傳輸函數(shù);
根據(jù)以下公式計算全測量方向的最小相位幅度均值,得到方向相關(guān)的共性分量:
其中,所述dj表示第j個位置處的水平角和仰角;所述S表示測量位置的總數(shù)目;所述|Hmin(dj,fi)|表示所述最小相位頭相關(guān)傳輸函數(shù)的幅度;所述fi表示第i個頻帶;所述i取正整數(shù);所述Havg(fi)表示所述方向相關(guān)的共性分量;
根據(jù)以下公式在每個頭相關(guān)傳輸函數(shù)的測量方位上,從最小相位對數(shù)幅度中去除所述方向相關(guān)的共性分量,得到空間差異性最小相位頭相關(guān)傳輸函數(shù):
Hp(ds,fi)=20log10|Hmin(ds,fi)|-Havg(fi),
其中,所述ds表示第s個位置處的水平角和仰角;所述|Hmin(ds,fi)|表示所述最小相位頭相關(guān)傳輸函數(shù)的幅度;所述Havg(fi)表示所述方向相關(guān)的共性分量;所述Hp(ds,fi)表示第s個位置、第i個頻帶fi的空間差異性最小相位幅度。
進一步地,所述對所述空間差異性最小相位頭相關(guān)傳輸函數(shù)進行建模,得到稀疏球諧系數(shù),具體包括:
根據(jù)以下公式計算設(shè)定測量位置處的球諧函數(shù):
其中,所述l表示所述球諧函數(shù)的度數(shù);所述m表示所述球諧函數(shù)的階數(shù);所述n表示勒讓德函數(shù)的度數(shù);所述表示所述度數(shù)為n、所述階數(shù)為m的所述勒讓德函數(shù);所述表示所述測量位置為d處的球諧函數(shù);所述d=(θ,φ)表示所示測量位置d,其中水平角為θ,仰角為φ;
對所述空間差異性最小相位頭相關(guān)傳輸函數(shù)幅度與其所述球諧函數(shù)的平方誤差進行L1規(guī)整,得到誤差最小化的模型;
通過K次交叉驗證方法獲取所述模型最優(yōu)的稀疏度,從而得到稀疏球諧系數(shù)。
進一步地,所述通過所述稀疏球諧系數(shù)插值,并根據(jù)空間的方位生成全空間的連續(xù)頭相關(guān)傳輸函數(shù),具體包括:
根據(jù)以下公式通過所述稀疏球諧系數(shù)重建測量位置上的最小相位連續(xù)頭相關(guān)傳輸函數(shù)幅度估計與聲波到達左耳與右耳的時間差估計:
其中,所述表示所述測量位置ds處第i個頻帶的左、右耳空間差異性最小相位連續(xù)頭相關(guān)傳輸函數(shù)幅度的估計;所述表示l從集合中取值,l=0,...,Nm;所述表示第i個頻帶的Nm個球諧系數(shù)中不為0的系數(shù)所在的位置;所述表示所述測量位置ds處聲波到達左耳與右耳的時間差估計;所述表示所述稀疏球諧系數(shù);所述Yl(ds)表示所述測量位置ds處的所述球諧函數(shù);L取正整數(shù);
根據(jù)以下公式確定左、右耳連續(xù)頭相關(guān)傳輸函數(shù):
其中,所述表示所述左耳頭相關(guān)傳輸函數(shù);所述表示所述右耳頭相關(guān)傳輸函數(shù);所述T0表示聲波到達右耳的時間,T0=Lr/v,其中,所述Lr表示聲波距離右耳的距離,所述v表示聲速;
根據(jù)空間不同的方位,確定所述左、右耳連續(xù)頭相關(guān)傳輸函數(shù),得到所述全空間的連續(xù)頭相關(guān)傳輸函數(shù)。
進一步地,所述方法還包括:
根據(jù)下式對所述全空間的連續(xù)頭相關(guān)傳輸函數(shù)進行對數(shù)譜失真評估:
其中,所述S表示空間內(nèi)測量點數(shù)目,所述Nf表示子帶數(shù)目;所述表示所述左、右耳連續(xù)頭相關(guān)傳輸函數(shù);所述H(d,fk)表示測量得到的所述左右耳頭相關(guān)傳輸函數(shù);所述fk表示第k個頻帶;所述k1和所述k2分別表示對比的頻帶范圍為從第k1個頻帶到第k2個頻帶;所述表示所有的測量頭相關(guān)傳輸函數(shù)的空間位置集合;
對所述全空間的連續(xù)頭相關(guān)傳輸函數(shù)進行絕對對數(shù)譜失真和相對對數(shù)譜失真評估。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明的另一個方面,還提供了一種基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模系統(tǒng),所述系統(tǒng)至少包括:
一種基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模系統(tǒng),所述系統(tǒng)至少包括:
獲取模塊,用于獲取待測量的所述頭相關(guān)傳輸函數(shù);
處理模塊,與所述獲取模塊相連,用于處理所述待測量的頭相關(guān)傳輸函數(shù),生成最小相位頭相關(guān)傳輸函數(shù),并去除全測量方向的最小相位幅度均值,得到空間差異性最小相位頭相關(guān)傳輸函數(shù);
建模模塊,與所述處理模塊相連,用于對所述空間差異性最小相位頭相關(guān)傳輸函數(shù)進行建模,得到稀疏球諧系數(shù);
生成模塊,與所述建模模塊相連用于通過所述稀疏球諧系數(shù)插值,并根據(jù)空間的方位生成全空間的連續(xù)頭相關(guān)傳輸函數(shù)。
進一步地,所述處理模塊具體包括:
第一去除模塊:用于去除所述待測量的頭相關(guān)傳輸函數(shù)中非最小相位部分,得到最小相位頭相關(guān)傳輸函數(shù);
方向相關(guān)的共性分量獲取模塊,與所述第一去除模塊相連,用于根據(jù)以下公式計算全測量方向的最小相位幅度均值,得到方向相關(guān)的共性分量:
其中,所述dj表示第j個位置處的水平角和仰角;所述S表示測量位置的總數(shù)目;所述|Hmin(dj,fi)|表示所述最小相位頭相關(guān)傳輸函數(shù)的幅度;所述fi表示第i個頻帶;所述i取正整數(shù);所述Havg(fi)表示所述方向相關(guān)的共性分量;
第二去除模塊,與所述方向相關(guān)的共性分量獲取模塊相連,用于根據(jù)以下公式在每個頭相關(guān)傳輸函數(shù)的測量方位上,從最小相位對數(shù)幅度中去除所述方向相關(guān)的共性分量,得到空間差異性最小相位頭相關(guān)傳輸函數(shù):
Hp(ds,fi)=20log10|Hmin(ds,fi)|-Havg(fi),
其中,所述ds表示第s個位置處的水平角和仰角;所述|Hmin(ds,fi)|表示所述最小相位頭相關(guān)傳輸函數(shù)的幅度;所述Havg(fi)表示所述方向相關(guān)的共性分量;所述Hp(ds,fi)表示第s個位置、第i個頻帶fi的空間差異性最小相位幅度。
進一步地,所述建模模塊具體包括:
計算模塊,用于根據(jù)以下公式計算設(shè)定測量位置處的球諧函數(shù):
其中,所述l表示所述球諧函數(shù)的度數(shù);所述m表示所述球諧函數(shù)的階數(shù);所述n表示勒讓德函數(shù)的度數(shù);所述表示所述度數(shù)為n、所述階數(shù)為m的所述勒讓德函數(shù);所述表示所述測量位置為d處的球諧函數(shù);所述d=(θ,φ)表示所示測量位置d,其中水平角為θ,仰角為φ;
規(guī)整模塊,與所述計算模塊相連,用于對所述空間差異性最小相位頭相關(guān)傳輸函數(shù)幅度與其所述球諧函數(shù)的平方誤差進行L1規(guī)整,得到誤差最小化的模型;
稀疏度獲取模塊,與所述規(guī)整模塊相連,用于通過K次交叉驗證方法獲取所述模型最優(yōu)的稀疏度,從而得到稀疏球諧系數(shù)。
進一步地,所述生成模塊具體包括:
重建模塊,用于根據(jù)以下公式通過所述稀疏球諧系數(shù)重建測量位置上的最小相位連續(xù)頭相關(guān)傳輸函數(shù)幅度估計與聲波到達左耳與右耳的時間差估計:
其中,所述表示所述測量位置ds處第i個頻帶的左、右耳空間差異性最小相位連續(xù)頭相關(guān)傳輸函數(shù)幅度的估計;所述表示l從集合中取值,l=0,...,Nm;所述表示第i個頻帶的Nm個球諧系數(shù)中不為0的系數(shù)所在的位置;所述表示所述測量位置ds處聲波到達左耳與右耳的時間差估計;所述表示所述稀疏球諧系數(shù);所述Yl(ds)表示所述測量位置ds處的所述球諧函數(shù);L取正整數(shù);
第一確定模塊,與所述重建模塊相連,用于根據(jù)以下公式確定左、右耳連續(xù)頭相關(guān)傳輸函數(shù):
其中,所述表示所述左耳頭相關(guān)傳輸函數(shù);所述表示所述右耳頭相關(guān)傳輸函數(shù);所述T0表示聲波到達右耳的時間,T0=Lr/v,其中,所述Lr表示聲波距離右耳的距離,所述v表示聲速;
第二確定模塊,與所述第一確定模塊相連,用于根據(jù)空間不同的方位,確定所述左、右耳連續(xù)頭相關(guān)傳輸函數(shù),得到所述全空間的連續(xù)頭相關(guān)傳輸函數(shù)。
進一步地,所述系統(tǒng)還包括:
對數(shù)譜失真評估模塊,與所述生成模塊相連,用于根據(jù)下式對所述全空間的連續(xù)頭相關(guān)傳輸函數(shù)進行對數(shù)譜失真評估:
其中,所述S表示空間內(nèi)測量點數(shù)目,所述Nf表示子帶數(shù)目;所述表示所述左、右耳連續(xù)頭相關(guān)傳輸函數(shù);所述H(d,fk)表示測量得到的所述左右耳頭相關(guān)傳輸函數(shù);所述fk表示第k個頻帶;所述k1和所述k2分別表示對比的頻帶范圍為從第k1個頻帶到第k2個頻帶;所述表示所有的測量頭相關(guān)傳輸函數(shù)的空間位置集合;對數(shù)譜失真評估模塊,與所述生成模塊相連,用于對所述全空間的連續(xù)頭相關(guān)傳輸函數(shù)進行絕對對數(shù)譜失真和相對對數(shù)譜失真評估。
從上述技術(shù)方案可以看出,本發(fā)明基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模方法和系統(tǒng)具有以下有益效果:
對待測量的頭相關(guān)傳輸函數(shù)進行處理,生成最小相位頭相關(guān)傳輸函數(shù),并去除全測量方向的最小相位幅度均值,得到空間差異性最小相位頭相關(guān)傳輸函數(shù);對空間差異性最小相位頭相關(guān)傳輸函數(shù)進行建模,得到稀疏球諧系數(shù);通過稀疏球諧系數(shù)插值,并根據(jù)空間的方位生成全空間的連續(xù)頭相關(guān)傳輸函數(shù)。由此,降低了測量的頭相關(guān)傳輸函數(shù)中的干擾,最大程度上保留了頭相關(guān)傳輸函數(shù)的關(guān)鍵特征,從而大大降低了全空間連續(xù)HRTF的插值譜失真程度;而且還降低了計算復(fù)雜度,所需要的存儲量小,便于應(yīng)用到實際虛擬現(xiàn)實系統(tǒng)中進行動態(tài)環(huán)境繪制;另外還可以隨測量對象和數(shù)據(jù)自動進行度數(shù)選擇,因此不受個體個性的限制,具有高魯棒性,便于在實際環(huán)境中的應(yīng)用。
本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其它優(yōu)點可通過在所寫的說明書、權(quán)利要求書以及附圖中所特別指出的方法來實現(xiàn)和獲得。
附圖說明
附圖作為本發(fā)明的一部分,用來提供對本發(fā)明的進一步的理解,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,但不構(gòu)成對本發(fā)明的不當(dāng)限定。顯然,下面描述中的附圖僅僅是一些實施例,對于本領(lǐng)域普通技術(shù)人員來說,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他附圖。在附圖中:
圖1為根據(jù)一示例性實施例示出的基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模方法的流程示意圖;
圖2為根據(jù)另一示例性實施例示出的基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模系統(tǒng)的結(jié)構(gòu)示意圖。
這些附圖和文字描述并不旨在以任何方式限制本發(fā)明的保護范圍,而是通過參考特定實施例為本領(lǐng)域技術(shù)人員說明本發(fā)明的概念。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,以下結(jié)合具體實施例,并參照附圖,對本發(fā)明進一步詳細說明。
需要說明的是,在附圖或說明書描述中,相似或相同的部分都使用相同的圖號。且在附圖中,以簡化或是方便標示。再者,附圖中未繪示或描述的實現(xiàn)方式,為所屬技術(shù)領(lǐng)域中普通技術(shù)人員所知的形式。另外,雖然本文可提供包含特定值的參數(shù)的示范,但應(yīng)了解,參數(shù)無需確切等于相應(yīng)的值,而是可在可接受的誤差容限或設(shè)計約束內(nèi)近似于相應(yīng)的值。
本發(fā)明示例性實施例的基本思想是構(gòu)建頭相關(guān)傳輸函數(shù)的稀疏化模型,通過對模型誤差進行L1規(guī)整,得到表示大數(shù)據(jù)量頭相關(guān)傳輸函數(shù)的球諧擴展系數(shù),從而將頭相關(guān)傳輸函數(shù)采用一組向量化參數(shù)進行描述,最終可從離散測量的頭相關(guān)傳輸函數(shù)中得到全空間方向的連續(xù)頭相關(guān)傳輸函數(shù),為動態(tài)場景的虛擬聽覺繪制提供基礎(chǔ)。
本發(fā)明實施例提供一種基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模方法。如圖1所示,該方法可以包括:步驟S100至步驟S130。
S100:獲取待測量的頭相關(guān)傳輸函數(shù)。
S110:處理待測量的頭相關(guān)傳輸函數(shù),生成最小相位頭相關(guān)傳輸函數(shù),并去除全測量方向的最小相位幅度均值,得到空間差異性最小相位頭相關(guān)傳輸函數(shù)。
本步驟中得到的空間差異性最小相位頭相關(guān)傳輸函數(shù)為不含方向共性成分的最小相位頭相關(guān)傳輸函數(shù),其中,每個方向的頭相關(guān)傳輸函數(shù)中主要包含該方向的傳輸特點。
S120:對空間差異性最小相位頭相關(guān)傳輸函數(shù)進行建模,得到稀疏球諧系數(shù)。
具體地,本步驟利用空間差異性最小相位頭相關(guān)傳輸函數(shù)幅度計算稀疏球諧系數(shù)。本步驟將大數(shù)據(jù)量的頭相關(guān)傳輸函數(shù)進行稀疏表示。
S130:通過稀疏球諧系數(shù)插值,并根據(jù)空間的方位生成全空間的連續(xù)頭相關(guān)傳輸函數(shù)。
本發(fā)明實施例自動去除對建模貢獻較小的系數(shù),降低了測量的頭相關(guān)傳輸函數(shù)中的干擾,最大程度上保留了頭相關(guān)傳輸函數(shù)的關(guān)鍵特征,從而大大降低了全空間連續(xù)頭相關(guān)傳輸函數(shù)的插值譜失真程度,另外,本發(fā)明實施例可以隨測量對象和數(shù)據(jù)自動進行度數(shù)選擇的算法,因此不受個體個性的限制,具有較高的魯棒性。
在一些實施例中,步驟S110可以進一步包括:步驟S111至步驟S113。
S111:去除待測量的頭相關(guān)傳輸函數(shù)中非最小相位部分,得到最小相位頭相關(guān)傳輸函數(shù)。
本步驟中,可以根據(jù)以下公式確定最小相位頭相關(guān)傳輸函數(shù)的幅度和相位:
|Hmin(θ,φ,f)|=|H(θ,φ,f)|
其中,H(θ,φ,f)表示待測量的頭相關(guān)傳輸函數(shù);θ表示測量位置的水平角;φ表示測量位置的仰角;f表示頻率;ξ表示某一時刻的瞬時頻率。
S112:根據(jù)以下公式計算全測量方向的最小相位幅度均值,得到方向相關(guān)的共性分量:
其中,dj表示第j個位置處的水平角和仰角,dj=(θj,φj);S表示測量位置的總數(shù)目;|Hmin(dj,fi)|表示最小相位頭相關(guān)傳輸函數(shù)的幅度;fi表示第i個頻帶;i取正整數(shù);Havg(fi)表示方向相關(guān)的共性分量(即全測量方向的最小相位幅度均值)。
S113:根據(jù)以下公式在每個頭相關(guān)傳輸函數(shù)的測量方位上,從最小相位對數(shù)幅度中去除方向相關(guān)的共性分量,得到空間差異性最小相位頭相關(guān)傳輸函數(shù):
Hp(ds,fi)=20log10|Hmin(ds,fi)|-Havg(fi),
其中,ds表示第s個位置處的水平角和仰角,ds=(θs,φs);|Hmin(ds,fi)|表示最小相位頭相關(guān)傳輸函數(shù)的幅度;Havg(fi)表示方向相關(guān)的共性分量;Hp(ds,fi)表示第s個位置、第i個頻帶fi的空間差異性最小相位幅度。
在一些實施例中,步驟S120可以進一步包括:步驟S121至步驟S123。
S121:根據(jù)以下公式計算設(shè)定測量位置處的球諧函數(shù):
其中,l表示球諧函數(shù)的度數(shù);m表示球諧函數(shù)的階數(shù);n表示勒讓德函數(shù)的度數(shù);表示度數(shù)為n、階數(shù)為m的勒讓德函數(shù);表示測量位置為d處的球諧函數(shù)(即球諧函數(shù)展開);d=(θ,φ)表示所示測量位置d,其中水平角為θ,仰角為φ。
S122:對空間差異性最小相位頭相關(guān)傳輸函數(shù)幅度與其球諧函數(shù)的平方誤差進行L1規(guī)整,得到誤差最小化的模型。
本步驟中,通過對模型的平方誤差進行L1規(guī)整,得到模型誤差最小化問題,即:
其中,L為每個測量點單耳HRTF幅度的數(shù)目;S表示測量位置的總數(shù)目;ds表示第s個位置處的水平角和仰角,ds=(θs,φs);為稀疏球諧擴展系數(shù);Nm=(N0+1)2,其中N0為允許的最大度,Nm個基函數(shù)為為規(guī)整化因子,控制模型的稀疏度,取值范圍為0~1;T(ds)表示測量位置ds處聲波到達左耳與右耳的時間差;表示測量位置ds處左耳第i個頻帶的空間差異性最小相位幅度;表示測量位置ds處右耳第i個頻帶的空間差異性最小相位幅度。
上述和可以通過步驟S113中用到的公式得到。
本發(fā)明實施例通過對模型誤差最小化問題進行L1規(guī)整,自動去除對建模貢獻較小的系數(shù)(即對重建頭相關(guān)傳輸函數(shù)和測量頭相關(guān)傳輸函數(shù)的譜之間的差距影響較小的系數(shù)),降低了測量的頭相關(guān)傳輸函數(shù)中的干擾,最大程度上保留了頭相關(guān)傳輸函數(shù)的關(guān)鍵特征,從而大大降低了全空間連續(xù)HRTF的插值譜失真程度。
S123:通過K次交叉驗證方法獲取模型最優(yōu)的稀疏度,從而得到稀疏球諧系數(shù)。
具體地,對所有數(shù)據(jù)平均分割成K個子樣本,將一個單獨的子樣本被保留作為驗證模型的數(shù)據(jù),并將其他K-1個樣本用來訓(xùn)練。然后,重復(fù)K次,每個子樣本驗證一次,平均K次的結(jié)果作為最優(yōu)的λi。最后,對所有數(shù)據(jù)采用LASSO算法計算,從而可以得到稀疏球諧系數(shù),也即稀疏球諧擴展系數(shù)。使用LASSO算法進行稀疏求解計算的具體步驟可參見相關(guān)現(xiàn)有技術(shù),在此不再贅述。
在一些實施例中,步驟S130可以進一步包括:步驟S131至步驟S133。
S131:根據(jù)以下公式通過稀疏球諧系數(shù)重建測量位置上的最小相位連續(xù)頭相關(guān)傳輸函數(shù)幅度估計與聲波到達左耳與右耳的時間差估計:
其中,表示ds處第i個頻帶的左、右耳空間差異性最小相位連續(xù)頭相關(guān)傳輸函數(shù)幅度的估計;表示l從集合中取值,l=0,...,Nm;表示第i個頻帶的Nm個球諧系數(shù)中不為0的系數(shù)所在的位置;表示測量位置ds處聲波到達左耳與右耳的時間差估計;L取正整數(shù);表示稀疏球諧系數(shù);Yl(ds)表示測量位置ds處的球諧函數(shù)(其可以通過步驟S121中用到的公式得到)。
S132:根據(jù)以下公式確定左、右耳連續(xù)頭相關(guān)傳輸函數(shù):
其中,表示左耳連續(xù)頭相關(guān)傳輸函數(shù);表示右耳連續(xù)頭相關(guān)傳輸函數(shù);T0表示聲波到達右耳的時間,T0=Lr/v,其中,Lr表示聲波距離右耳的距離,v表示聲速,優(yōu)選地,聲速為340m/s。
S133:根據(jù)空間不同的方位,確定左、右耳連續(xù)頭相關(guān)傳輸函數(shù),得到全空間的連續(xù)頭相關(guān)傳輸函數(shù)。
本步驟根據(jù)不同的方位點ds,最終可獲得全空間方位的連續(xù)的頭相關(guān)傳輸函數(shù)。
此外,本發(fā)明實施例還可以包括步驟S140。
S140:對全空間的連續(xù)頭相關(guān)傳輸函數(shù)進行評估。
本步驟對基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模的性能進行評估。
評估方式包括但不限于對數(shù)譜失真與存儲量評估。
在實際應(yīng)用中,可以根據(jù)下式進行對數(shù)譜失真評估:
其中,S表示空間內(nèi)測量點數(shù)目,Nf表示子帶數(shù)目;表示左、右耳連續(xù)頭相關(guān)傳輸函數(shù);H(d,fk)表示測量得到的左右耳頭相關(guān)傳輸函數(shù);fk表示第k個頻帶;k1和k2分別表示對比的頻帶范圍為從第k1個頻帶到第k2個頻帶;表示所有的測量頭相關(guān)傳輸函數(shù)的空間位置集合。
存儲量評估包括絕對對數(shù)譜失真和相對對數(shù)譜失真。其中,絕對對數(shù)譜失真定義為減少的模型數(shù)目與原始需要存放的數(shù)據(jù)庫之比。相對對數(shù)譜失真用于傳統(tǒng)基于建模方法,獲得直觀的性能對比。
通過采取上述實施方式,本發(fā)明實施例提出了一種全面評估算法的復(fù)雜度和準確度的評估方式。
上述實施例中雖然將各個步驟按照上述先后次序的方式進行了描述,但是本領(lǐng)域技術(shù)人員可以理解,為了實現(xiàn)本實施例的效果,不同的步驟之間不必按照這樣的次序執(zhí)行,其可以同時(并行)執(zhí)行或以顛倒的次序執(zhí)行,這些簡單的變化都在本發(fā)明的保護范圍之內(nèi)。
基于與方法實施例相同的技術(shù)構(gòu)思,本發(fā)明實施例還提供一種基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模系統(tǒng)。該系統(tǒng)20可以包括:獲取模塊22、處理模塊24、建模模塊26和生成模塊28。其中,獲取模塊22用于獲取待測量的頭相關(guān)傳輸函數(shù)。處理模塊24與獲取模塊22相連,用于處理待測量的頭相關(guān)傳輸函數(shù),生成最小相位頭相關(guān)傳輸函數(shù),并去除全測量方向的最小相位幅度均值,得到空間差異性最小相位頭相關(guān)傳輸函數(shù)。建模模塊26與處理模塊24相連,用于對空間差異性最小相位頭相關(guān)傳輸函數(shù)進行建模,得到稀疏球諧系數(shù)。生成模塊28與建模模塊26相連用于通過稀疏球諧系數(shù)插值,并根據(jù)空間的方位生成全空間的連續(xù)頭相關(guān)傳輸函數(shù)。
在一些實施例中,處理模塊24具體包括:第一去除模塊、方向相關(guān)的共性分量獲取模塊和第二去除模塊。其中,第一去除模塊用于去除待測量的頭相關(guān)傳輸函數(shù)中非最小相位部分,得到最小相位頭相關(guān)傳輸函數(shù)。方向相關(guān)的共性分量獲取模塊,與第一去除模塊相連,用于根據(jù)以下公式計算全測量方向的最小相位幅度均值,得到方向相關(guān)的共性分量:
其中,dj表示第j個位置處的水平角和仰角;S表示測量位置的總數(shù)目;|Hmin(dj,fi)|表示最小相位頭相關(guān)傳輸函數(shù)的幅度;fi表示第i個頻帶;i取正整數(shù);Havg(fi)表示方向相關(guān)的共性分量。第二去除模塊與方向相關(guān)的共性分量獲取模塊相連,用于根據(jù)以下公式在每個頭相關(guān)傳輸函數(shù)的測量方位上,從最小相位對數(shù)幅度中去除方向相關(guān)的共性分量,得到空間差異性最小相位頭相關(guān)傳輸函數(shù):
Hp(ds,fi)=20log10|Hmin(ds,fi)|-Havg(fi),
其中,ds表示第s個位置處的水平角和仰角;|Hmin(ds,fi)|表示最小相位頭相關(guān)傳輸函數(shù)的幅度;Havg(fi)表示方向相關(guān)的共性分量;Hp(ds,fi)表示第s個位置、第i個頻帶fi的空間差異性最小相位幅度。
在一些實施例中,建模模塊具體包括:計算模塊、規(guī)整模塊和稀疏度獲取模塊。其中,計算模塊用于根據(jù)以下公式計算設(shè)定測量位置處的球諧函數(shù):
其中,l表示所述球諧函數(shù)的度數(shù);m表示球諧函數(shù)的階數(shù);n表示勒讓德函數(shù)的度數(shù);表示度數(shù)為n、階數(shù)為m的勒讓德函數(shù);表示測量位置為d處的球諧函數(shù);d=(θ,φ)。規(guī)整模塊與計算模塊相連,用于對空間差異性最小相位頭相關(guān)傳輸函數(shù)幅度與其球諧函數(shù)的平方誤差進行L1規(guī)整,得到誤差最小化的模型。稀疏度獲取模塊與規(guī)整模塊相連,用于通過K次交叉驗證方法獲取模型最優(yōu)的稀疏度,從而得到稀疏球諧系數(shù)。
在一些實施例中,生成模塊具體包括:重建模塊、第一確定模塊和第二確定模塊。其中,重建模塊用于根據(jù)以下公式通過稀疏球諧系數(shù)重建測量位置上的最小相位連續(xù)頭相關(guān)傳輸函數(shù)幅度估計與聲波到達左耳與右耳的時間差估計:
其中,表示所述測量位置ds處第i個頻帶的左、右耳空間差異性最小相位連續(xù)頭相關(guān)傳輸函數(shù)幅度的估計;表示l從集合中取值,l=0,...,Nm;L取正整數(shù);表示第i個頻帶的Nm個球諧系數(shù)中不為0的系數(shù)所在的位置;表示所述測量位置ds處聲波到達左耳與右耳的時間差估計;表示稀疏球諧系數(shù);Yl(ds)表示所述測量位置ds處的球諧函數(shù)。第一確定模塊與重建模塊相連,用于根據(jù)以下公式確定左、右耳連續(xù)頭相關(guān)傳輸函數(shù):
其中,表示左耳頭相關(guān)傳輸函數(shù);表示右耳頭相關(guān)傳輸函數(shù);T0表示聲波到達右耳的時間,T0=Lr/v,其中,Lr表示聲波距離右耳的距離,v表示聲速。第二確定模塊與第一確定模塊相連,用于根據(jù)空間不同的方位,確定左、右耳連續(xù)頭相關(guān)傳輸函數(shù),得到全空間的連續(xù)頭相關(guān)傳輸函數(shù)。
在一些實施例中,上述系統(tǒng)還可以包括:對數(shù)譜失真評估模塊和對數(shù)譜失真評估模塊。其中,對數(shù)譜失真評估模塊與生成模塊相連,用于根據(jù)下式對全空間的連續(xù)頭相關(guān)傳輸函數(shù)進行對數(shù)譜失真評估:
其中,S表示空間內(nèi)測量點數(shù)目,Nf表示子帶數(shù)目;表示左、右耳連續(xù)頭相關(guān)傳輸函數(shù);H(d,fk)表示測量得到的左右耳頭相關(guān)傳輸函數(shù);fk表示第k個頻帶;k1和k2分別表示對比的頻帶范圍為從第k1個頻帶到第k2個頻帶;表示所有的測量頭相關(guān)傳輸函數(shù)的空間位置集合。對數(shù)譜失真評估模塊與生成模塊相連,用于對全空間的連續(xù)頭相關(guān)傳輸函數(shù)進行絕對對數(shù)譜失真和相對對數(shù)譜失真評估。
需要說明的是,上述實施例提供的基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模系統(tǒng)在進行建模時,僅以上述各功能模塊的劃分進行舉例說明,在實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊來完成,即將本發(fā)明實施例中的模塊或者步驟再分解或者組合,例如,上述實施例的模塊可以合并為一個模塊,也可以進一步拆分成多個子模塊,以完成以上描述的全部或者部分功能。對于本發(fā)明實施例中涉及的模塊、步驟的名稱,僅僅是為了區(qū)分各個模塊或者步驟,不視為對本發(fā)明的不當(dāng)限定。
本領(lǐng)域技術(shù)人員可以理解,上述基于球諧函數(shù)的頭相關(guān)傳輸函數(shù)的稀疏建模系統(tǒng)還可以包括一些其他公知結(jié)構(gòu),例如處理器、控制器、存儲器和總線等,其中,存儲器包括但不限于隨機存儲器、閃存、只讀存儲器、可編程只讀存儲器、易失性存儲器、非易失性存儲器、串行存儲器、并行存儲器或寄存器等,處理器包括但不限于CPLD/FPGA、DSP、ARM處理器、MIPS處理器等,為了不必要地模糊本公開的實施例,這些公知的結(jié)構(gòu)未在圖2中示出。
應(yīng)該理解,圖2中的各個模塊的數(shù)量僅僅是示意性的。根據(jù)實際需要,各模塊可以具有任意的數(shù)量。
上述系統(tǒng)實施例可以用于執(zhí)行上述方法實施例,其技術(shù)原理、所解決的技術(shù)問題及產(chǎn)生的技術(shù)效果相似,所屬技術(shù)領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng)的具體工作過程及有關(guān)說明,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。
應(yīng)指出的是,上面分別對本發(fā)明的系統(tǒng)實施例和方法實施例進行了描述,但是對一個實施例描述的細節(jié)也可應(yīng)用于另一個實施例。
以上對本發(fā)明實施例所提供的技術(shù)方案進行了詳細的介紹。雖然本文應(yīng)用了具體的個例對本發(fā)明的原理和實施方式進行了闡述,但是,上述實施例的說明僅適用于幫助理解本發(fā)明實施例的原理;同時,對于本領(lǐng)域技術(shù)人員來說,依據(jù)本發(fā)明實施例,在具體實施方式以及應(yīng)用范圍之內(nèi)均會做出改變。
需要說明的是,本文中涉及到的流程圖或框圖不僅僅局限于本文所示的形式,其還可以進行其他劃分和/或組合。
還需要說明的是:附圖中的標記和文字只是為了更清楚地說明本發(fā)明,不視為對本發(fā)明保護范圍的不當(dāng)限定。
術(shù)語“包括”或者任何其它類似用語旨在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備/裝置不僅包括那些要素,而且還包括沒有明確列出的其它要素,或者還包括這些過程、方法、物品或者設(shè)備/裝置所固有的要素。
如本文中所使用的,術(shù)語“模塊”可以指代在計算系統(tǒng)上執(zhí)行的軟件對象或例程??梢詫⒈疚闹兴枋龅牟煌K實現(xiàn)為在計算系統(tǒng)上執(zhí)行的對象或過程(例如,作為獨立的線程)。雖然優(yōu)選地以軟件來實現(xiàn)本文中所描述的系統(tǒng)和方法,但是以硬件或者軟件和硬件的組合的實現(xiàn)也是可以的并且是可以被設(shè)想的。
術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不是用于描述或表示特定的順序或先后次序。
本發(fā)明的各個步驟可以用通用的計算裝置來實現(xiàn),例如,它們可以集中在單個的計算裝置上,例如:個人計算機、服務(wù)器計算機、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備或者多處理器裝置,也可以分布在多個計算裝置所組成的網(wǎng)絡(luò)上,它們可以以不同于此處的順序執(zhí)行所示出或描述的步驟,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。因此,本發(fā)明不限于任何特定的硬件和軟件或者其結(jié)合。
本發(fā)明提供的方法還可以使用可編程邏輯器件來實現(xiàn),也可以實施為計算機程序軟件或程序模塊(其包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件或數(shù)據(jù)結(jié)構(gòu)等等),例如根據(jù)本發(fā)明的實施例可以是一種計算機程序產(chǎn)品,運行該計算機程序產(chǎn)品使計算機執(zhí)行用于所示范的方法。所述計算機程序產(chǎn)品包括計算機可讀存儲介質(zhì),該介質(zhì)上包含計算機程序邏輯或代碼部分,用于實現(xiàn)所述方法。所述計算機可讀存儲介質(zhì)可以是被安裝在計算機中的內(nèi)置介質(zhì)或者可以從計算機主體上拆卸下來的可移動介質(zhì)(例如:采用熱插拔技術(shù)的存儲設(shè)備)。所述內(nèi)置介質(zhì)包括但不限于可重寫的非易失性存儲器,例如:RAM、ROM、快閃存儲器和硬盤。所述可移動介質(zhì)包括但不限于:光存儲介質(zhì)(例如:CD-ROM和DVD)、磁光存儲介質(zhì)(例如:MO)、磁存儲介質(zhì)(例如:磁帶或移動硬盤)、具有內(nèi)置的可重寫非易失性存儲器的媒體(例如:存儲卡)和具有內(nèi)置ROM的媒體(例如:ROM盒)。
還應(yīng)當(dāng)注意,本說明書中使用的語言主要是為了可讀性和教導(dǎo)的目的而選擇的,而不是為了解釋或者限定本發(fā)明的主題而選擇的。
本發(fā)明并不限于上述實施方式,在不背離本發(fā)明實質(zhì)內(nèi)容的情況下,本領(lǐng)域普通技術(shù)人員可以想到的任何變形、改進或替換均落入本發(fā)明的保護范圍。