最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種語(yǔ)音識(shí)別的方法和裝置制造方法

文檔序號(hào):2825446閱讀:219來(lái)源:國(guó)知局
一種語(yǔ)音識(shí)別的方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種語(yǔ)音識(shí)別的方法和裝置,其中方法包括:訓(xùn)練解碼網(wǎng)絡(luò)時(shí)采用上下文相關(guān)的隱馬爾科夫模型(HMM),在解碼網(wǎng)絡(luò)中的詞尾增加靜音(sil)模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文;利用所述解碼網(wǎng)絡(luò)獲得待識(shí)別語(yǔ)音的HMM狀態(tài)跳轉(zhuǎn)序列。更進(jìn)一步地,在解碼網(wǎng)絡(luò)中語(yǔ)言模型的末尾增加一條到該語(yǔ)言模型頭部的跳轉(zhuǎn)來(lái)模擬句間停頓對(duì)語(yǔ)言模型上下文信息的影響。通過(guò)本發(fā)明能夠提高語(yǔ)音識(shí)別的效果。
【專利說(shuō)明】一種語(yǔ)音識(shí)別的方法和裝置
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及計(jì)算機(jī)應(yīng)用【技術(shù)領(lǐng)域】,特別涉及一種語(yǔ)音識(shí)別的方法和裝置。
【【背景技術(shù)】】
[0002]語(yǔ)音識(shí)別技術(shù)是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程將語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)文本或命令的技術(shù),其中隱馬爾科夫模型(HMM)技術(shù)的成熟和不斷完善成為語(yǔ)音識(shí)別的主流方法。
[0003]HMM是對(duì)語(yǔ)音信號(hào)的時(shí)間序列結(jié)構(gòu)建立統(tǒng)計(jì)模型,將之看做一個(gè)數(shù)學(xué)上的雙重隨機(jī)過(guò)程:一個(gè)是用具有有限狀態(tài)數(shù)的馬爾科夫鏈來(lái)模擬語(yǔ)音信號(hào)統(tǒng)計(jì)特性變化的隱含的隨機(jī)過(guò)程,另一個(gè)是與馬爾科夫鏈的每一個(gè)狀態(tài)相關(guān)聯(lián)的觀測(cè)序列的隨機(jī)過(guò)程。前者通過(guò)后者表現(xiàn)出來(lái),但前者的具體參數(shù)是不可測(cè)的。人的言語(yǔ)過(guò)程實(shí)際上就是一個(gè)雙重隨機(jī)過(guò)程,語(yǔ)音信號(hào)本身是一個(gè)可觀測(cè)的時(shí)變序列,HMM合理地模仿了這一過(guò)程,是較為理想的一種語(yǔ)音模型。
[0004]基于HMM方法的語(yǔ)音識(shí)別原理是通過(guò)在所有可能的HMM狀態(tài)跳轉(zhuǎn)序列中找出最優(yōu)的跳轉(zhuǎn)序列,將其對(duì)應(yīng)的文本信息作為識(shí)別結(jié)果。而解碼網(wǎng)絡(luò)描述所有可能的HMM狀態(tài)跳轉(zhuǎn),語(yǔ)音識(shí)別就是在解碼網(wǎng)絡(luò)上搜尋最佳跳轉(zhuǎn)序列的過(guò)程,識(shí)別的結(jié)果一定是解碼網(wǎng)絡(luò)所能描述的所有可能中的一種。識(shí)別過(guò)程中HMM狀態(tài)跳轉(zhuǎn)的序列被稱為路徑。以只識(shí)別“中”和“國(guó)”的簡(jiǎn)單孤立詞為例,其解碼網(wǎng)絡(luò)如圖1所示,其中“中”對(duì)應(yīng)的HMM狀態(tài)跳轉(zhuǎn)序列為“4”、“0叩”,“國(guó)”對(duì)應(yīng)的!1麗狀態(tài)跳轉(zhuǎn)序列為1”、“110”,〈8>和</s>分別是語(yǔ)言模型的開(kāi)始和結(jié)束符號(hào)。
[0005]在人們說(shuō)話過(guò)程中,說(shuō)話人往往因思考、遲疑、咳嗽、驚訝、口吃等原因都會(huì)產(chǎn)生停頓,在語(yǔ)音信號(hào)中停頓會(huì)體現(xiàn)為一段時(shí)間沒(méi)有聲音,或者有聲音但不是語(yǔ)音聲,而是咳嗽或噴嚏聲。停頓在語(yǔ)音中分為句中`停頓和句間停頓,顧名思義,句中停頓指人在說(shuō)一句話的過(guò)程中的停頓,句間停頓指人在說(shuō)多句話時(shí),句與句之間的停頓。
[0006]在現(xiàn)有的語(yǔ)音識(shí)別中,一般認(rèn)為只在語(yǔ)音的頭尾有靜音,而語(yǔ)音中間是沒(méi)有停頓的,這樣在語(yǔ)音中有停頓時(shí)會(huì)把停頓錯(cuò)誤識(shí)別為有語(yǔ)義的詞,而且更嚴(yán)重的是,由于語(yǔ)音識(shí)別是個(gè)根據(jù)當(dāng)前狀態(tài)向后擴(kuò)展的過(guò)程,這種錯(cuò)誤會(huì)直接影響到后面的識(shí)別過(guò)程,導(dǎo)致識(shí)別結(jié)果錯(cuò)上加錯(cuò)。解決這個(gè)問(wèn)題的關(guān)鍵是正確的識(shí)別出語(yǔ)音中的停頓,使得后續(xù)的識(shí)別過(guò)程在正確的結(jié)果下向后進(jìn)行;而正確識(shí)別出語(yǔ)音中停頓的前提是在解碼網(wǎng)絡(luò)中正確的描述所有的HMM狀態(tài)跳轉(zhuǎn)的可能。
[0007]現(xiàn)有常用的方法是在解碼網(wǎng)絡(luò)中的詞尾增加靜音模型(sil模型),這樣在識(shí)別過(guò)程中遇到停頓時(shí),sil模型會(huì)與其他有語(yǔ)義的模型競(jìng)爭(zhēng),如果sil模型占優(yōu)勢(shì),則識(shí)別為停頓(又稱為被sil模型吸收)。圖2為在解碼網(wǎng)絡(luò)中增加sil模型的示意圖,圖中<s>和〈/s>分別是語(yǔ)言模型的開(kāi)始和結(jié)束符號(hào)。
[0008]但在實(shí)際應(yīng)用中,因?yàn)檎Z(yǔ)音中的停頓會(huì)影響附近的聲學(xué)發(fā)音,停頓時(shí)間越長(zhǎng)影響越大,另外,對(duì)于句間停頓語(yǔ)言模型的上下文信息會(huì)發(fā)生突變,現(xiàn)有技術(shù)中的識(shí)別方法并不能解決這些問(wèn)題,識(shí)別效果有限。【
【發(fā)明內(nèi)容】

[0009]本發(fā)明提供了一種語(yǔ)音識(shí)別的方法和裝置,以便于提高語(yǔ)音識(shí)別的效果。
[0010]具體技術(shù)方案如下:
[0011]一種語(yǔ)音識(shí)別的方法,該方法包括:
[0012]訓(xùn)練解碼網(wǎng)絡(luò)時(shí)采用上下文相關(guān)的隱馬爾科夫模型HMM,在解碼網(wǎng)絡(luò)中的詞尾增加靜音sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文;
[0013]利用所述解碼網(wǎng)絡(luò)獲得待識(shí)別語(yǔ)音的HMM狀態(tài)跳轉(zhuǎn)序列。
[0014]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述上下文相關(guān)的HMM中HMM狀態(tài)與音素的上下文相關(guān);
[0015]所述調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文具體為:將解碼網(wǎng)絡(luò)中該sil模型之前的HMM狀態(tài)中音素的下文替換為si I,將解碼網(wǎng)絡(luò)中該si I模型之后的HMM狀態(tài)中音素的上文替換為sil。
[0016]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,該方法還包括:在所述解碼網(wǎng)絡(luò)中語(yǔ)言模型的末尾增加一條到該語(yǔ)言模型頭部的跳轉(zhuǎn)。
[0017]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,該方法還包括:在所述HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語(yǔ)言模型確定最優(yōu)路徑后,如果最優(yōu)路徑中存在從所述語(yǔ)言模型的末尾至頭部的跳轉(zhuǎn),則確定存在句間停頓。
[0018]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,該方法還包括:`[0019]依據(jù)所述待識(shí)別語(yǔ)音的最優(yōu)路徑,在所述句間停頓的位置添加標(biāo)點(diǎn)符號(hào)。
[0020]一種語(yǔ)音識(shí)別的裝置,該裝置包括:
[0021]網(wǎng)絡(luò)訓(xùn)練單元,用于訓(xùn)練解碼網(wǎng)絡(luò)時(shí)采用上下文相關(guān)的隱馬爾科夫模型HMM,在解碼網(wǎng)絡(luò)中的詞尾增加靜音sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文;
[0022]路徑確定單元,用于利用所述解碼網(wǎng)絡(luò)獲得待識(shí)別語(yǔ)音的HMM狀態(tài)跳轉(zhuǎn)序列。
[0023]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述上下文相關(guān)的HMM中HMM狀態(tài)與音素的上下文相關(guān);
[0024]所述網(wǎng)絡(luò)訓(xùn)練單元在調(diào)整sil模型前后HMM狀態(tài)的聲學(xué)上下文時(shí),具體將解碼網(wǎng)絡(luò)中該si I模型之前的HMM狀態(tài)中音素的下文替換為si I,將解碼網(wǎng)絡(luò)中該si I模型之后的HMM狀態(tài)中音素的上文替換為sil。
[0025]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述網(wǎng)絡(luò)訓(xùn)練單元,還用于在所述解碼網(wǎng)絡(luò)中語(yǔ)言模型的末尾增加一條到該語(yǔ)言模型頭部的跳轉(zhuǎn)。
[0026]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述路徑確定單元,還用于在所述HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語(yǔ)言模型確定最優(yōu)路徑;
[0027]該裝置還包括:
[0028]停頓識(shí)別單元,用于如果所述路徑確定單元確定出的最優(yōu)路徑中存在從所述語(yǔ)言模型的末尾至頭部的跳轉(zhuǎn),則確定存在句間停頓。
[0029]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述停頓識(shí)別單元,還用于依據(jù)所述待識(shí)別語(yǔ)音的最優(yōu)路徑,在所述句間停頓的位置添加標(biāo)點(diǎn)符號(hào)。
[0030]由以上技術(shù)方案可以看出,本發(fā)明在訓(xùn)練解碼網(wǎng)絡(luò)時(shí)采用上下文相關(guān)的HMM模型,在解碼網(wǎng)絡(luò)中的詞尾增加sil模型并調(diào)整sil模型前后HMM狀態(tài)的聲學(xué)上下文的方式,模擬停頓對(duì)聲學(xué)模型上下文的影響,基于該解碼網(wǎng)絡(luò)進(jìn)行的語(yǔ)音識(shí)別提高了語(yǔ)音識(shí)別的效果O
【【專利附圖】

【附圖說(shuō)明】】
[0031]圖1為解碼網(wǎng)絡(luò)的一個(gè)簡(jiǎn)單實(shí)例圖;
[0032]圖2為現(xiàn)有技術(shù)中在解碼網(wǎng)絡(luò)中增加sil模型的示意圖;
[0033]圖3為本發(fā)明實(shí)施例提供的解碼網(wǎng)絡(luò)的一種示意圖;
[0034]圖4為本發(fā)明實(shí)施例提供的解碼網(wǎng)絡(luò)的另一種示意圖;
[0035]圖5為本發(fā)明實(shí)施例提供的語(yǔ)音識(shí)別裝置的結(jié)構(gòu)圖。
【【具體實(shí)施方式】】
[0036]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述。
[0037]對(duì)于語(yǔ)音識(shí)別的過(guò)程實(shí)際上是依賴于所訓(xùn)練的解碼網(wǎng)絡(luò)的,也就是說(shuō),語(yǔ)音識(shí)別至少包含兩個(gè)過(guò)程:第一個(gè)是解碼網(wǎng)絡(luò)的訓(xùn)練過(guò)程,第二個(gè)是基于解碼網(wǎng)絡(luò)對(duì)待識(shí)別語(yǔ)音進(jìn)行的語(yǔ)音識(shí)別過(guò)程。其中,對(duì)待識(shí)別語(yǔ)音進(jìn)行的語(yǔ)音識(shí)別過(guò)程中涉及到聲學(xué)模型的查詢和語(yǔ)言模型的查詢,聲學(xué)模型的查詢是基于解碼網(wǎng)絡(luò)查詢聲學(xué)模型(本發(fā)明實(shí)施例中用的聲學(xué)模型包括HMM和sil模型)以獲得待識(shí)別語(yǔ)音的HMM狀態(tài)跳轉(zhuǎn)序列,語(yǔ)言模型的查詢是基于解碼網(wǎng)絡(luò)查詢語(yǔ)言模型,從而確定出最優(yōu)路徑獲得語(yǔ)音識(shí)別的結(jié)果。
[0038]在本發(fā)明實(shí)施例中`訓(xùn)練解碼網(wǎng)絡(luò)時(shí)采用上下文相關(guān)的HMM,在解碼網(wǎng)絡(luò)中的詞尾增加sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文。
[0039]首先對(duì)上下文相關(guān)的HMM進(jìn)行簡(jiǎn)單介紹,所謂上下文相關(guān)的HMM用于描述同一個(gè)音素的HMM隨著聲學(xué)音素上下文的不同而不同,以“中國(guó)”為例,采用上下文無(wú)關(guān)的HMM描述時(shí),HMM狀態(tài)跳轉(zhuǎn)序列為:“zh”、“0ng”、“g”和“uo”,此時(shí)的解碼網(wǎng)絡(luò)如圖1中所示。如果米用上下文相關(guān)的HMM描述時(shí),HMM狀態(tài)跳轉(zhuǎn)序列為:“zh+ong”、“zh-ong+g”、“ong-g+uo”、“g-uo”,其中“ + ”表示下文,表示上文,例如“zh+ong”表示“zh”的下文為“ong”時(shí)的狀態(tài),“zh-ong+g”表示“ong”的上文為“zh”且下文為“g”的狀態(tài),“g-uo”表示“g”的下文為“uo”的狀態(tài)。
[0040]在本發(fā)明實(shí)施例中,在解碼網(wǎng)絡(luò)中的詞尾增加sil模型,sil模型是語(yǔ)音識(shí)別中用來(lái)描述靜音、噪聲、非語(yǔ)音、停頓等的HMM,由于語(yǔ)音中的停頓會(huì)影響到附近的聲學(xué)發(fā)音,因此在解碼網(wǎng)絡(luò)中的詞尾增加sil模型后,需要對(duì)聲學(xué)的上下文進(jìn)行調(diào)整,使得新增加的sil模型附近的聲學(xué)上下文符合相關(guān)原則。具體地,可以將解碼網(wǎng)絡(luò)中該sil模型之前的HMM狀態(tài)中音素的下文替換為sil,將解碼網(wǎng)絡(luò)中該sil模型之后的HMM狀態(tài)中音素的上文替換為sil。如圖3所示,將“ong”的下文替換為“sil”,將“uo”的下文也替換為“sil”,將“zh”的上文替換為“sil”,將“g”的上文替換為“sil”。
[0041]進(jìn)行上述增加sil模型和調(diào)整聲學(xué)上下文后,同樣以“中國(guó)”為例,HMM狀態(tài)跳轉(zhuǎn)序列為 “ s i 1-zh ”、“ zh-ong+s i I ”、“ s i I ”、“ s i 1-g+uo ”、“ g-guo+s i I ”。
[0042]上述方式中增加的sil模型是統(tǒng)一的靜音模型,語(yǔ)音中的停頓對(duì)聲學(xué)上下文的影響主要是對(duì)前后發(fā)音因素的影響,而非靜音音素本身,上述通過(guò)調(diào)整插入的sil模型附近的聲學(xué)上下文的方式準(zhǔn)確地描述了這種影響,從而能夠提高識(shí)別效果。
[0043]在語(yǔ)音識(shí)別過(guò)程中,對(duì)于聲學(xué)模型查詢和語(yǔ)言模型查詢的方式以及最優(yōu)路徑的確定方式均不發(fā)生變化,在確定最優(yōu)路徑的過(guò)程中,在詞尾處,sil模型與其他HMM模型進(jìn)行競(jìng)爭(zhēng),如果sil模型勝出,則該處語(yǔ)音被識(shí)別為sil。
[0044]對(duì)于句間停頓這種特殊的情況,在停頓處語(yǔ)言模型的上下文信息會(huì)發(fā)生突變,假設(shè)一段語(yǔ)音的內(nèi)容是Wl、W2、W3、W4,其中在W2和W3之間存在停頓。如果這段語(yǔ)音是一句話,則這是個(gè)句中停頓,那么對(duì)應(yīng)的最優(yōu)路徑為:<s>Wl W2 W3 W4〈/s>。如果這段語(yǔ)音是兩句話,則是個(gè)句間停頓,對(duì)應(yīng)的最優(yōu)路徑為:〈s>Wl W2〈/s>〈s>W3 W4〈/s>,也就是說(shuō),W2的語(yǔ)言模型下文從W3變成了 </s>,W3的語(yǔ)言模型上文從W2變成了〈S〉。為了實(shí)現(xiàn)句間停頓的識(shí)別,在本發(fā)明實(shí)施例中可以進(jìn)一步在解碼網(wǎng)絡(luò)中語(yǔ)言模型的末尾</s>增加一條到該語(yǔ)言模型頭部<s>的跳轉(zhuǎn),如圖4所示。
[0045]在語(yǔ)音識(shí)別過(guò)程中,在語(yǔ)言模型末尾,該語(yǔ)言模型的下文會(huì)在</s>和其他語(yǔ)言模型之間競(jìng)爭(zhēng),對(duì)于句間停頓</s>會(huì)勝出。仍以Wl、W2、W3、W4的語(yǔ)音為例,在識(shí)別到W2的語(yǔ)言模型時(shí),W2的語(yǔ)言模型下文在</s>和W3的語(yǔ)言模型之間競(jìng)爭(zhēng),如果是句間停頓,則〈/s>會(huì)勝出,如果是句中停頓,則W3會(huì)勝出。
[0046]在解碼網(wǎng)絡(luò)中語(yǔ)言模型的末尾</s>增加一條到該語(yǔ)言模型頭部〈S〉的跳轉(zhuǎn)之后,采用該解碼網(wǎng)絡(luò)進(jìn)行語(yǔ)音識(shí)別過(guò)程中,在聲學(xué)模型查詢得到的HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語(yǔ)言模型,確定最優(yōu)路徑后,如果最優(yōu)路徑中存在從語(yǔ)言模型的末尾至頭部的跳轉(zhuǎn),則確定存在句間停頓。以圖4所示解碼網(wǎng)絡(luò)為例,通過(guò)該解碼網(wǎng)絡(luò)進(jìn)行語(yǔ)音識(shí)別時(shí),由于增加了從語(yǔ)言模型末尾</s>到該語(yǔ)言模型頭部〈S〉的跳轉(zhuǎn),在最優(yōu)路徑計(jì)算過(guò)程中,“中”至“國(guó)”的跳轉(zhuǎn)增加了 “中”至停頓的跳轉(zhuǎn),如果“中”至停頓的跳轉(zhuǎn)勝出,則說(shuō)明“中”為句尾,“中”和“國(guó)”之間的停頓為句間停頓,在最優(yōu)路徑中就體現(xiàn)為“中”的語(yǔ)言模型的末尾</s>到頭部<s>的跳轉(zhuǎn),標(biāo)識(shí)就是識(shí)別結(jié)果中存在“〈/sXs〉”。
[0047]句間停頓的識(shí)別可以用于在語(yǔ)音識(shí)別結(jié)果基礎(chǔ)上,在句間停頓的位置添加標(biāo)點(diǎn)符號(hào),標(biāo)點(diǎn)符號(hào)的添加類型本發(fā)明并不加以限定,可以采用諸如依據(jù)停頓時(shí)長(zhǎng)設(shè)置不同的標(biāo)點(diǎn)符號(hào),例如停頓時(shí)長(zhǎng)較短添加逗號(hào),停頓時(shí)長(zhǎng)較長(zhǎng)添加句號(hào)等。
[0048]以上是對(duì)本發(fā)明所提供方法進(jìn)行的詳細(xì)描述,下面對(duì)本發(fā)明所提供的裝置進(jìn)行詳細(xì)描述。
[0049]圖5為本發(fā)明實(shí)施例提供的語(yǔ)音識(shí)別裝置的結(jié)構(gòu)圖,如圖5所示,該裝置可以包括:網(wǎng)絡(luò)訓(xùn)練單元500和路徑確定單元510。
[0050]其中網(wǎng)絡(luò)訓(xùn)練單元500訓(xùn)練解碼網(wǎng)絡(luò)時(shí)采用上下文相關(guān)的HMM,在解碼網(wǎng)絡(luò)中的詞尾增加sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文。
[0051]路徑確定單元510利用解碼網(wǎng)絡(luò)獲得待識(shí)別語(yǔ)音的HMM狀態(tài)跳轉(zhuǎn)序列。
[0052]上述上下文相關(guān)的HMM中HMM狀態(tài)與音素的上下文相關(guān),即用于描述同一個(gè)音素的HMM隨著聲學(xué)音素上下文的不同而不同。此種情況下,網(wǎng)絡(luò)訓(xùn)練單元500在調(diào)整sil模型前后HMM狀態(tài)的聲學(xué)上下文時(shí),具體將解碼網(wǎng)絡(luò)中該Si I模型之前的HMM狀態(tài)中音素的下文替換為sil,將解碼網(wǎng)絡(luò)中該sil模型之后的HMM狀態(tài)中音素的上文替換為sil。
[0053]除了上述緩解停頓對(duì)語(yǔ)音中聲學(xué)上下文的影響之外,對(duì)于句間停頓處語(yǔ)言模型的上下文信息發(fā)生突變的情況,網(wǎng)絡(luò)訓(xùn)練單元500,還用于在解碼網(wǎng)絡(luò)中語(yǔ)言模型的末尾〈/s>增加一條到該語(yǔ)言模型頭部的跳轉(zhuǎn)〈S〉。
[0054]上述的獲取HMM狀態(tài)跳轉(zhuǎn)序列是聲學(xué)模型的查詢過(guò)程,除此之外,還會(huì)結(jié)合語(yǔ)言模型的查詢確定最優(yōu)路徑,即路徑確定單元500,還用于在HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語(yǔ)言模型確定最優(yōu)路徑。
[0055]進(jìn)一步地,該裝置還可以包括:停頓識(shí)別單元520,用于如果路徑確定單元510確定出的最優(yōu)路徑中存在從語(yǔ)言模型的末尾</s>至頭部〈S〉的跳轉(zhuǎn),則確定存在句間停頓。更進(jìn)一步的應(yīng)用可以是諸如在句間停頓的位置添加標(biāo)點(diǎn)符號(hào)。
[0056]由以上描述可以看出,本發(fā)明提供的方法和裝置具備以下優(yōu)點(diǎn):
[0057]I)本發(fā)明在訓(xùn)練解碼網(wǎng)絡(luò)時(shí)采用上下文相關(guān)的HMM模型,在解碼網(wǎng)絡(luò)中的詞尾增加sil模型并調(diào)整sil模型前后HMM狀態(tài)的聲學(xué)上下文的方式,模擬停頓對(duì)聲學(xué)模型上下文的影響,基于該解碼網(wǎng)絡(luò)進(jìn)行的語(yǔ)音識(shí)別提高了語(yǔ)音識(shí)別的效果。
[0058]2)本發(fā)明在解碼網(wǎng)絡(luò)中增加語(yǔ)言模型的末尾至頭部的跳轉(zhuǎn)來(lái)模擬句間停頓,解決句間停頓引起的語(yǔ)言模型上下文信息發(fā)生突變所帶來(lái)的影響,更進(jìn)一步提高語(yǔ)音識(shí)別的效果O
[0059]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【權(quán)利要求】
1.一種語(yǔ)音識(shí)別的方法,其特征在于,該方法包括: 訓(xùn)練解碼網(wǎng)絡(luò)時(shí)采用上下文相關(guān)的隱馬爾科夫模型HMM,在解碼網(wǎng)絡(luò)中的詞尾增加靜音sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文; 利用所述解碼網(wǎng)絡(luò)獲得待識(shí)別語(yǔ)音的HMM狀態(tài)跳轉(zhuǎn)序列。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述上下文相關(guān)的HMM中HMM狀態(tài)與音素的上下文相關(guān); 所述調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文具體為:將解碼網(wǎng)絡(luò)中該sil模型之前的HMM狀態(tài)中音素的下文替換為si I,將解碼網(wǎng)絡(luò)中該si I模型之后的HMM狀態(tài)中音素的上文替換為sil。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法還包括:在所述解碼網(wǎng)絡(luò)中語(yǔ)言模型的末尾增加一條到該語(yǔ)言模型頭部的跳轉(zhuǎn)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,該方法還包括:在所述HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語(yǔ)言模型確定最優(yōu)路徑后,如果最優(yōu)路徑中存在從所述語(yǔ)言模型的末尾至頭部的跳轉(zhuǎn),則確定存在句間停頓。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,該方法還包括: 依據(jù)所述待識(shí)別語(yǔ)音的最優(yōu)路徑,在所述句間停頓的位置添加標(biāo)點(diǎn)符號(hào)。
6.一種語(yǔ)音識(shí)別的裝置,其特征在于,該裝置包括: 網(wǎng)絡(luò)訓(xùn)練單元,用于訓(xùn)練解碼網(wǎng)絡(luò)時(shí)采用上下文相關(guān)的隱馬爾科夫模型HMM,在解碼網(wǎng)絡(luò)中的詞尾增加靜音sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文; 路徑確定單元,用于利用所述解碼網(wǎng)絡(luò)獲得待識(shí)別語(yǔ)音的HMM狀態(tài)跳轉(zhuǎn)序列。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述上下文相關(guān)的HMM中HMM狀態(tài)與音素的上下文相關(guān); 所述網(wǎng)絡(luò)訓(xùn)練單元在調(diào)整sil模型前后HMM狀態(tài)的聲學(xué)上下文時(shí),具體將解碼網(wǎng)絡(luò)中該sil模型之前的HMM狀態(tài)中音素的下文替換為sil,將解碼網(wǎng)絡(luò)中該sil模型之后的HMM狀態(tài)中音素的上文替換為sil。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述網(wǎng)絡(luò)訓(xùn)練單元,還用于在所述解碼網(wǎng)絡(luò)中語(yǔ)言模型的末尾增加一條到該語(yǔ)言模型頭部的跳轉(zhuǎn)。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述路徑確定單元,還用于在所述HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語(yǔ)言模型確定最優(yōu)路徑; 該裝置還包括: 停頓識(shí)別單元,用于如果所述路徑確定單元確定出的最優(yōu)路徑中存在從所述語(yǔ)言模型的末尾至頭部的跳轉(zhuǎn),則確定存在句間停頓。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述停頓識(shí)別單元,還用于依據(jù)所述待識(shí)別語(yǔ)音的最優(yōu)路徑,在所述句間停頓的位置添加標(biāo)點(diǎn)符號(hào)。
【文檔編號(hào)】G10L15/14GK103680500SQ201210314129
【公開(kāi)日】2014年3月26日 申請(qǐng)日期:2012年8月29日 優(yōu)先權(quán)日:2012年8月29日
【發(fā)明者】錢勝 申請(qǐng)人:北京百度網(wǎng)訊科技有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1