最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種語音采集識別方法與系統(tǒng)與流程

文檔序號:11262547閱讀:864來源:國知局
一種語音采集識別方法與系統(tǒng)與流程

本發(fā)明屬于應(yīng)用語音采集公共設(shè)備領(lǐng)域,具體涉及一種語音麥陣列采集及電子智能識別方法與系統(tǒng)。



背景技術(shù):

目前的手機(jī)語音采集方案中,手機(jī)正面設(shè)置二個采集點,背面設(shè)置一個采集點。正面的采集點有人的語音及噪聲,手機(jī)的背面采集則都是噪聲。把背面采集的噪聲的聲頻信號與前面的相同聲頻信號對應(yīng)上,一起列入不識別聲頻信號,剩下的就是語音需識別的聲頻信號。

目前已有手機(jī)語音識別方面的專利申請,例如中國專利申請?zhí)?01510941682.0的發(fā)明專利申請,公開了一種手機(jī)語音識別模塊,包括:錄音模塊、語音存儲模塊、語音辨識模塊、語音轉(zhuǎn)化模塊、中央處理模塊五部分,所述錄音模塊與所述語音存儲模塊相連接,所述語音存儲模塊與所述語音辨識模塊相連接,所述語音辨識模塊與所述語音轉(zhuǎn)化模塊相連接,所述語音轉(zhuǎn)化模塊與所述中央處理模塊相連接。通過上述方式,該發(fā)明能夠讓使用者通過語言命令進(jìn)行手機(jī)操作,方便快捷。

上述這類解決方案用于手機(jī),不能用于開放的公共環(huán)境下,對噪音的聲頻信號識別能力有限。



技術(shù)實現(xiàn)要素:

本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的。

具體的,根據(jù)本發(fā)明的一個方面,本發(fā)明公開了一種語音采集識別系統(tǒng),包括:語音采集客戶端系統(tǒng)和云計算機(jī),所述語音采集客戶端系統(tǒng)采集聲音信號并區(qū)分和保存所述聲音信號中的噪音信號和語音信號;所述云計算機(jī)根據(jù)語音采集客戶端系統(tǒng)得到的語音信號轉(zhuǎn)換成語言文字,并糾正上述語言文字的邏輯關(guān)系,最后得到被識別的語音信號的文字信息。

優(yōu)選的,所述語音采集客戶端系統(tǒng)包含:多個麥點,采用列陣布局,用于采集聲音信號,以進(jìn)行進(jìn)一步的音頻識別;前臺噪聲數(shù)據(jù)庫模塊,用于比對所采集的聲音信號的音頻物理屬性,從而進(jìn)行分類。

優(yōu)選的,云計算機(jī)包括:識別端口,用于接收語音采集客戶端系統(tǒng)發(fā)送的語音信號和噪聲信號,識別和合并語音信號,并發(fā)送給聲頻轉(zhuǎn)換語言文字系統(tǒng);聲頻轉(zhuǎn)換語言文字系統(tǒng),用于接收識別端口發(fā)送的語音信號,將其轉(zhuǎn)換成文字并發(fā)送給語言智能邏輯關(guān)系糾正系統(tǒng);語言智能邏輯關(guān)系糾正系統(tǒng),用于接收聲頻轉(zhuǎn)換語言文字系統(tǒng)發(fā)送的文字,依次進(jìn)行語言邏輯關(guān)系對照、識別關(guān)系、智能糾正語句,最終得到被識別的語音信號的文字信息,并存儲在數(shù)據(jù)庫中。

優(yōu)選的,所述前臺噪聲數(shù)據(jù)庫模塊能夠自動關(guān)閉記錄噪音頻率超過50%的麥點單元。

優(yōu)選的,所述多個麥點為多個前后上下位置多變化的語音采集點。

根據(jù)本發(fā)明的另一個方面,本發(fā)明還公開了一種語音采集識別方法,包括如下步驟:采集步驟,采集聲音信號并區(qū)分和保存所述聲音信號中的噪音信號和語音信號;識別步驟,根據(jù)得到的語音信號轉(zhuǎn)換成語言文字,并糾正上述語言文字的邏輯關(guān)系,最后得到被識別的語音信號的文字信息。

優(yōu)選的,所述識別步驟具體包括如下步驟:根據(jù)所述語音信號和噪聲信號,識別和合并語音信號;將所述語音信號轉(zhuǎn)換成文字;對上述文字依次進(jìn)行語言邏輯關(guān)系對照、識別關(guān)系、智能糾正語句,最終得到被識別的語音信號的文字信息,并存儲在數(shù)據(jù)庫中。

優(yōu)選的,通過對各個語音采集點的音準(zhǔn)比對,來測定語音采集點擺放的位置是否最為合理。

優(yōu)選的,區(qū)分所述噪聲信號和語音信號時采用近似算法。

優(yōu)選的,根據(jù)得到的語音信號轉(zhuǎn)換成語言文字時,既識別語音信號的語種類別,也通過漢語言學(xué)中的語言邏輯及地方語言關(guān)系智能比對,最終轉(zhuǎn)換成對應(yīng)的語言文字。

本發(fā)明的優(yōu)點在于:本發(fā)明是通過初始地段的環(huán)境音頻采集,整理、分類、模型制作、回輸客戶前臺備份、早期判斷識別,最后建立一個標(biāo)準(zhǔn)適用的當(dāng)?shù)丨h(huán)境的采集語音最佳配置去應(yīng)用。本發(fā)明能夠制定最佳的所在公共場所的采集音頻的列陣方案并調(diào)整,達(dá)到最經(jīng)濟(jì)效果最理想的應(yīng)用陣型。并且本發(fā)明可以作為一種流程化的萬能公式應(yīng)用實際,從而節(jié)省人力物力,提高語音采集效率。

附圖說明

通過閱讀下文優(yōu)選實施方式的詳細(xì)描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:

附圖1示出了根據(jù)本發(fā)明實施方式的語音麥陣列采集過程示意圖。

附圖2示出了根據(jù)本發(fā)明實施方式的語音麥陣列采集及電子智能識別過程示意圖。

具體實施方式

下面將參照附圖更詳細(xì)地描述本公開的示例性實施方式。雖然附圖中顯示了本公開的示例性實施方式,然而應(yīng)當(dāng)理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施方式所限制。相反,提供這些實施方式是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。

根據(jù)本發(fā)明的實施方式,提出一種用于提高語音識別水平,抗噪音及物理電磁干擾的采集語音的方法及系統(tǒng)。

本發(fā)明在公共場景下設(shè)立公用的開放式語音識別應(yīng)用,在制定采集音頻方案第一步時,對現(xiàn)場的噪音音頻采集及辨識信號制定,并能及時上傳到主服器處理,制定出辨識信號后回輸給客戶端(公共場景下采集音頻設(shè)備)備份,這樣在第一時間內(nèi)就可以對噪音信號識別并處理。確保語音信號快速上傳云計算平臺轉(zhuǎn)化成文字,經(jīng)過在計算機(jī)語言計算及漢語言邏輯智能糾正,輸入搜索引擎找到正確的對應(yīng)答案回輸給客戶端,可以滿足廣大普通用戶的語音詢問需求。

具體的,如圖1、2所示,本發(fā)明所述的語音采集識別系統(tǒng),包括:語音采集客戶端系統(tǒng)和云計算機(jī),所述語音采集客戶端系統(tǒng)采集聲音信號并區(qū)分和保存所述聲音信號中的噪音信號和語音信號;所述云計算機(jī)根據(jù)語音采集客戶端系統(tǒng)得到的語音信號轉(zhuǎn)換成語言文字,并糾正上述語言文字的邏輯關(guān)系,最后得到被識別的語音信號的文字信息。

其中,所述語音采集客戶端系統(tǒng)包含:多個麥點,采用列陣布局,用于采集聲音信號,以進(jìn)行進(jìn)一步的音頻識別;前臺噪聲數(shù)據(jù)庫模塊,用于比對所采集的聲音信號的音頻物理屬性,從而進(jìn)行分類。

其中,云計算機(jī)包括:識別端口,用于接收語音采集客戶端系統(tǒng)發(fā)送的語音信號和噪聲信號,識別和合并語音信號,并發(fā)送給聲頻轉(zhuǎn)換語言文字系統(tǒng);聲頻轉(zhuǎn)換語言文字系統(tǒng),用于接收識別端口發(fā)送的語音信號,將其轉(zhuǎn)換成文字并發(fā)送給語言智能邏輯關(guān)系糾正系統(tǒng);語言智能邏輯關(guān)系糾正系統(tǒng),用于接收聲頻轉(zhuǎn)換語言文字系統(tǒng)發(fā)送的文字,依次進(jìn)行語言邏輯關(guān)系對照、識別關(guān)系、智能糾正語句,最終得到被識別的語音信號的文字信息,并存儲在數(shù)據(jù)庫中。所述語言智能邏輯關(guān)系糾正系統(tǒng)采用了漢語言文學(xué)中的語言情感信號,即聲調(diào)表述及邏輯表述,從而起到智能糾正及智能延伸,給予計算機(jī)搜索引擎最佳的作業(yè)根據(jù)。

本發(fā)明的工作原理如下:首先語音采集客戶端系統(tǒng)采集語音,然后進(jìn)入聲頻識別1程式(識別是否有語音信號),如圖1所示,如果經(jīng)過聲頻識別1程式識別,沒有語音信號,就上傳云計算機(jī)的識別端口,進(jìn)入聲頻識別2程式識別。如圖2所示,如果聲頻識別2程式識別出是噪聲信號,那么就按照其特征制定信號模型并存儲數(shù)據(jù)庫中,然后回轉(zhuǎn)給采集客戶端系統(tǒng)備份。如果聲頻識別2程式識別為語音信號,則傳給云計算機(jī)的聲頻轉(zhuǎn)換語言文字系統(tǒng)。如果所述語音信號中沒有情感特性,則得到文字信息后直接結(jié)束轉(zhuǎn)換,如果所述語音信號有情感特性(升降調(diào)等)就轉(zhuǎn)入云計算機(jī)的語言智能邏輯關(guān)系糾正系統(tǒng),進(jìn)行語言邏輯關(guān)系對照,然后識別內(nèi)在關(guān)系所表述的真實內(nèi)容,最后把聲頻模型存儲在單獨(dú)的數(shù)據(jù)庫中以備后用。

上述對聲音信號的分類時,根據(jù)噪聲和語音特有的屬性進(jìn)行區(qū)分。例如,自然界中的背景噪聲往往類似于白噪聲的性質(zhì)。本發(fā)明使用時,可以在采集語音信號之前先采集噪聲信號(圖2中的聲頻識別2),記錄噪聲信號特征并保存在云計算機(jī)中,用于將來的語音信號識別。當(dāng)正式采集聲音信號(即圖1和圖2中的聲頻識別1)時,通過將獲得的聲音信號減去先前保存的背景噪聲信號,從而很容易得出語音信號。

本發(fā)明的語音信號,可以根據(jù)算法進(jìn)行進(jìn)一步的分類。例如英語、日語、和漢語的發(fā)音習(xí)慣會各有不同的特點。根據(jù)已知的語音識別算法,可以對這些不同的語言進(jìn)行區(qū)分。再者,本發(fā)明根據(jù)地域口音發(fā)音習(xí)慣,還能夠區(qū)分漢語中的地方語音,并根據(jù)聲調(diào)音頻特點的不同,區(qū)分是疑問句還是陳述句等等。

優(yōu)選的,所述前臺噪聲數(shù)據(jù)庫模塊還能夠自動關(guān)閉記錄噪音頻率超過50%的麥點單元。原因是,噪音出現(xiàn)率高的麥點為一定環(huán)境下高發(fā)生率噪音點。

本發(fā)明改傳統(tǒng)單一的一個語音采集點為多個前后上下位置多變化的語音采集點,減少一個或若干個采集點強(qiáng)噪音共鳴等原因?qū)φZ音麥的干擾。語言的音頻信號與噪音的音頻信號有很大的差別,令其對標(biāo)準(zhǔn)的語音信號及噪音信號多點項位進(jìn)行對比,這樣將大多數(shù)語音信號保留并選出,同時將噪音信號及雜音信號選出隔離。最后對語音信號特征的信號進(jìn)行合成分析。

本發(fā)明應(yīng)用時,通過對各個采集點的音準(zhǔn)比對,來測定語音麥列陣擺放的前后上下左右位置是否最為合理。分析這一地段的噪音環(huán)境,比對調(diào)試成最佳狀態(tài)。通過云平臺計算對多點語音綜合確認(rèn)的表述內(nèi)容進(jìn)行智能分析,主要通過漢語言學(xué)中的語言邏輯及地方語言關(guān)系智能比對,最終滿足戶外公共環(huán)境中對語音識別的需求。

本發(fā)明在識別噪聲信號和語音信號時也可以采用近似算法。近似算法首先給出最優(yōu)解的一個下界,然后把算法的運(yùn)行結(jié)果與這個下界進(jìn)行比較。對于最大化問題,先給出一個上界然后把算法的運(yùn)行結(jié)果與這個上界比較。

近似算法比較經(jīng)典的問題包括:最小頂點覆蓋、旅行售貨員問題、集合覆蓋等。對于這類問題,通常可采取以下幾種解題策略。

(1)只對問題的特殊實例求解;

(2)用動態(tài)規(guī)劃法或分支限界法求解;

(3)用概率算法求解;

(4)只求近似解;

(5)用啟發(fā)式方法求解。

通過近似算法區(qū)分出語音信號和噪聲信號,進(jìn)而合并同類音頻,選出語音信號并保存,同時選出噪聲信號并保存。

以上所述,僅為本發(fā)明較佳的具體實施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1