一種基于深度學習的智慧視聽設備多業(yè)務控制方法及系統(tǒng)與流程

文檔序號：11097788閱讀：來源：國知局

技術特征：

1.一種基于深度學習的智慧視聽設備多業(yè)務控制方法，其特征在于，所述方法包括：

麥克風陣列以特定頻率監(jiān)聽采集用戶發(fā)出的語音控制信號；

語音預處理模塊對語音控制信號進行提取，獲得MFCC原始語音特征信息；檢測MFCC原始語音特征的對數(shù)能量是否大于閾值；若是，則由互聯(lián)網(wǎng)連接模塊發(fā)送MFCC原始語音特征信息到遠程GPU服務器；

遠程GPU服務器接收到MFCC原始語音特征信息，根據(jù)MFCC原始語音特征信息獲得深度語音特征信息，并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊；

互聯(lián)網(wǎng)連接模塊將控制信號標識信息傳遞給控制信號解析模塊，由控制信號解析模塊根據(jù)控制信號標識信息生成控制信號編碼，選擇對應的控制信號輸出模塊，將控制信號編碼傳遞給該控制信號輸出模塊；

控制信號輸出模塊根據(jù)控制信號編碼發(fā)送控制信號給智慧視聽設備。

2.如權利要求1所述的基于深度學習的智慧視聽設備多業(yè)務控制方法，其特征在于，所述語音預處理模塊對語音控制信號進行提取，獲得MFCC原始語音特征信息的步驟，包括：

對語音控制信號進行端點檢測及分割處理；

對分割處理后的語音控制信號進行降噪處理；

對降噪處理后的語音控制信號進行MFCC原始語音特征提取，獲得MFCC原始語音特征信息。

3.如權利要求1所述的基于深度學習的智慧視聽設備多業(yè)務控制方法，其特征在于，所述遠程GPU服務器接收到MFCC原始語音特征信息，對MFCC原始語音特征信息進行深度語音特征提取，獲得深度語音特征信息的步驟，包括：

遠程GPU服務器接收到MFCC原始語音特征信息，啟動深度學習語音識別程序，采用biLSTM算法對MFCC原始語音特征信息進行深度語音特征提取，獲得深度語音特征信息。

4.如權利要求1所述的基于深度學習的智慧視聽設備多業(yè)務控制方法，其特征在于，所述遠程GPU服務器接收到MFCC原始語音特征信息，根據(jù)MFCC原始語音特征信息獲得深度語音特征信息，并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊的步驟，包括：

遠程GPU服務器接收到MFCC原始語音特征信息，對MFCC原始語音特征信息進行深度語音特征提取，獲得深度語音特征信息，并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊；

遠程GPU服務器對深度語音特征信息進行分類，得到該深度語音特征信息對應的類別，并檢測該類別是否對應一種控制信號標識；若是，返回控制信號標識信息給互聯(lián)網(wǎng)連接模塊。

5.一種基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng)，其特征在于，所述系統(tǒng)包括：麥克風陣列、語音預處理模塊、遠程GPU服務器、互聯(lián)網(wǎng)連接模塊、控制信號解析模塊、控制信號輸出模塊；其中，

麥克風陣列以特定頻率監(jiān)聽采集用戶發(fā)出的語音控制信號；

控制信號輸出模塊根據(jù)控制信號編碼發(fā)送控制信號給智慧視聽設備。

6.如權利要求5所述的基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng)，其特征在于，所述語音預處理模塊包括：

分割單元，用于對語音控制信號進行端點檢測及分割處理；

降噪單元，用于對分割處理后的語音控制信號進行降噪處理；

提取單元，用于對降噪處理后的語音控制信號進行MFCC原始語音特征提取，獲得MFCC原始語音特征信息。

7.如權利要求5所述的基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng)，其特征在于，所述遠程GPU服務器接收到MFCC原始語音特征信息，啟動深度學習語音識別程序，采用biLSTM算法對MFCC原始語音特征信息進行深度語音特征提取，獲得深度語音特征信息。

8.如權利要求5所述的基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng)，其特征在于，遠程GPU服務器接收到MFCC原始語音特征信息，對MFCC原始語音特征信息進行深度語音特征提取，獲得深度語音特征信息，并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊；

完整全部詳細技術資料下載

當前第2頁1 2 3

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于深度學習的智慧視聽設備多業(yè)務控制方法及系統(tǒng)與流程