最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于深度學習的智慧視聽設備多業(yè)務控制方法及系統(tǒng)與流程

文檔序號:11097788閱讀:來源:國知局

技術特征:

1.一種基于深度學習的智慧視聽設備多業(yè)務控制方法,其特征在于,所述方法包括:

麥克風陣列以特定頻率監(jiān)聽采集用戶發(fā)出的語音控制信號;

語音預處理模塊對語音控制信號進行提取,獲得MFCC原始語音特征信息;檢測MFCC原始語音特征的對數(shù)能量是否大于閾值;若是,則由互聯(lián)網(wǎng)連接模塊發(fā)送MFCC原始語音特征信息到遠程GPU服務器;

遠程GPU服務器接收到MFCC原始語音特征信息,根據(jù)MFCC原始語音特征信息獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊;

互聯(lián)網(wǎng)連接模塊將控制信號標識信息傳遞給控制信號解析模塊,由控制信號解析模塊根據(jù)控制信號標識信息生成控制信號編碼,選擇對應的控制信號輸出模塊,將控制信號編碼傳遞給該控制信號輸出模塊;

控制信號輸出模塊根據(jù)控制信號編碼發(fā)送控制信號給智慧視聽設備。

2.如權利要求1所述的基于深度學習的智慧視聽設備多業(yè)務控制方法,其特征在于,所述語音預處理模塊對語音控制信號進行提取,獲得MFCC原始語音特征信息的步驟,包括:

對語音控制信號進行端點檢測及分割處理;

對分割處理后的語音控制信號進行降噪處理;

對降噪處理后的語音控制信號進行MFCC原始語音特征提取,獲得MFCC原始語音特征信息。

3.如權利要求1所述的基于深度學習的智慧視聽設備多業(yè)務控制方法,其特征在于,所述遠程GPU服務器接收到MFCC原始語音特征信息,對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息的步驟,包括:

遠程GPU服務器接收到MFCC原始語音特征信息,啟動深度學習語音識別程序,采用biLSTM算法對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息。

4.如權利要求1所述的基于深度學習的智慧視聽設備多業(yè)務控制方法,其特征在于,所述遠程GPU服務器接收到MFCC原始語音特征信息,根據(jù)MFCC原始語音特征信息獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊的步驟,包括:

遠程GPU服務器接收到MFCC原始語音特征信息,對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊;

遠程GPU服務器對深度語音特征信息進行分類,得到該深度語音特征信息對應的類別,并檢測該類別是否對應一種控制信號標識;若是,返回控制信號標識信息給互聯(lián)網(wǎng)連接模塊。

5.一種基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng),其特征在于,所述系統(tǒng)包括:麥克風陣列、語音預處理模塊、遠程GPU服務器、互聯(lián)網(wǎng)連接模塊、控制信號解析模塊、控制信號輸出模塊;其中,

麥克風陣列以特定頻率監(jiān)聽采集用戶發(fā)出的語音控制信號;

語音預處理模塊對語音控制信號進行提取,獲得MFCC原始語音特征信息;檢測MFCC原始語音特征的對數(shù)能量是否大于閾值;若是,則由互聯(lián)網(wǎng)連接模塊發(fā)送MFCC原始語音特征信息到遠程GPU服務器;

遠程GPU服務器接收到MFCC原始語音特征信息,根據(jù)MFCC原始語音特征信息獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊;

互聯(lián)網(wǎng)連接模塊將控制信號標識信息傳遞給控制信號解析模塊,由控制信號解析模塊根據(jù)控制信號標識信息生成控制信號編碼,選擇對應的控制信號輸出模塊,將控制信號編碼傳遞給該控制信號輸出模塊;

控制信號輸出模塊根據(jù)控制信號編碼發(fā)送控制信號給智慧視聽設備。

6.如權利要求5所述的基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng),其特征在于,所述語音預處理模塊包括:

分割單元,用于對語音控制信號進行端點檢測及分割處理;

降噪單元,用于對分割處理后的語音控制信號進行降噪處理;

提取單元,用于對降噪處理后的語音控制信號進行MFCC原始語音特征提取,獲得MFCC原始語音特征信息。

7.如權利要求5所述的基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng),其特征在于,所述遠程GPU服務器接收到MFCC原始語音特征信息,啟動深度學習語音識別程序,采用biLSTM算法對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息。

8.如權利要求5所述的基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng),其特征在于,遠程GPU服務器接收到MFCC原始語音特征信息,對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊;

遠程GPU服務器對深度語音特征信息進行分類,得到該深度語音特征信息對應的類別,并檢測該類別是否對應一種控制信號標識;若是,返回控制信號標識信息給互聯(lián)網(wǎng)連接模塊。

當前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1