1.一種基于深度學習的智慧視聽設備多業(yè)務控制方法,其特征在于,所述方法包括:
麥克風陣列以特定頻率監(jiān)聽采集用戶發(fā)出的語音控制信號;
語音預處理模塊對語音控制信號進行提取,獲得MFCC原始語音特征信息;檢測MFCC原始語音特征的對數(shù)能量是否大于閾值;若是,則由互聯(lián)網(wǎng)連接模塊發(fā)送MFCC原始語音特征信息到遠程GPU服務器;
遠程GPU服務器接收到MFCC原始語音特征信息,根據(jù)MFCC原始語音特征信息獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊;
互聯(lián)網(wǎng)連接模塊將控制信號標識信息傳遞給控制信號解析模塊,由控制信號解析模塊根據(jù)控制信號標識信息生成控制信號編碼,選擇對應的控制信號輸出模塊,將控制信號編碼傳遞給該控制信號輸出模塊;
控制信號輸出模塊根據(jù)控制信號編碼發(fā)送控制信號給智慧視聽設備。
2.如權利要求1所述的基于深度學習的智慧視聽設備多業(yè)務控制方法,其特征在于,所述語音預處理模塊對語音控制信號進行提取,獲得MFCC原始語音特征信息的步驟,包括:
對語音控制信號進行端點檢測及分割處理;
對分割處理后的語音控制信號進行降噪處理;
對降噪處理后的語音控制信號進行MFCC原始語音特征提取,獲得MFCC原始語音特征信息。
3.如權利要求1所述的基于深度學習的智慧視聽設備多業(yè)務控制方法,其特征在于,所述遠程GPU服務器接收到MFCC原始語音特征信息,對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息的步驟,包括:
遠程GPU服務器接收到MFCC原始語音特征信息,啟動深度學習語音識別程序,采用biLSTM算法對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息。
4.如權利要求1所述的基于深度學習的智慧視聽設備多業(yè)務控制方法,其特征在于,所述遠程GPU服務器接收到MFCC原始語音特征信息,根據(jù)MFCC原始語音特征信息獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊的步驟,包括:
遠程GPU服務器接收到MFCC原始語音特征信息,對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊;
遠程GPU服務器對深度語音特征信息進行分類,得到該深度語音特征信息對應的類別,并檢測該類別是否對應一種控制信號標識;若是,返回控制信號標識信息給互聯(lián)網(wǎng)連接模塊。
5.一種基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng),其特征在于,所述系統(tǒng)包括:麥克風陣列、語音預處理模塊、遠程GPU服務器、互聯(lián)網(wǎng)連接模塊、控制信號解析模塊、控制信號輸出模塊;其中,
麥克風陣列以特定頻率監(jiān)聽采集用戶發(fā)出的語音控制信號;
語音預處理模塊對語音控制信號進行提取,獲得MFCC原始語音特征信息;檢測MFCC原始語音特征的對數(shù)能量是否大于閾值;若是,則由互聯(lián)網(wǎng)連接模塊發(fā)送MFCC原始語音特征信息到遠程GPU服務器;
遠程GPU服務器接收到MFCC原始語音特征信息,根據(jù)MFCC原始語音特征信息獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊;
互聯(lián)網(wǎng)連接模塊將控制信號標識信息傳遞給控制信號解析模塊,由控制信號解析模塊根據(jù)控制信號標識信息生成控制信號編碼,選擇對應的控制信號輸出模塊,將控制信號編碼傳遞給該控制信號輸出模塊;
控制信號輸出模塊根據(jù)控制信號編碼發(fā)送控制信號給智慧視聽設備。
6.如權利要求5所述的基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng),其特征在于,所述語音預處理模塊包括:
分割單元,用于對語音控制信號進行端點檢測及分割處理;
降噪單元,用于對分割處理后的語音控制信號進行降噪處理;
提取單元,用于對降噪處理后的語音控制信號進行MFCC原始語音特征提取,獲得MFCC原始語音特征信息。
7.如權利要求5所述的基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng),其特征在于,所述遠程GPU服務器接收到MFCC原始語音特征信息,啟動深度學習語音識別程序,采用biLSTM算法對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息。
8.如權利要求5所述的基于深度學習的智慧視聽設備多業(yè)務控制系統(tǒng),其特征在于,遠程GPU服務器接收到MFCC原始語音特征信息,對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發(fā)送給互聯(lián)網(wǎng)連接模塊;
遠程GPU服務器對深度語音特征信息進行分類,得到該深度語音特征信息對應的類別,并檢測該類別是否對應一種控制信號標識;若是,返回控制信號標識信息給互聯(lián)網(wǎng)連接模塊。