本發(fā)明涉及語音識別,尤其涉及一種語音轉(zhuǎn)文本的醫(yī)療對話處理方法、裝置、介質(zhì)及設(shè)備。
背景技術(shù):
1、隨著醫(yī)療行業(yè)發(fā)展,口腔醫(yī)療領(lǐng)域信息化、智能化趨勢顯著。傳統(tǒng)口腔醫(yī)療靠導(dǎo)診護(hù)士手動記錄,易致信息遺漏、不準(zhǔn)確,影響醫(yī)療質(zhì)量與患者體驗(yàn),而語音識別技術(shù)為醫(yī)療記錄自動化帶來新可能。
2、當(dāng)下,許多醫(yī)療機(jī)構(gòu)已應(yīng)用電子導(dǎo)診系統(tǒng)(emr)和臨床決策支持系統(tǒng)(cdss),集成這些系統(tǒng)可讓導(dǎo)診護(hù)士快速獲取患者信息和醫(yī)療記錄,更好了解患者訴求并提供導(dǎo)診建議。但現(xiàn)有系統(tǒng)在口腔醫(yī)療領(lǐng)域應(yīng)用存在不足,需針對性改進(jìn)以提升服務(wù)效率和質(zhì)量。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提供一種語音轉(zhuǎn)文本的醫(yī)療對話處理方法、裝置、介質(zhì)及設(shè)備,能夠改善現(xiàn)有傳統(tǒng)口腔醫(yī)療依靠手動記錄易致信息遺漏、不準(zhǔn)確的不足。
2、第一方面,本發(fā)明實(shí)施例提供一種語音轉(zhuǎn)文本的醫(yī)療對話處理方法,所述方法包括:
3、獲取語音文件;
4、將所述語音文件發(fā)送至語音大模型處理,所述語音大模型將所述語音文件轉(zhuǎn)換為初步文件,在所述初步文件的適當(dāng)位置增加空格,以將所述初步文件劃分為短句文件,在所述短句文件中添加標(biāo)點(diǎn)符號,識別短句文件中每段對話的角色信息并標(biāo)注身份后將所述語音文件轉(zhuǎn)換為文本文件;
5、將所述文本文件輸入文本大模型中進(jìn)行結(jié)構(gòu)化處理獲得結(jié)構(gòu)化文檔。
6、進(jìn)一步地,實(shí)時(shí)獲取語音文件或者通過預(yù)設(shè)時(shí)段獲取語音文件。
7、進(jìn)一步地,在獲取語音文件之后,將所述語音文件發(fā)送至語音大模型處理之前,所述方法還包括:
8、對所述語音文件進(jìn)行噪聲估計(jì);
9、對噪聲估計(jì)后的語音文件進(jìn)行降噪處理;
10、對降噪處理后的語音文件進(jìn)行反變換操作和后處理,獲得調(diào)整重建后的語音文件。
11、進(jìn)一步地,將所述語音文件轉(zhuǎn)換為文本文件之后,對所述文本文件進(jìn)行結(jié)構(gòu)化處理獲得結(jié)構(gòu)化文檔之前,所述方法還包括:
12、對所述文本文件進(jìn)行數(shù)據(jù)預(yù)處理;
13、將數(shù)據(jù)與處理后的文本文件中的詞匯與預(yù)先構(gòu)建的專業(yè)詞匯表中的詞匯進(jìn)行匹配,以使所述文本文件中的詞匯標(biāo)準(zhǔn)化。
14、進(jìn)一步地,將數(shù)據(jù)預(yù)處理后的文本文件中的詞匯與預(yù)先構(gòu)建的專業(yè)詞匯表中的詞匯進(jìn)行匹配包括:
15、利用字符串匹配算法,將數(shù)據(jù)預(yù)處理后的文本文件中的詞匯與預(yù)先構(gòu)建的專業(yè)詞匯表中的詞匯進(jìn)行匹配;或者
16、根據(jù)上下文語境制定詞匯替換規(guī)則,根據(jù)所述詞匯替換規(guī)則將數(shù)據(jù)預(yù)處理后的文本文件中的詞匯與預(yù)先構(gòu)建的專業(yè)詞匯表中的詞匯進(jìn)行匹配;或者
17、將數(shù)據(jù)預(yù)處理后的文本文件中的詞匯讀取到數(shù)據(jù)框中,循環(huán)遍歷每一行數(shù)據(jù),對其中的詞匯進(jìn)行匹配和替換,以使數(shù)據(jù)預(yù)處理后的文本文件中的詞匯進(jìn)行批量轉(zhuǎn)換。
18、進(jìn)一步地,將所述文本文件輸入文本大模型中進(jìn)行結(jié)構(gòu)化處理獲得結(jié)構(gòu)化文檔包括:
19、將患者歷史病例信息導(dǎo)入文本大模型中;
20、接收初始結(jié)構(gòu)化文檔指令,所述文本大模型根據(jù)所述初始結(jié)構(gòu)化文檔指令從所述文本文件中輸出與所述初始結(jié)構(gòu)化文檔指令對應(yīng)的初始結(jié)構(gòu)化文檔。
21、進(jìn)一步地,所述方法還包括:
22、對所述初始結(jié)構(gòu)化文檔進(jìn)行檢測;
23、根據(jù)檢測結(jié)果對所述初始結(jié)構(gòu)化指令進(jìn)行調(diào)整,獲得調(diào)整后的結(jié)構(gòu)化文檔指令;
24、所述文本大模型根據(jù)所述調(diào)整后的結(jié)構(gòu)化文檔指令從所述文本文件中輸出與所述調(diào)整后的結(jié)構(gòu)化文檔指令對應(yīng)的調(diào)整后的結(jié)構(gòu)化文檔;
25、反復(fù)執(zhí)行結(jié)構(gòu)化文檔指令調(diào)整和文本大模型根據(jù)調(diào)整后的結(jié)構(gòu)化執(zhí)行輸出結(jié)構(gòu)化文檔的步驟,直至所述文本大模型輸出的結(jié)構(gòu)化文檔檢測準(zhǔn)確為止。
26、第二方面,本發(fā)明實(shí)施例提供一種語音轉(zhuǎn)文本的醫(yī)療對話處理裝置,所述裝置包括:
27、語言文件獲取模塊,用于獲取語音文件;
28、語言轉(zhuǎn)文本模塊,用于將所述語音文件發(fā)送至語音大模型處理,所述語音大模型將所述語音文件轉(zhuǎn)換為初步文件,在所述初步文件的適當(dāng)位置增加空格,以將所述初步文件劃分為短句文件,在所述短句文件中添加標(biāo)點(diǎn)符號,識別短句文件中每段對話的角色信息并標(biāo)注身份后將所述語音文件轉(zhuǎn)換為文本文件;
29、結(jié)構(gòu)化文檔模塊,用于將所述文本文件輸入文本大模型中進(jìn)行結(jié)構(gòu)化處理獲得結(jié)構(gòu)化文檔。
30、第三方面,本發(fā)明實(shí)施例提供一種計(jì)算機(jī)可讀存儲介質(zhì),所述存儲介質(zhì)中存儲有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被設(shè)置為運(yùn)行所述計(jì)算機(jī)程序以執(zhí)行所述第一方面中任一項(xiàng)所述的方法。
31、第四方面,本發(fā)明實(shí)施例提供一種電子設(shè)備,包括存儲器和處理器,所述存儲器中存儲有計(jì)算機(jī)程序,所述處理器被設(shè)置為運(yùn)行所述計(jì)算機(jī)程序以執(zhí)行所述第一方面中任一項(xiàng)所述的方法。
32、本發(fā)明提供的技術(shù)方案,通過將語音文件輸入語音大模型中,語音大模型首先將語音文件轉(zhuǎn)換為初步文件,再在初步文件的適當(dāng)位置增加空格后劃分為短句文件,之后在短句文件中添加標(biāo)點(diǎn)符號,最后識別短句文件中每段對話的角色信息并標(biāo)注身份后實(shí)現(xiàn)將語音文件轉(zhuǎn)化為文本文件,最后將文本文件輸入文本大模型后獲得結(jié)構(gòu)化文檔。由此,本發(fā)明將語音自動轉(zhuǎn)換為文本,避免了因?qū)г\護(hù)士疏忽、疲勞或理解偏差導(dǎo)致的記錄錯(cuò)誤,保證了醫(yī)療對話信息的完整和準(zhǔn)確,為后續(xù)診斷和治療提供可靠依據(jù);通過預(yù)先構(gòu)建專業(yè)詞匯表對文本文件中的詞匯進(jìn)行標(biāo)準(zhǔn)化處理,能準(zhǔn)確識別和轉(zhuǎn)換醫(yī)療專業(yè)術(shù)語,特別是口腔醫(yī)療領(lǐng)域復(fù)雜的專業(yè)信息,如牙位記錄、病癥名稱等,減少因術(shù)語不規(guī)范帶來的理解歧義;可實(shí)時(shí)或按預(yù)設(shè)時(shí)段獲取語音文件,并借助語音大模型快速將語音轉(zhuǎn)換為文本,大大節(jié)省了人工記錄和整理信息的時(shí)間,使導(dǎo)診護(hù)士和醫(yī)生能更迅速地獲取患者信息;文本大模型對文本文件進(jìn)行結(jié)構(gòu)化處理,自動提取關(guān)鍵信息生成結(jié)構(gòu)化文檔,無需人工手動梳理,提高了信息處理和分析的效率,有助于快速做出醫(yī)療決策;在文本結(jié)構(gòu)化處理時(shí)導(dǎo)入患者歷史病例信息,使文本大模型能結(jié)合患者過往情況進(jìn)行分析,為患者提供更貼合其病情的診斷建議和治療方案,實(shí)現(xiàn)個(gè)性化醫(yī)療服務(wù);減少患者等待信息記錄和處理的時(shí)間,同時(shí)準(zhǔn)確的信息記錄和專業(yè)的服務(wù)能增強(qiáng)患者對醫(yī)療服務(wù)的信任和滿意度;將語音轉(zhuǎn)換為文本并進(jìn)行結(jié)構(gòu)化處理,使醫(yī)療對話數(shù)據(jù)具有統(tǒng)一的格式和結(jié)構(gòu),便于存儲、查詢和統(tǒng)計(jì)分析,有利于醫(yī)療機(jī)構(gòu)進(jìn)行數(shù)據(jù)的規(guī)范化管理;標(biāo)準(zhǔn)化和結(jié)構(gòu)化的數(shù)據(jù)更易于在不同醫(yī)療系統(tǒng)和部門之間進(jìn)行共享和交換,促進(jìn)醫(yī)療信息的流通和協(xié)同工作;通過對初始結(jié)構(gòu)化文檔進(jìn)行檢測和調(diào)整結(jié)構(gòu)化文檔指令,反復(fù)優(yōu)化文本大模型輸出的結(jié)構(gòu)化文檔,使系統(tǒng)能不斷適應(yīng)不同的醫(yī)療場景和需求,提高系統(tǒng)的準(zhǔn)確性和穩(wěn)定性。
1.一種語音轉(zhuǎn)文本的醫(yī)療對話處理方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)權(quán)利要求1所述的方法,其特征在于,實(shí)時(shí)獲取語音文件或者通過預(yù)設(shè)時(shí)段獲取語音文件。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在獲取語音文件之后,將所述語音文件發(fā)送至語音大模型處理之前,所述方法還包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,將所述語音文件轉(zhuǎn)換為文本文件之后,對所述文本文件進(jìn)行結(jié)構(gòu)化處理獲得結(jié)構(gòu)化文檔之前,所述方法還包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,將數(shù)據(jù)預(yù)處理后的文本文件中的詞匯與預(yù)先構(gòu)建的專業(yè)詞匯表中的詞匯進(jìn)行匹配包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述文本文件輸入文本大模型中進(jìn)行結(jié)構(gòu)化處理獲得結(jié)構(gòu)化文檔包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:
8.一種語音轉(zhuǎn)文本的醫(yī)療對話處理裝置,其特征在于,所述裝置包括:
9.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述存儲介質(zhì)中存儲有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被設(shè)置為運(yùn)行所述計(jì)算機(jī)程序以執(zhí)行所述權(quán)利要求1至7中任一項(xiàng)所述的方法。
10.一種電子設(shè)備,包括存儲器和處理器,其特征在于,所述存儲器中存儲有計(jì)算機(jī)程序,所述處理器被設(shè)置為運(yùn)行所述計(jì)算機(jī)程序以執(zhí)行所述權(quán)利要求1至7中任一項(xiàng)所述的方法。