本發(fā)明屬于客服系統(tǒng),尤其涉及一種基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng)。
背景技術(shù):
1、當前,煤炭物流園區(qū)作為煤炭供應鏈的重要環(huán)節(jié),其客戶服務質(zhì)量直接影響到園區(qū)的運營效率和客戶滿意度,其客服系統(tǒng)的效率與質(zhì)量直接影響到園區(qū)的整體運營效果。然而,傳統(tǒng)的客服系統(tǒng)多依賴于人工操作,存在成本高、響應速度慢、處理效率低、信息不準確和無法提供個性化服務等問題。隨著人工智能技術(shù)的快速發(fā)展,特別是大模型技術(shù)在自然語言處理、數(shù)據(jù)分析等方面的廣泛應用,為煤炭物流園區(qū)的客服系統(tǒng)升級提供了新的可能。
2、現(xiàn)有技術(shù)主要存在以下幾個問題:
3、1、在現(xiàn)有智能客服系統(tǒng)中,通常采用一種基于規(guī)則的方法來回答用戶的問題。這種方法要求人工編寫大量的規(guī)則和模板,以處理各種可能的用戶查詢。在面對復雜、多樣化的用戶問題時表現(xiàn)出局限性,需要不斷的維護和更新規(guī)則庫,維護成本比較高。
4、2、現(xiàn)有智能客服系統(tǒng)在理解用戶意圖和提供準確答案方面的能力有限。雖然一些系統(tǒng)使用了自然語言處理技術(shù)和機器學習算法來改善性能,但在實際的應用中,用戶提出的問題往往多種多樣,傳統(tǒng)的系統(tǒng)缺乏深層次的語義理解能力,導致無法真正理解用戶的問題,只能基于表面信息提供標準答親。
5、3、現(xiàn)有系統(tǒng)通常缺乏知識庫的支持。知識庫是一個存儲大量問題和答案對的數(shù)據(jù)庫,可以幫助系統(tǒng)更好地回答用戶的問題。然而,許多現(xiàn)有系統(tǒng)的知識庫構(gòu)建和維護過程相對困難,導致知識庫的質(zhì)量和實用性有限。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),旨在解決在現(xiàn)有智能客服系統(tǒng)中,通常采用一種基于規(guī)則的方法來回答用戶的問題,要求人工編寫大量的規(guī)則和模板,以處理各種可能的用戶查詢,在面對復雜、多樣化的用戶問題時表現(xiàn)出局限性,需要不斷的維護和更新規(guī)則庫,維護成本比較高的問題。
2、本發(fā)明是這樣實現(xiàn)的,一種基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),所述系統(tǒng)包括:
3、數(shù)據(jù)采集模塊,用于獲取并處理用戶輸入的問題數(shù)據(jù);
4、煤炭物流行業(yè)知識庫,用于存儲煤炭物流行業(yè)的行業(yè)知識數(shù)據(jù);
5、客服問題匹配度預估模塊,用于根據(jù)問題數(shù)據(jù)計算問題匹配度指數(shù),確定用戶問題;
6、問答生成大模型,用于根據(jù)用戶問題查詢煤炭物流行業(yè)知識庫得到回答或通過大語言模型生成回答,所述問答生成大模型包括前臺、ai服務和后臺三部分;
7、客服接口模塊,用于將回答通過通過多種方式呈現(xiàn)給客戶。
8、優(yōu)選的,所述數(shù)據(jù)采集模塊包括客服問題采集單元和客服問題處理單元,客服問題采集單元用于采集客戶向智能客服提出的問題的文本詞向量參數(shù)、關(guān)鍵詞參數(shù)和字符數(shù)參數(shù),客服問題處理單元用于對收集到的數(shù)據(jù)進行清洗、去重和標注,通過分詞、去除停用詞和詞性標注進行數(shù)據(jù)預處理。
9、優(yōu)選的,所述煤炭物流行業(yè)知識庫存儲的數(shù)據(jù)包括煤炭基礎(chǔ)知識數(shù)據(jù)、煤炭物流流程數(shù)據(jù)、市場動態(tài)數(shù)據(jù)、技術(shù)設(shè)備數(shù)據(jù)、政策法規(guī)數(shù)據(jù)和安全管理數(shù)據(jù)。
10、優(yōu)選的,在訓練問答生成大模型時,采用預訓練策略,在大規(guī)模的文本數(shù)據(jù)集上進行預訓練,學習語言的通用表示和知識,在預訓練的基礎(chǔ)上,在特定的問答生成任務數(shù)據(jù)集上進行微調(diào),微調(diào)時,調(diào)整學習率和優(yōu)化器,通過數(shù)據(jù)增強擴充訓練數(shù)據(jù)集,訓練過程中使用正則化策略防止模型過擬合,對于涉及多模態(tài)信息的問答生成任務,采用多模態(tài)融合的方式進行表示。
11、優(yōu)選的,根據(jù)問題數(shù)據(jù)計算問題匹配度指數(shù),確定用戶問題的過程中,包括計算文本相似度、關(guān)鍵詞差異系數(shù)和句子長度差異系數(shù)。
12、優(yōu)選的,文本相似度通過詞頻向量相似度進行表征,采用詞頻向量表示文本,計算兩個文本的余弦相似度,文本相似度tf?similarity表示為:
13、
14、其中,tf(wi,dj)為詞wi在文檔dj中的詞頻,i為詞的編號,j為文檔的編號,n為詞的數(shù)量。
15、優(yōu)選的,文本相似度通過tf-idf的相似度進行表征,使用tf-idf向量表示文本,計算兩個文本向量的余弦相似度,公式為tf-idf相似度tf-idf?similarity表示為:
16、
17、其中,tf(wi,dj)為詞wi在文檔dj中的tf-idf值,i為詞的編號,j為文檔的編號,n為詞的數(shù)量。
18、優(yōu)選的,文本相似度通過word2vec相似度計算,將文本轉(zhuǎn)換為詞向量的平均值,計算兩個文本向量的余弦相似度,word2vec相似度表示為:
19、
20、其中,和分別是兩個文本的詞向量平均值。
21、優(yōu)選的,關(guān)鍵詞差異系數(shù)通過jaccard系數(shù)進行表征,將文本轉(zhuǎn)換為關(guān)鍵詞集合,計算兩個關(guān)鍵詞集合的jaccard系數(shù)作為關(guān)鍵詞差異系數(shù),公式為:
22、
23、其中,s1和s2分別為兩個文本的關(guān)鍵詞集合。
24、優(yōu)選的,句子長度差異系數(shù)通過長度差進行表征,計算兩個文本句子長度的差值,將其轉(zhuǎn)換為句子長度差異系數(shù),公式為:
25、
26、其中,l1和l2分別是兩個文本的句子長度。
27、本發(fā)明提供的一種基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其有益效果包括:
28、1、提升客服效率與質(zhì)量,大模型技術(shù)使客服系統(tǒng)能夠迅速理解用戶問題,并生成準確的回答,顯著提高了客服響應速度,減少了用戶等待時間;大模型具備強大的語言理解和生成能力,能夠準確理解用戶提出的各種復雜、模糊甚至具有歧義的問題,從而給出更加精準的答復,與傳統(tǒng)智能客服相比,基于大模型的客服系統(tǒng)能夠進行多輪對話,根據(jù)用戶的反饋不斷調(diào)整回答,更好地理解用戶需求。
29、2、增強煤炭物流園區(qū)用戶體驗:通過分析用戶歷史交互數(shù)據(jù),系統(tǒng)能夠為用戶提供個性化的服務建議,提升用戶滿意度和忠誠度,系統(tǒng)可以結(jié)合文本、語音、圖像等多種信息形式與用戶進行交互,提高交互的豐富性和自然性,基于大模型的客服系統(tǒng)可以實現(xiàn)全天候在線服務,滿足用戶隨時隨地的咨詢需求。
30、3、降低煤炭物流園區(qū)運營成本:系統(tǒng)的應用可以替代部分人工客服工作,從而降低物流園區(qū)的人力成本,通過自動化處理大量用戶咨詢,系統(tǒng)能夠顯著提高企業(yè)的運營效率,減少人工處理時間。
1.一種基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其特征在于,所述系統(tǒng)包括:
2.根據(jù)權(quán)利要求1所述的基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其特征在于,所述數(shù)據(jù)采集模塊包括客服問題采集單元和客服問題處理單元,客服問題采集單元用于采集客戶向智能客服提出的問題的文本詞向量參數(shù)、關(guān)鍵詞參數(shù)和字符數(shù)參數(shù),客服問題處理單元用于對收集到的數(shù)據(jù)進行清洗、去重和標注,通過分詞、去除停用詞和詞性標注進行數(shù)據(jù)預處理。
3.根據(jù)權(quán)利要求1所述的基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其特征在于,所述煤炭物流行業(yè)知識庫存儲的數(shù)據(jù)包括煤炭基礎(chǔ)知識數(shù)據(jù)、煤炭物流流程數(shù)據(jù)、市場動態(tài)數(shù)據(jù)、技術(shù)設(shè)備數(shù)據(jù)、政策法規(guī)數(shù)據(jù)和安全管理數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其特征在于,在訓練問答生成大模型時,采用預訓練策略,在大規(guī)模的文本數(shù)據(jù)集上進行預訓練,學習語言的通用表示和知識,在預訓練的基礎(chǔ)上,在特定的問答生成任務數(shù)據(jù)集上進行微調(diào),微調(diào)時,調(diào)整學習率和優(yōu)化器,通過數(shù)據(jù)增強擴充訓練數(shù)據(jù)集,訓練過程中使用正則化策略防止模型過擬合,對于涉及多模態(tài)信息的問答生成任務,采用多模態(tài)融合的方式進行表示。
5.根據(jù)權(quán)利要求1所述的基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其特征在于,根據(jù)問題數(shù)據(jù)計算問題匹配度指數(shù),確定用戶問題的過程中,包括計算文本相似度、關(guān)鍵詞差異系數(shù)和句子長度差異系數(shù)。
6.根據(jù)權(quán)利要求5所述的基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其特征在于,文本相似度通過詞頻向量相似度進行表征,采用詞頻向量表示文本,計算兩個文本的余弦相似度,文本相似度tf?similarity表示為:
7.根據(jù)權(quán)利要求5所述的基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其特征在于,文本相似度通過tf-idf的相似度進行表征,使用tf-idf向量表示文本,計算兩個文本向量的余弦相似度,公式為tf-idf相似度tf-idf?similarity表示為:
8.根據(jù)權(quán)利要求5所述的基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其特征在于,文本相似度通過word2vec相似度計算,將文本轉(zhuǎn)換為詞向量的平均值,計算兩個文本向量的余弦相似度,word2vec相似度表示為:
9.根據(jù)權(quán)利要求5所述的基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其特征在于,關(guān)鍵詞差異系數(shù)通過jaccard系數(shù)進行表征,將文本轉(zhuǎn)換為關(guān)鍵詞集合,計算兩個關(guān)鍵詞集合的jaccard系數(shù)作為關(guān)鍵詞差異系數(shù),公式為:
10.根據(jù)權(quán)利要求5所述的基于大模型的煤炭物流園區(qū)內(nèi)容生成客服系統(tǒng),其特征在于,句子長度差異系數(shù)通過長度差進行表征,計算兩個文本句子長度的差值,將其轉(zhuǎn)換為句子長度差異系數(shù),公式為: