本發(fā)明涉及人工智能,尤其涉及一種基于大語(yǔ)言模型的動(dòng)態(tài)調(diào)度策略生成方法及裝置。
背景技術(shù):
1、動(dòng)態(tài)調(diào)度問(wèn)題,是指在調(diào)度環(huán)境和任務(wù)存在不可預(yù)測(cè)擾動(dòng)的情況下,根據(jù)實(shí)時(shí)信息動(dòng)態(tài)調(diào)整任務(wù)執(zhí)行順序和資源分配的優(yōu)化問(wèn)題。與靜態(tài)調(diào)度相比,動(dòng)態(tài)調(diào)度能夠更靈活地應(yīng)對(duì)生產(chǎn)現(xiàn)場(chǎng)的實(shí)際變化,生成更具可操作性的決策方案。動(dòng)態(tài)調(diào)度問(wèn)題核心的難點(diǎn)是:解決復(fù)雜性與不確定性的問(wèn)題,在實(shí)際生產(chǎn)或運(yùn)行環(huán)境中,任務(wù)的到達(dá)時(shí)間、資源需求、加工時(shí)間等參數(shù)確定隨時(shí)變化,同時(shí)出現(xiàn)機(jī)器故障、任務(wù)優(yōu)先級(jí)調(diào)整等動(dòng)態(tài)干擾時(shí)間;滿足多目標(biāo)優(yōu)化的需求,動(dòng)態(tài)調(diào)度通常需要同時(shí)優(yōu)化多個(gè)目標(biāo),例如最小化延遲時(shí)間、最大化資源利用率、降低能耗等;實(shí)時(shí)性要求,許多應(yīng)用場(chǎng)景(如智能制造、互聯(lián)網(wǎng)、物流交通、云計(jì)算等)對(duì)實(shí)時(shí)性要求較高,需要?jiǎng)討B(tài)調(diào)度算法能夠快速響應(yīng)環(huán)境變化。
2、基于遺傳編程的超啟發(fā)式算法是一種通過(guò)自動(dòng)演化調(diào)度啟發(fā)式算法來(lái)解決動(dòng)態(tài)調(diào)度問(wèn)題的創(chuàng)新方法。通過(guò)利用遺傳編程的原理,基于遺傳編程的超啟發(fā)式算法生成并改進(jìn)高級(jí)啟發(fā)式算法,以適應(yīng)現(xiàn)實(shí)世界中復(fù)雜的調(diào)度挑戰(zhàn),如車間任務(wù)調(diào)度和考試時(shí)間安排等。這種自適應(yīng)能力使基于遺傳編程的超啟發(fā)式算法成為組合優(yōu)化中的一個(gè)重要工具,可以針對(duì)不同的問(wèn)題特征找到既靈活又穩(wěn)健的解決方案?;谶z傳編程的超啟發(fā)式算法框架通常涉及啟發(fā)式表征的選擇、交叉和突變,從而探索各種啟發(fā)式組合,以改善調(diào)度結(jié)果。
3、盡管基于遺傳編程的超啟發(fā)式算法具有諸多優(yōu)勢(shì),但將其應(yīng)用于動(dòng)態(tài)調(diào)度問(wèn)題仍面臨一些挑戰(zhàn):
4、1、訓(xùn)練過(guò)程耗時(shí),改進(jìn)調(diào)度啟發(fā)式算法通常需要大量的計(jì)算資源和時(shí)間,尤其是當(dāng)調(diào)度環(huán)境變化復(fù)雜性增加時(shí)。這一漫長(zhǎng)的訓(xùn)練階段成為了一個(gè)瓶頸,尤其是在動(dòng)態(tài)環(huán)境中,作業(yè)車間的特征會(huì)經(jīng)常變化,因此有必要重新訓(xùn)練啟發(fā)式。
5、2、泛化能力不足,雖然基于遺傳編程的超啟發(fā)式算法目標(biāo)是通過(guò)在高層次啟發(fā)式空間中搜索來(lái)提供通用解決方案,但是在實(shí)際應(yīng)用中往往會(huì)出現(xiàn)不足。超啟發(fā)式的設(shè)計(jì)確定過(guò)于針對(duì)特定問(wèn)題,導(dǎo)致在面對(duì)新的或未見(jiàn)過(guò)的問(wèn)題實(shí)例時(shí)缺乏魯棒性。這種特殊性限制了基于遺傳編程的超啟發(fā)式算法的通用性,限制了其在各種調(diào)度場(chǎng)景的適用性。
6、3、有限的搜索方法,目前基于遺傳編程的超啟發(fā)式算法采用的超啟發(fā)式設(shè)計(jì)方法往往局限于啟發(fā)式選擇,而非啟發(fā)式生成。這限制了基于遺傳編程的超啟發(fā)式算法生成新啟發(fā)式的能力,而新啟發(fā)式可以更好地應(yīng)對(duì)調(diào)度挑戰(zhàn)。
技術(shù)實(shí)現(xiàn)思路
1、為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明的目的是提供一種基于大語(yǔ)言模型的動(dòng)態(tài)調(diào)度策略生成方法及裝置。本發(fā)明首先定義了啟發(fā)式的個(gè)體和群體,并利用大語(yǔ)言模型對(duì)群體進(jìn)行初始化設(shè)置。接著,利用大語(yǔ)言模型對(duì)群體的個(gè)體進(jìn)行演化進(jìn)化操作。然后,基于離散仿真單元進(jìn)行評(píng)估。接著,利用大語(yǔ)言模型對(duì)群體中的個(gè)體進(jìn)行篩選。重復(fù)演化進(jìn)化、評(píng)估、篩選直到滿足停止迭代的條件。最終,基于群體評(píng)估其用于未知數(shù)據(jù)集下動(dòng)態(tài)調(diào)度的整體表現(xiàn),選擇出最優(yōu)的啟發(fā)式個(gè)體。本發(fā)明能夠利用大語(yǔ)言模型的自動(dòng)化和決策能力,解決基于遺傳編程的超啟發(fā)式算法面臨動(dòng)態(tài)環(huán)境下的適應(yīng)能力和效率問(wèn)題,不僅增強(qiáng)了動(dòng)態(tài)調(diào)度的靈活性,還最大限度地減輕了基于遺傳編程的超啟發(fā)式算法的計(jì)算負(fù)擔(dān)。
2、實(shí)現(xiàn)本發(fā)明目的的具體技術(shù)方案是:
3、一種基于大語(yǔ)言模型的動(dòng)態(tài)調(diào)度策略生成方法,包括以下步驟:
4、群體初始化,利用大語(yǔ)言模型對(duì)群體進(jìn)行初始化設(shè)置;
5、群體演化,基于測(cè)試數(shù)據(jù)集對(duì)群體的個(gè)體逐個(gè)進(jìn)行評(píng)估,并利用大語(yǔ)言模型對(duì)群體進(jìn)行演化進(jìn)化操作,迭代更新群體;
6、策略選擇,整體評(píng)估群體中的每個(gè)個(gè)體,選出整體最優(yōu)的個(gè)體,作為最終使用的調(diào)度策略;其中:
7、所述利用大語(yǔ)言模型對(duì)群體進(jìn)行演化進(jìn)化操作,包括:
8、基于離散事件仿真模擬動(dòng)態(tài)調(diào)度,對(duì)群體中的每個(gè)個(gè)體進(jìn)行評(píng)估,生成適應(yīng)度向量;
9、執(zhí)行遺傳算子操作,包括隨機(jī)交叉算子、隨機(jī)突變算子以及基于大語(yǔ)言模型的知識(shí)共享交叉算子;
10、選擇群體,包括非支配解排序遺傳算法和基于大語(yǔ)言模型的排序選擇算法;
11、判斷是否達(dá)成給定設(shè)置的迭代次數(shù),若未達(dá)成則重復(fù)上述演化進(jìn)化操作。
12、進(jìn)一步,所述群體,是由給定目標(biāo)數(shù)量的多個(gè)個(gè)體組成的序列,所述個(gè)體為調(diào)度策略個(gè)體三元組,包括:遺傳編程表達(dá)式、策略自然語(yǔ)言描述和適應(yīng)度向量;其中:
13、所述遺傳編程表達(dá)式,是由給定的運(yùn)算符號(hào)集合和給定的運(yùn)算符號(hào)集合中元素共同組成的表達(dá)式,是用于計(jì)算調(diào)度優(yōu)先級(jí)的函數(shù),其展示形式包括數(shù)學(xué)表達(dá)式和樹(shù)形結(jié)構(gòu)圖;
14、所述策略自然語(yǔ)言描述,是用于描述所述遺傳編程表達(dá)式的邏輯,該描述由中文、英文或其他語(yǔ)言進(jìn)行描述;具體描述內(nèi)容包括:該遺傳表達(dá)式考慮的因素、方向、目標(biāo)以及實(shí)現(xiàn)方式;
15、所述適應(yīng)度向量,是用于評(píng)估所述遺傳編程表達(dá)式在當(dāng)前測(cè)試數(shù)據(jù)集上的表現(xiàn),該適應(yīng)度向量為動(dòng)態(tài)調(diào)度優(yōu)化的目標(biāo)下的表現(xiàn),具體表現(xiàn)形式為對(duì)應(yīng)目標(biāo)參數(shù)數(shù)量的浮點(diǎn)型數(shù)值。
16、進(jìn)一步,所述利用大語(yǔ)言模型對(duì)群體進(jìn)行初始化設(shè)置,包括:
17、定義初始化提示詞模版,所述模版包含自然語(yǔ)言描述的任務(wù)目標(biāo)、任務(wù)背景、遺傳編程表達(dá)式的組成描述、返回內(nèi)容的格式要求以及引導(dǎo)式思維鏈描述;
18、拼接完整的提示詞文本,通過(guò)調(diào)用大語(yǔ)言模型應(yīng)用編程接口獲取遺傳編程表達(dá)式及其策略自然語(yǔ)言描述;
19、利用正則表達(dá)式和抽象語(yǔ)法樹(shù)從返回的自然語(yǔ)言描述中提取遺傳編程表達(dá)式和策略自然語(yǔ)言描述,構(gòu)建個(gè)體三元組;
20、所述大語(yǔ)言模型,是通過(guò)海量文本數(shù)據(jù)訓(xùn)練而成的深度學(xué)習(xí)網(wǎng)絡(luò)模型,能夠處理多種自然語(yǔ)言任務(wù),使用大語(yǔ)言模型的方式包括:本地部署開(kāi)源模型、微調(diào)預(yù)訓(xùn)練模型應(yīng)用和調(diào)用大語(yǔ)言模型應(yīng)用編程接口,其中,調(diào)用大語(yǔ)言模型應(yīng)用編程接口,是指通過(guò)標(biāo)準(zhǔn)化協(xié)議對(duì)外暴露軟件功能,允許開(kāi)發(fā)者無(wú)需理解底層實(shí)現(xiàn)即可調(diào)用大語(yǔ)言模型的應(yīng)用服務(wù),所述調(diào)用大語(yǔ)言模型應(yīng)用編程接口,包括由openai、google、anthropic和deepseek公司提供的大語(yǔ)言模型應(yīng)用編程接口。
21、進(jìn)一步,所述基于大語(yǔ)言模型的知識(shí)共享交叉算子,包括:
22、從群體中隨機(jī)選取若干個(gè)體,并對(duì)每個(gè)個(gè)體進(jìn)行自然語(yǔ)言描述;
23、定義知識(shí)提取提示詞模版,所述模版包含自然語(yǔ)言描述的任務(wù)目標(biāo)、個(gè)體描述以及引導(dǎo)式思維鏈描述;
24、拼接完整的提示詞文本,通過(guò)調(diào)用大語(yǔ)言模型應(yīng)用編程接口提取知識(shí)列表;
25、將提取的知識(shí)注入到群體中個(gè)體的遺傳編程表達(dá)式的節(jié)點(diǎn),生成個(gè)體;其中:
26、所述知識(shí)列表,是給定目標(biāo)數(shù)量的知識(shí)組成的序列;所述知識(shí)是所述個(gè)體中遺傳編程表達(dá)式中提取的信息;具體的,知識(shí)是遺傳編程表達(dá)式的樹(shù)形結(jié)構(gòu)中的一部分,其形式包括:遺傳編程表達(dá)式的樹(shù)形結(jié)構(gòu)本身,遺傳編程表達(dá)式的樹(shù)形結(jié)構(gòu)的子樹(shù)和遺傳編程表達(dá)式的樹(shù)形結(jié)構(gòu)的葉子。
27、進(jìn)一步,所述基于大語(yǔ)言模型的排序選擇算法,包括:
28、從群體中隨機(jī)選取若干個(gè)體,并對(duì)每個(gè)個(gè)體進(jìn)行自然語(yǔ)言描述;
29、定義排序選擇提示詞模版,所述模版包含自然語(yǔ)言描述的任務(wù)目標(biāo)、群體描述以及引導(dǎo)式思維鏈描述;
30、拼接完整的提示詞文本,通過(guò)調(diào)用大語(yǔ)言模型應(yīng)用編程接口選擇適應(yīng)度最高的個(gè)體組成下一代的群體;其中:
31、所述適應(yīng)度為對(duì)應(yīng)目標(biāo)參數(shù)數(shù)量的浮點(diǎn)型數(shù)值組成的向量,適應(yīng)度最高是適應(yīng)度數(shù)值最小或者是適應(yīng)度數(shù)值最大。
32、一種基于大語(yǔ)言模型的動(dòng)態(tài)調(diào)度策略生成裝置,包括:
33、群體初始化單元,用于群體初始化,定義啟發(fā)式的個(gè)體三元組,并利用大語(yǔ)言模型對(duì)群體進(jìn)行初始化設(shè)置;
34、群體演化單元,用于基于測(cè)試數(shù)據(jù)集對(duì)群體的個(gè)體逐個(gè)進(jìn)行評(píng)估,并利用大語(yǔ)言模型對(duì)群體進(jìn)行演化進(jìn)化操作,迭代生成下一代的群體;
35、策略選擇單元,用于整體評(píng)估群體中的每個(gè)個(gè)體,選出整體最優(yōu)的個(gè)體,作為最終使用的調(diào)度策略。
36、進(jìn)一步,所述群體初始化單元,包括:
37、提示詞模版定義模塊,用于定義初始化提示詞模版,所述模版包含自然語(yǔ)言描述的任務(wù)目標(biāo)、任務(wù)背景、遺傳編程表達(dá)式的組成描述、返回內(nèi)容的格式要求以及引導(dǎo)式思維鏈描述;
38、提示詞拼接模塊,用于拼接完整的提示詞文本;
39、大語(yǔ)言模型接口調(diào)用模塊,用于通過(guò)調(diào)用大語(yǔ)言模型應(yīng)用編程接口獲取遺傳編程表達(dá)式及其策略自然語(yǔ)言描述;
40、個(gè)體構(gòu)建模塊,用于利用正則表達(dá)式和抽象語(yǔ)法樹(shù)從返回的自然語(yǔ)言描述中提取遺傳編程表達(dá)式和策略自然語(yǔ)言描述,構(gòu)建個(gè)體三元組。
41、進(jìn)一步,所述群體演化單元,包括:
42、離散事件仿真單元,用于對(duì)群體中的每個(gè)個(gè)體進(jìn)行評(píng)估,生成適應(yīng)度向量;
43、遺傳算子執(zhí)行單元,用于執(zhí)行隨機(jī)交叉算子、隨機(jī)突變算子以及基于大語(yǔ)言模型的知識(shí)共享交叉算子;
44、群體選擇單元,用于選擇群體,包括非支配解排序遺傳算法和基于大語(yǔ)言模型的排序選擇算法;
45、迭代控制單元,用于判斷是否滿足停止迭代條件,若不滿足則重復(fù)演化進(jìn)化操作。
46、一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有上述方法的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述方法的步驟。
47、本發(fā)明與現(xiàn)有技術(shù)相比存在的有益效果是:提出的方法能夠利用大語(yǔ)言模型的自然語(yǔ)言處理能力生成和完善調(diào)度啟發(fā)式算法,可以以自然語(yǔ)言描述的復(fù)雜調(diào)度要求,從而無(wú)需大量人工干預(yù)即可快速調(diào)整以適應(yīng)不斷變化的參數(shù),這不僅增強(qiáng)了調(diào)度算法的靈活性,還最大限度地減輕了遺傳編程方法的計(jì)算負(fù)擔(dān),最終實(shí)現(xiàn)了動(dòng)態(tài)調(diào)度效果的提升。