技術編號:41954855
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明涉及一種基于周期延拓的大模型長文本外推方法及系統(tǒng),屬于大模型的長文本。背景技術、近些年,基于transformer結構的大語言模型(llm)技術快速發(fā)展,其強大的推理能力在nlp領域以及圖像領域發(fā)揮了非常顯著的作用。然而,當使用大模型對較長的文本輸入進行推理時,發(fā)現模型在長文本上的推理性能急劇下降。然而,實際應用場景中迫切地需要提升大模型處理長文本輸入的能力。尤其是隨著大模型推理與rag技術的結合,模型的輸入文本中需要含有大量檢索信息,這使得模型輸入文本長度倍增。因此,大模型針對長文本輸...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。