1.一種滑動?xùn)艡诔朔e量化方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述初始分割還包括:設(shè)任意元素在原始矩陣中的位置為(a,b),則其在小值矩陣或大值矩陣中的對應(yīng)位置為(a,[b/2]),指示變量存儲在第一指示矩陣的(a,[b/2]),其中[·]代表取整函數(shù);按順序遍歷整個矩陣的元素對,生成小值矩陣、大值矩陣和大小為n×d/2的第一指示矩陣。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過指定所述遞歸分割的次數(shù),形成樹狀分割結(jié)構(gòu),設(shè)遞歸分割的次數(shù)為l,則第一指示矩陣的總大小為l×n×d/2。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過滑窗的方式對合并后的矩陣劃分子空間,包括:設(shè)定窗口大小和每次滑動的距離,將每個滑窗內(nèi)的向量作為一個子空間,將合并后的矩陣的每一個元素被映射到不同的子空間,形成該元素的副本,合并后的矩陣的每一個元素?fù)碛卸鄠€副本。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述count-min操作包括:對合并后的矩陣的每一個元素,計算該元素和其每一個副本所在的子空間的簇中心的距離,在第二指數(shù)矩陣的對應(yīng)位置記錄下離該元素最近的副本所在的子空間編號,將與該元素最近的副本的編碼作為該元素的最終編碼。
6.一種基于滑動?xùn)艡诔朔e量化的圖像壓縮方法,其特征在于,包括以下步驟:
7.一種基于滑動?xùn)艡诔朔e量化的大語言模型權(quán)重量化存儲方法,其特征在于,包括以下步驟:
8.一種滑動?xùn)艡诔朔e量化裝置,其特征在于,包括:
9.一種計算機(jī)設(shè)備,其特征在于,包括存儲器和處理器,所述存儲器存儲計算機(jī)程序,所述計算機(jī)程序被配置為由所述處理器執(zhí)行,所述計算機(jī)程序包括用于執(zhí)行權(quán)利要求1~7中任一項所述方法的指令。
10.一種計算機(jī)可讀存儲介質(zhì),其特征在于,所述計算機(jī)可讀存儲介質(zhì)存儲計算機(jī)程序,所述計算機(jī)程序被計算機(jī)執(zhí)行時,實現(xiàn)權(quán)利要求1~7中任一項所述的方法。