本發(fā)明涉及檔案數(shù)據(jù)處理,尤其涉及一種智慧檔案庫房rfid檔案處理系統(tǒng)。
背景技術(shù):
1、隨著信息化的快速發(fā)展,檔案管理工作也在不斷向數(shù)字化方向發(fā)展。當(dāng)前的檔案庫房管理已廣泛采用自動化系統(tǒng),可通過條形碼等技術(shù)實(shí)現(xiàn)檔案的基礎(chǔ)信息錄入、位置記錄和檢索功能,從而提高檔案管理的效率和準(zhǔn)確性,減少了人工干預(yù)和錯(cuò)誤。
2、然而,目前的檔案庫房管理系統(tǒng)在檔案歸檔策略方面仍存在局限性?,F(xiàn)有的檔案歸檔方式通常是按照預(yù)設(shè)的固定規(guī)則進(jìn)行,如按照簡單的類別劃分、編號順序或時(shí)間順序等進(jìn)行存放,這種方式雖然實(shí)現(xiàn)了自動化,但缺乏智能性和靈活性。特別是在檔案內(nèi)容、使用人員和使用頻率等多維度特征方面的分析不足,導(dǎo)致檔案歸檔不夠合理。例如,經(jīng)常被同一組人員共同使用的相關(guān)檔案可能被分散存放在庫房的不同區(qū)域;使用頻率高的檔案未能優(yōu)先布置在便于取用的位置。
3、這種缺乏對檔案特征考慮的歸檔方式,直接導(dǎo)致檔案歸檔不合理,進(jìn)而影響檔案檢索和管理的效率。即使在自動化程度較高的檔案管理系統(tǒng)中,這一問題依然存在,尤其在檔案數(shù)量龐大的單位更為突出,影響了整體工作效率。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明針對現(xiàn)有檔案歸檔缺乏對檔案特征的考慮,導(dǎo)致檔案歸檔不合理,進(jìn)而導(dǎo)致檔案檢索和管理效率低下的技術(shù)問題,提供一種智慧檔案庫房rfid檔案處理系統(tǒng)來解決。
2、為解決上述技術(shù)問題,本發(fā)明提供了一種智慧檔案庫房rfid檔案處理系統(tǒng),包括:狀態(tài)生成模塊,用于響應(yīng)于rfid標(biāo)簽位置記錄信息,生成檔案取用狀態(tài)信息,其中,所述檔案取用狀態(tài)信息包括檔案內(nèi)容標(biāo)識和檔案人員標(biāo)識;語義聚類模塊,用于根據(jù)所述檔案內(nèi)容標(biāo)識,對檔案集合進(jìn)行語義聚類,獲得一級檔案聚類結(jié)果;人員標(biāo)簽聚類模塊,用于根據(jù)所述檔案人員標(biāo)識,遍歷所述一級檔案聚類結(jié)果進(jìn)行人員標(biāo)簽聚類,獲得二級檔案聚類結(jié)果;頻率統(tǒng)計(jì)模塊,用于遍歷所述二級檔案聚類結(jié)果,基于檔案取用日志,統(tǒng)計(jì)檔案取用頻率集合;歸檔配置模塊,用于根據(jù)所述待存儲檔案,遍歷所述二級檔案聚類結(jié)果進(jìn)行歸類配置,獲得歸屬聚類,其中,歸屬聚類在檔案取用頻率集合具有類屬取用頻率,若類屬取用頻率大于或等于取用頻率閾值,歸檔于預(yù)先標(biāo)識的預(yù)設(shè)庫房區(qū)域。
3、可選地,所述狀態(tài)生成模塊包括:標(biāo)簽獲取單元,用于根據(jù)所述rfid標(biāo)簽位置記錄信息,獲得rfid標(biāo)簽;檔案數(shù)據(jù)獲取單元,用于基于檔案歸檔記錄,獲得與所述rfid標(biāo)簽唯一關(guān)聯(lián)的檔案數(shù)據(jù),其中,所述檔案數(shù)據(jù)在歸檔時(shí)存儲有所述檔案內(nèi)容標(biāo)識和所述檔案人員標(biāo)識。
4、可選地,所述語義聚類模塊包括:第一內(nèi)容標(biāo)識單元,用于獲得所述檔案內(nèi)容標(biāo)識的第一檔案內(nèi)容標(biāo)識,其中,所述第一檔案內(nèi)容標(biāo)識包括第一內(nèi)容屬性集合;第二內(nèi)容標(biāo)識單元,用于獲得所述檔案內(nèi)容標(biāo)識的第二檔案內(nèi)容標(biāo)識,其中,所述第二檔案內(nèi)容標(biāo)識包括第二內(nèi)容屬性集合;語義相似度計(jì)算單元,用于計(jì)算所述第一內(nèi)容屬性集合與所述第二內(nèi)容屬性集合的交集與并集的數(shù)量比,設(shè)為第一語義相似度,添加進(jìn)語義相似度集合;語義聚類執(zhí)行單元,用于基于語義相似度閾值,結(jié)合所述語義相似度集合,對所述檔案集合進(jìn)行語義聚類,獲得所述一級檔案聚類結(jié)果。
5、可選地,所述人員標(biāo)簽聚類模塊包括:第一人員標(biāo)識單元,用于獲得所述檔案人員標(biāo)識的第一檔案人員標(biāo)識,其中,所述第一檔案人員標(biāo)識包括第一人員職位類型集合;第二人員標(biāo)識單元,用于獲得所述檔案人員標(biāo)識的第二檔案人員標(biāo)識,其中,所述第二檔案人員標(biāo)識包括第二人員職位類型集合;人員相似度計(jì)算單元,用于計(jì)算所述第一人員職位類型集合與所述第二人員職位類型集合的交集與并集的數(shù)量比,設(shè)為第一人員相似度,添加進(jìn)人員相似度集合;人員標(biāo)簽聚類執(zhí)行單元,用于基于人員相似度閾值,結(jié)合所述人員相似度集合,對所述檔案集合進(jìn)行人員標(biāo)簽聚類,獲得所述二級檔案聚類結(jié)果。
6、可選地,所述歸檔配置模塊包括:評分函數(shù)配置單元,用于配置庫房貨架優(yōu)先級評分函數(shù):,其中,表征庫房貨架優(yōu)先級,表征貨架運(yùn)動到貨架關(guān)聯(lián)取用位置的路徑距離,表征貨架關(guān)聯(lián)取用位置與門口的路徑距離,和表征第一權(quán)重和第二權(quán)重;優(yōu)先級評分單元,用于根據(jù)所述庫房貨架優(yōu)先級評分函數(shù),遍歷庫房貨架進(jìn)行優(yōu)先級評分,獲得優(yōu)先級評分集合;庫房貨架聚類單元,用于根據(jù)優(yōu)先級評分閾值,對庫房貨架進(jìn)行聚類,獲得庫房貨架聚類結(jié)果,其中,所述庫房貨架聚類結(jié)果具有質(zhì)心優(yōu)先級評分標(biāo)識;聚類結(jié)果排序單元,用于按照所述質(zhì)心優(yōu)先級評分標(biāo)識自小到大對所述庫房貨架聚類結(jié)果進(jìn)行排序,獲得庫房貨架聚類排序結(jié)果;預(yù)先標(biāo)識單元,用于按照所述庫房貨架聚類排序結(jié)果選取空置的庫房區(qū)域進(jìn)行預(yù)先標(biāo)識。
7、可選地,所述預(yù)先標(biāo)識單元包括:檔案排序子單元,用于當(dāng)所述類屬取用頻率大于或等于所述取用頻率閾值的待存儲檔案為多個(gè),根據(jù)所述類屬取用頻率自大到小對待存儲檔案排序,獲得待存儲檔案排序結(jié)果;貨架排序子單元,用于根據(jù)所述庫房貨架聚類排序結(jié)果,提取空置貨架屬類排序結(jié)果;適應(yīng)度函數(shù)子單元,用于構(gòu)建存儲適應(yīng)度函數(shù):,其中,表征存儲方案適應(yīng)度,表征第j個(gè)預(yù)占用貨架屬類序號,表征第k個(gè)空置貨架屬類,h表征預(yù)占用貨架總數(shù),m表征空置貨架總數(shù),表征第i個(gè)待存儲檔案在待存儲檔案排序結(jié)果的序號,表征第i個(gè)待存儲檔案的預(yù)占用貨架在空置貨架屬類排序結(jié)果的序號,n表征待存儲檔案數(shù)量;存儲方案獲取子單元,用于將所述待存儲檔案排序結(jié)果隨機(jī)落入空置貨架,獲得若干個(gè)存儲方案;最小值分選子單元,用于根據(jù)所述存儲適應(yīng)度函數(shù),對所述若干個(gè)存儲方案進(jìn)行最小值分選,獲得所述空置的庫房區(qū)域進(jìn)行預(yù)先標(biāo)識。
8、可選地,所述歸檔配置模塊還包括:相似度評估單元,用于基于所述待存儲檔案,分別與所述二級檔案聚類結(jié)果的每類的質(zhì)心檔案進(jìn)行語義和人員標(biāo)簽的相似度評估,并執(zhí)行均值計(jì)算,獲得相似度集合;歸屬聚類獲取單元,用于根據(jù)所述相似度集合,提取最大值相似度對應(yīng)的類,設(shè)為所述歸屬聚類。
9、本發(fā)明的有益效果是:
10、狀態(tài)生成模塊用于響應(yīng)于rfid標(biāo)簽位置記錄信息,生成檔案取用狀態(tài)信息,其中檔案取用狀態(tài)信息包括檔案內(nèi)容標(biāo)識和檔案人員標(biāo)識;通過狀態(tài)生成模塊,系統(tǒng)能夠自動捕獲和記錄檔案的取用情況以及相關(guān)人員信息,為后續(xù)的智能分析奠定數(shù)據(jù)基礎(chǔ);通過語義聚類模塊根據(jù)檔案內(nèi)容標(biāo)識,對檔案集合進(jìn)行語義聚類,獲得一級檔案聚類結(jié)果,從而使系統(tǒng)能夠基于檔案內(nèi)容的語義特征進(jìn)行初步分類,將內(nèi)容相關(guān)的檔案歸為同一類別,實(shí)現(xiàn)檔案的內(nèi)容關(guān)聯(lián)性分析;通過人員標(biāo)簽聚類模塊根據(jù)檔案人員標(biāo)識,遍歷一級檔案聚類結(jié)果進(jìn)行人員標(biāo)簽聚類,獲得二級檔案聚類結(jié)果,從而在內(nèi)容分類的基礎(chǔ)上,進(jìn)一步考慮了使用人員因素,將同一類檔案中經(jīng)常被相同人員使用的檔案進(jìn)行更細(xì)致的分組,增強(qiáng)了檔案分類的精準(zhǔn)度;通過頻率統(tǒng)計(jì)模塊遍歷二級檔案聚類結(jié)果,基于檔案取用日志,統(tǒng)計(jì)檔案取用頻率集合,從而分析了檔案的使用頻率特征,為后續(xù)的歸檔位置優(yōu)化提供了依據(jù),使得高頻使用的檔案能夠放置在更便于取用的位置;通過歸檔配置模塊根據(jù)待存儲檔案,遍歷二級檔案聚類結(jié)果進(jìn)行歸類配置,獲得歸屬聚類,其中,歸屬聚類在檔案取用頻率集合具有類屬取用頻率,若類屬取用頻率大于或等于取用頻率閾值,則將檔案歸檔于預(yù)先標(biāo)識的預(yù)設(shè)庫房區(qū)域,從而實(shí)現(xiàn)了對檔案存儲位置的智能配置,確保了高頻使用的檔案類別被存放在最優(yōu)位置,提高了檔案檢索和管理的效率。
11、通過上述技術(shù)方案,實(shí)現(xiàn)了對檔案內(nèi)容、檔案人員和檔案取用頻率的多維分析,進(jìn)而提高了檔案歸檔的合理性,從而達(dá)到了提高檔案檢索和管理效率的技術(shù)效果。