多媒體信息更新方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別涉及一種多媒體信息更新方法及裝置。
【背景技術(shù)】
[0002] 隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,人們通過(guò)網(wǎng)絡(luò)觀看視頻或收聽(tīng)音頻變得越來(lái)越普遍。 由于視頻和音頻等多媒體文件每天都在不定時(shí)更新,為了增強(qiáng)用戶(hù)體驗(yàn)度,還需在第一時(shí) 間內(nèi)抓取更新的多媒體信息。其中,多媒體信息可包括更新多媒體文件的簡(jiǎn)介信息和播放 地址信息等等。然而,對(duì)于多媒體文件搜索引擎來(lái)說(shuō),由于對(duì)數(shù)據(jù)進(jìn)行一輪全量更新需要花 費(fèi)較長(zhǎng)時(shí)間,因此,如何在保證數(shù)據(jù)覆蓋率的同時(shí)快速地對(duì)多媒體信息進(jìn)行更新,成為了本 領(lǐng)域技術(shù)人員較為關(guān)注的一個(gè)問(wèn)題。
[0003] W視頻文件為例,現(xiàn)有技術(shù)通常采取H種方式對(duì)視頻文件的視頻信息進(jìn)行更 新。第一種方式為全量更新方式。目P,直接根據(jù)所有視頻文件的抓LOJniform Resource Locator,統(tǒng)一資源定位符)抓取新添加的視頻信息,并根據(jù)新添加的視頻信息對(duì)原始視頻 信息進(jìn)行更新。第二種方式為站點(diǎn)更新方式。目P,W站點(diǎn)為單位對(duì)新添加的視頻信息進(jìn)行 抓取。首先,根據(jù)不同站點(diǎn)的質(zhì)量為每個(gè)站點(diǎn)分配一定權(quán)重;在爬蟲(chóng)程序根據(jù)URL抓取數(shù)據(jù) 之前,對(duì)各個(gè)站點(diǎn)進(jìn)行打分;之后,基于打分?jǐn)?shù)值的高低順序,依次對(duì)各個(gè)站點(diǎn)下的視頻信 息進(jìn)行更新。第H種方式為隊(duì)列更新方式。目P,W U化為單位對(duì)新添加的視頻信息進(jìn)行抓 取。首先,在爬蟲(chóng)程序根據(jù)U化抓取數(shù)據(jù)之前,基于各個(gè)U化的因素(比如,站點(diǎn)質(zhì)量、U化 模式、頁(yè)面質(zhì)量、等待時(shí)間)對(duì)各個(gè)U化進(jìn)行打分;之后,依據(jù)打分?jǐn)?shù)值的高低順序,將各個(gè) U化放入一個(gè)優(yōu)先級(jí)隊(duì)列中;最終,爬蟲(chóng)程序不斷從該隊(duì)列中取出U化,并根據(jù)取出的U化對(duì) 視頻信息進(jìn)行更新。
[0004] 在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在W下問(wèn)題:
[0005] 針對(duì)第一種方式,在一輪數(shù)據(jù)更新過(guò)程中很多視頻文件可能暫無(wú)更新,但送些數(shù) 據(jù)的m?L也會(huì)被進(jìn)行相應(yīng)處理,甚至基于該U化進(jìn)行數(shù)據(jù)抓取。而盲目的數(shù)據(jù)抓取不但增 加了更新時(shí)間,而且存在因?qū)?duì)方服務(wù)器的訪問(wèn)量過(guò)大而被對(duì)方站點(diǎn)封禁的缺陷。針對(duì)第 二種方式,由于目前互聯(lián)網(wǎng)已經(jīng)越來(lái)越重視版權(quán)管理,所W有很多多媒體文件是獨(dú)家的,而 該種方式對(duì)于獨(dú)播多媒體文件不能及時(shí)進(jìn)行更新。針對(duì)第H種方式,由于影響U化分?jǐn)?shù)的 因素較多,而打分方式不能做到對(duì)所有因素進(jìn)行覆蓋,所W同樣存在數(shù)據(jù)更新量大、更新時(shí) 間長(zhǎng)的缺陷。
【發(fā)明內(nèi)容】
[0006] 為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明實(shí)施例提供了一種多媒體信息更新方法及裝 置。所述技術(shù)方案如下:
[0007] -方面,提供了一種多媒體信息更新方法,所述方法包括:
[0008] 對(duì)于每一個(gè)多媒體信息集合,當(dāng)所述多媒體信息集合中包括歷史多媒體信息時(shí), 判斷所述歷史多媒體信息的更新時(shí)間是否滿(mǎn)足更新時(shí)間規(guī)則;
[0009] 當(dāng)所述歷史多媒體信息滿(mǎn)足更新時(shí)間規(guī)則時(shí),根據(jù)所述歷史多媒體信息的更新時(shí) 間,計(jì)算所述多媒體信息集合的第一預(yù)測(cè)更新時(shí)間;
[0010] 確定第一預(yù)測(cè)更新時(shí)間小于當(dāng)前時(shí)間的指定多媒體信息集合;
[0011] 根據(jù)所述指定多媒體信息集合的地址信息,獲取更新的多媒體信息。
[0012] 另一方面,提供了一種多媒體信息更新裝置,所述裝置包括:
[0013] 更新時(shí)間規(guī)則判斷模塊,用于對(duì)于每一個(gè)多媒體信息集合,當(dāng)所述多媒體信息集 合中包括歷史多媒體信息時(shí),判斷所述歷史多媒體信息的更新時(shí)間是否滿(mǎn)足更新時(shí)間規(guī) 則;
[0014] 預(yù)測(cè)更新時(shí)間計(jì)算模塊,用于當(dāng)所述歷史多媒體信息滿(mǎn)足更新時(shí)間規(guī)則時(shí),根據(jù) 所述歷史多媒體信息的更新時(shí)間,計(jì)算所述多媒體信息集合的第一預(yù)測(cè)更新時(shí)間;
[0015] 多媒體信息集合確定模塊,用于確定第一預(yù)測(cè)更新時(shí)間小于當(dāng)前時(shí)間的指定多媒 體信息集合;
[0016] 第一多媒體信息獲取模塊,用于根據(jù)所述指定多媒體信息集合的地址信息,獲取 更新的多媒體信息。
[0017] 本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果是:
[0018] 對(duì)于每一個(gè)多媒體信息集合來(lái)說(shuō),當(dāng)多媒體信息集合中包括歷史多媒體信息時(shí), 判斷歷史多媒體信息的更新時(shí)間是否滿(mǎn)足更新時(shí)間規(guī)則;當(dāng)歷史多媒體信息滿(mǎn)足更新時(shí)間 規(guī)則時(shí),根據(jù)歷史多媒體信息的更新時(shí)間,計(jì)算多媒體信息集合的第一預(yù)測(cè)更新時(shí)間,并確 定第一預(yù)測(cè)更新時(shí)間小于當(dāng)前時(shí)間的指定多媒體信息集合;之后,根據(jù)指定多媒體信息集 合的地址信息,獲取更新的多媒體信息,由于在每一輪的更新過(guò)程中,基于歷史多媒體信息 對(duì)多媒體信息集合的更新時(shí)間進(jìn)行預(yù)測(cè),并根據(jù)預(yù)測(cè)得到的更新時(shí)間對(duì)多媒體信息集合進(jìn) 行更新,可有效降低數(shù)據(jù)更新量和數(shù)據(jù)更新時(shí)間。
【附圖說(shuō)明】
[0019] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使 用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于 本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可W根據(jù)送些附圖獲得其他 的附圖。
[0020] 圖1是本發(fā)明實(shí)施例提供的一種多媒體信息更新方法所涉及的實(shí)施環(huán)境的結(jié)構(gòu) 示意圖;
[0021] 圖2是本發(fā)明實(shí)施例提供的一種多媒體信息更新方法的流程圖;
[0022] 圖3是本發(fā)明實(shí)施例提供的一種多媒體信息更新方法的流程圖;
[0023] 圖4是本發(fā)明實(shí)施例提供的一種多媒體信息更新裝置結(jié)構(gòu)示意圖;
[0024] 圖5是本發(fā)明實(shí)施例提供的一種終端的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0025] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方 式作進(jìn)一步地詳細(xì)描述。
[0026] 在對(duì)本發(fā)明實(shí)施例做詳細(xì)地解釋說(shuō)明之前,先對(duì)本發(fā)明實(shí)施例的應(yīng)用場(chǎng)景予W說(shuō) 明。
[0027] 圖I是本發(fā)明實(shí)施例提供的一種多媒體信息更新方法所涉及的實(shí)施環(huán)境的結(jié)構(gòu) 示意圖。參見(jiàn)圖1,W多媒體文件為視頻文件為例,則一個(gè)視頻文件被發(fā)布在視頻網(wǎng)站后,女口 果能夠被終端安裝的爬蟲(chóng)程序快速抓取到,則可大幅增強(qiáng)用戶(hù)的體驗(yàn)度,可為視頻網(wǎng)站挽 留大量的用戶(hù)。
[0028] 其中,終端可每隔一定時(shí)間通過(guò)爬蟲(chóng)程序自動(dòng)對(duì)全網(wǎng)多媒體信息進(jìn)行一輪更新, 具體為對(duì)于每一個(gè)多媒體信息集合,當(dāng)多媒體信息集合中包括歷史多媒體信息時(shí),判斷歷 史多媒體信息的更新時(shí)間是否滿(mǎn)足更新時(shí)間規(guī)則;當(dāng)歷史多媒體信息滿(mǎn)足更新時(shí)間規(guī)則 時(shí),根據(jù)歷史多媒體信息的更新時(shí)間,計(jì)算多媒體信息集合的第一預(yù)測(cè)更新時(shí)間;確定第一 預(yù)測(cè)更新時(shí)間小于當(dāng)前時(shí)間的指定多媒體信息集合;根據(jù)指定多媒體信息集合的地址信 息,獲取更新的多媒體信息。服務(wù)器中不斷有更新的多媒體信息出現(xiàn)。終端從服務(wù)器上通 過(guò)抓取網(wǎng)頁(yè)的形式對(duì)本地的多媒體信息進(jìn)行更新。
[0029] 圖2是本發(fā)明實(shí)施例提供的一種多媒體信息更新方法的流程圖。參見(jiàn)圖2,本發(fā)明 實(shí)施例提供的方法流程包括:
[0030] 201、對(duì)于每一個(gè)多媒體信息集合,當(dāng)多媒體信息集合中包括歷史多媒體信息時(shí), 判斷歷史多媒體信息的更新時(shí)間是否滿(mǎn)足更新時(shí)間規(guī)則。
[0031] 202、當(dāng)歷史多媒體信息滿(mǎn)足更新時(shí)間規(guī)則時(shí),根據(jù)歷史多媒體信息的更新時(shí)間, 計(jì)算多媒體信息集合的第一預(yù)測(cè)更新時(shí)間。
[0032] 203、確定第一預(yù)測(cè)更新時(shí)間小于當(dāng)前時(shí)間的指定多媒體信息集合。
[0033] 204、根據(jù)指定多媒體信息集合的地址信息,獲取更新的多媒體信息。
[0034] 本發(fā)明實(shí)施例提供的方法,對(duì)于每一個(gè)多媒體信息集合來(lái)說(shuō),當(dāng)多媒體信息集合 中包括歷史多媒體信息時(shí),判斷歷史多媒體信息的更新時(shí)間是否滿(mǎn)足更新時(shí)間規(guī)則;當(dāng)歷 史多媒體信息滿(mǎn)足更新時(shí)間規(guī)則時(shí),根據(jù)歷史多媒體信息的更新時(shí)間,計(jì)算多媒體信息集 合的第一預(yù)測(cè)更新時(shí)間,并確定第一預(yù)測(cè)更新時(shí)間小于當(dāng)前時(shí)間的指定多媒體信息集合; 之后,根據(jù)指定多媒體信息集合的地址信息,獲取更新的多媒體信息,由于在每一輪的更新 過(guò)程中,基于歷史多媒體信息對(duì)多媒體信息集合的更新時(shí)間進(jìn)行預(yù)測(cè),并根據(jù)預(yù)測(cè)得到的 更新時(shí)間對(duì)多媒體信息集合進(jìn)行更新,可有效降低數(shù)據(jù)更新量和數(shù)據(jù)更新時(shí)間。
[0035] 可選地,第一預(yù)測(cè)更新時(shí)間包括預(yù)測(cè)更新日期,根據(jù)歷史多媒體信息的更新時(shí)間, 計(jì)算多媒體信息集合的第一預(yù)測(cè)更新時(shí)間,包括:
[0036] 獲取每一項(xiàng)歷史多媒體信息的更新日期;
[0037] 統(tǒng)計(jì)更新日期坐落在第一預(yù)設(shè)時(shí)長(zhǎng)中每一天的比例;
[0038] 計(jì)算有多媒體信息更新的天數(shù);
[003引根據(jù)比例和天數(shù),計(jì)算多媒體信息集合的預(yù)測(cè)更新日期。
[0040] 可選地,第一預(yù)測(cè)更新時(shí)間包括第一預(yù)測(cè)更新時(shí)刻,根據(jù)歷史多媒體信息的更新 時(shí)間,計(jì)算多媒體信息集合的第一預(yù)測(cè)更新時(shí)間,包括:
[0041] 獲取每一項(xiàng)歷史多媒體信息的更新時(shí)刻;
[0042] 根據(jù)更新時(shí)刻,預(yù)測(cè)多媒體信息集合的第二預(yù)測(cè)更新時(shí)刻;
[0043] 確定當(dāng)前的更新時(shí)間修正值;
[0044] 根據(jù)第二預(yù)測(cè)更新時(shí)刻和當(dāng)前的更新時(shí)間修正值,計(jì)算第一預(yù)測(cè)更新時(shí)刻。
[0045] 可選地,根據(jù)指定多媒體信息集合的地址信息,獲取更新的多媒體信息之后,該方 法還包括:
[0046] 獲取修正時(shí)間步長(zhǎng)和當(dāng)前的更新時(shí)間修正值;
[0047] 當(dāng)?shù)谝活A(yù)測(cè)更新時(shí)刻小于指定更新時(shí)刻時(shí),根據(jù)當(dāng)前的更新時(shí)間修正值和修正時(shí) 間步長(zhǎng)之和,重置當(dāng)前的更新時(shí)間修正值的大小,得到新的更新時(shí)間修正值;或,
[0048] 當(dāng)?shù)谝活A(yù)測(cè)更新時(shí)刻等于指定更新時(shí)刻時(shí),根據(jù)當(dāng)前的更新時(shí)間修正值和修正時(shí) 間步長(zhǎng)之差,重置當(dāng)前的更新時(shí)間修正值的大小,得到新的更新時(shí)間修正值;
[0049] 其中,指定更新時(shí)刻為指定多媒體信息集合的實(shí)際更新時(shí)刻。
[0050] 可選地,判斷歷史多媒體信息的更新時(shí)間是否滿(mǎn)足更新時(shí)間規(guī)則,包括:
[0051] 根據(jù)歷史多媒體信息的更新時(shí)間,判斷歷史多媒體信息之間的更新時(shí)間間隔是否 大于預(yù)設(shè)時(shí)間闊值;
[0052] 如果歷史多媒體信息之間的更新時(shí)間間隔大于預(yù)設(shè)時(shí)間闊值,則判斷歷史多媒體 信息的更新時(shí)間滿(mǎn)足更新時(shí)間規(guī)則。
[0053] 可選地,判斷歷史多媒體信息的更新時(shí)間是否滿(mǎn)足更新時(shí)間規(guī)則之后,該方法還 包括:
[0054] 當(dāng)歷史多媒體信息的更新時(shí)間不滿(mǎn)足更新時(shí)間規(guī)則時(shí),每隔第二預(yù)設(shè)時(shí)長(zhǎng)獲取多 媒體信息集合的更新數(shù)據(jù);
[0055] 在數(shù)據(jù)更新時(shí)長(zhǎng)達(dá)到第H預(yù)設(shè)時(shí)長(zhǎng)后,根據(jù)第H預(yù)設(shè)時(shí)長(zhǎng)內(nèi)每一個(gè)指定多媒體信 息的更新時(shí)間,統(tǒng)計(jì)多媒體信息集合的第二預(yù)測(cè)更新時(shí)