所屬的技術(shù)人員能夠理解,本技術(shù)的各方面可以實(shí)現(xiàn)為系統(tǒng)、方法或程序產(chǎn)品。因此,本技術(shù)的各方面可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件實(shí)施方式、完全的軟件實(shí)施方式(包括固件、微代碼等),或硬件和軟件方面結(jié)合的實(shí)施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。在一種可能的實(shí)現(xiàn)方式中,本技術(shù)實(shí)施例提供的計(jì)算設(shè)備可以至少包括處理器和存儲(chǔ)器。其中,存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)計(jì)算機(jī)程序被處理器執(zhí)行時(shí),使得處理器執(zhí)行本技術(shù)中各種示例性實(shí)施方式的標(biāo)簽識(shí)別方法中的任一步驟。在另一種可能的實(shí)現(xiàn)方式中,計(jì)算設(shè)備可以是終端設(shè)備,計(jì)算設(shè)備的結(jié)構(gòu)可以如圖15所示,包括:通信組件1510、存儲(chǔ)器1520、顯示單元1530、攝像頭1540、傳感器1550、音頻電路1560、藍(lán)牙模塊1570、處理器1580等部件。通信組件1510用于與服務(wù)器進(jìn)行通信。在一些實(shí)施例中,可以包括電路無(wú)線保真(wireless?fidelity,wifi)模塊,wifi模塊屬于短距離無(wú)線傳輸技術(shù),計(jì)算設(shè)備通過(guò)wifi模塊可以幫助用戶收發(fā)信息。存儲(chǔ)器1520可用于存儲(chǔ)軟件程序及數(shù)據(jù)。處理器1580通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器1520的軟件程序或數(shù)據(jù),從而執(zhí)行終端設(shè)備的各種功能以及數(shù)據(jù)處理。存儲(chǔ)器1520可以包括高速隨機(jī)存取存儲(chǔ)器,還可以包括非易失性存儲(chǔ)器,例如至少一類磁盤存儲(chǔ)器件、閃存器件、或其他易失性固態(tài)存儲(chǔ)器件。存儲(chǔ)器1520存儲(chǔ)有使得終端設(shè)備能運(yùn)行的操作系統(tǒng)。本技術(shù)中存儲(chǔ)器1520可以存儲(chǔ)操作系統(tǒng)及各種應(yīng)用程序,還可以存儲(chǔ)執(zhí)行本技術(shù)實(shí)施例標(biāo)簽識(shí)別方法的代碼。顯示單元1530還可用于顯示由用戶輸入的信息或提供給用戶的信息以及終端設(shè)備的各種菜單的圖形用戶界面(graphical?user?interface,gui)。具體地,顯示單元1530可以包括設(shè)置在終端設(shè)備正面的顯示屏1532。其中,顯示屏1532可以采用液晶顯示器、發(fā)光二極管等形式來(lái)配置。顯示單元1530還可用于接收輸入的數(shù)字或字符信息,產(chǎn)生與終端設(shè)備的用戶設(shè)置以及功能控制有關(guān)的信號(hào)輸入,具體地,顯示單元1530可以包括設(shè)置在終端設(shè)備正面的觸摸屏1531,可收集用戶在其上或附近的觸摸操作,例如點(diǎn)擊按鈕,拖動(dòng)滾動(dòng)框等。其中,觸摸屏1531可以覆蓋在顯示屏1532之上,也可以將觸摸屏1531與顯示屏1532集成而實(shí)現(xiàn)終端設(shè)備的輸入和輸出功能,集成后可以簡(jiǎn)稱觸摸顯示屏。攝像頭1540可用于捕獲靜態(tài)圖像。攝像頭1540可以是一個(gè),也可以是多個(gè)。物體通過(guò)鏡頭生成光學(xué)圖像投射到感光元件。感光元件可以是電荷耦合器件(charge?coupleddevice,ccd)或互補(bǔ)金屬氧化物半導(dǎo)體(complementary?metal-oxide-semiconductor,cmos)光電晶體管。感光元件把光信號(hào)轉(zhuǎn)換成電信號(hào),之后將電信號(hào)傳遞給處理器1580轉(zhuǎn)換成數(shù)字圖像信號(hào)。終端設(shè)備還可以包括至少一種傳感器1550,比如加速度傳感器1551、距離傳感器1552、指紋傳感器1553、溫度傳感器1554。終端設(shè)備還可配置有陀螺儀、氣壓計(jì)、濕度計(jì)、溫度計(jì)、紅外線傳感器、光傳感器、運(yùn)動(dòng)傳感器等其他傳感器。音頻電路1560、揚(yáng)聲器1561、傳聲器1562可提供用戶與終端設(shè)備之間的音頻接口。音頻電路1560可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號(hào),傳輸?shù)綋P(yáng)聲器1561,由揚(yáng)聲器1561轉(zhuǎn)換為聲音信號(hào)輸出。終端設(shè)備還可配置音量按鈕,用于調(diào)節(jié)聲音信號(hào)的音量。另一方面,傳聲器1562將收集的聲音信號(hào)轉(zhuǎn)換為電信號(hào),由音頻電路1560接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出至通信組件1510以發(fā)送給比如另一終端設(shè)備,或者將音頻數(shù)據(jù)輸出至存儲(chǔ)器1520以便進(jìn)一步處理。藍(lán)牙模塊1570用于通過(guò)藍(lán)牙協(xié)議來(lái)與其他具有藍(lán)牙模塊的藍(lán)牙設(shè)備進(jìn)行信息交互。例如,終端設(shè)備可以通過(guò)藍(lán)牙模塊1570與同樣具備藍(lán)牙模塊的可穿戴計(jì)算設(shè)備(例如智能手表)建立藍(lán)牙連接,從而進(jìn)行數(shù)據(jù)交互。處理器1580是終端設(shè)備的控制中心,利用各種接口和線路連接整個(gè)終端的各個(gè)部分,通過(guò)運(yùn)行或執(zhí)行存儲(chǔ)在存儲(chǔ)器1520內(nèi)的軟件程序,以及調(diào)用存儲(chǔ)在存儲(chǔ)器1520內(nèi)的數(shù)據(jù),執(zhí)行終端設(shè)備的各種功能和處理數(shù)據(jù)。在一些實(shí)施例中,處理器1580可包括一個(gè)或多個(gè)處理單元;處理器1580還可以集成應(yīng)用處理器和基帶處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,基帶處理器主要處理無(wú)線通信??梢岳斫獾氖牵鲜龌鶐幚砥饕部梢圆患傻教幚砥?580中。本技術(shù)中處理器1580可以運(yùn)行操作系統(tǒng)、應(yīng)用程序、用戶界面顯示及觸控響應(yīng),以及本技術(shù)實(shí)施例的標(biāo)簽識(shí)別方法;另外,處理器1580與顯示單元1530耦接。在另一種可能的實(shí)現(xiàn)方式中,計(jì)算設(shè)備可以是服務(wù)器。計(jì)算設(shè)備的結(jié)構(gòu)可以如圖16所示,計(jì)算設(shè)備1600的組件可以包括但不限于:至少一個(gè)處理器1601、至少一個(gè)存儲(chǔ)器1602、連接不同系統(tǒng)組件(包括存儲(chǔ)器1602和處理器1601)的總線1603。存儲(chǔ)器1602可用于存儲(chǔ)軟件程序及數(shù)據(jù)。處理器1601通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器1602的軟件程序或數(shù)據(jù),從而執(zhí)行各種功能以及數(shù)據(jù)處理,實(shí)現(xiàn)本技術(shù)實(shí)施例的標(biāo)簽識(shí)別方法??偩€1603表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)器總線或者存儲(chǔ)器控制器、外圍總線、處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。存儲(chǔ)器1602可以包括易失性存儲(chǔ)器形式的可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)器(ram)16021和/或高速緩存存儲(chǔ)器16022,還可以進(jìn)一步包括只讀存儲(chǔ)器(rom)16023。存儲(chǔ)器1602還可以包括具有一組(至少一個(gè))程序模塊16024的程序/實(shí)用工具16025,這樣的程序模塊16024包括但不限于:操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。計(jì)算設(shè)備1600也可以與一個(gè)或多個(gè)外部設(shè)備1604(例如鍵盤、指向設(shè)備等)通信,還可與一個(gè)或者多個(gè)使得用戶能與計(jì)算設(shè)備1600交互的設(shè)備通信,和/或與使得該計(jì)算設(shè)備1600能與一個(gè)或多個(gè)其它計(jì)算裝置進(jìn)行通信的任何設(shè)備(例如路由器、調(diào)制解調(diào)器等等)通信。這種通信可以通過(guò)輸入/輸出(i/o)接口1605進(jìn)行。并且,計(jì)算設(shè)備1600還可以通過(guò)網(wǎng)絡(luò)適配器1606與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖16所示,網(wǎng)絡(luò)適配器1606通過(guò)總線1603與用于計(jì)算設(shè)備1600的其它模塊通信。應(yīng)當(dāng)理解,盡管圖16中未示出,可以結(jié)合計(jì)算設(shè)備1600使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理器、外部磁盤驅(qū)動(dòng)陣列、raid系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。在一些可能的實(shí)施方式中,本技術(shù)提供的標(biāo)簽識(shí)別方法的各方面還可以實(shí)現(xiàn)為一種程序產(chǎn)品的形式,其包括計(jì)算機(jī)程序,當(dāng)程序產(chǎn)品在計(jì)算設(shè)備上運(yùn)行時(shí),計(jì)算機(jī)程序用于使計(jì)算設(shè)備執(zhí)行本說(shuō)明書上述描述的根據(jù)本技術(shù)各種示例性實(shí)施方式的標(biāo)簽識(shí)別方法中的步驟。程序產(chǎn)品可以采用一個(gè)或多個(gè)可讀介質(zhì)的任意組合??勺x介質(zhì)可以是可讀信號(hào)介質(zhì)或者可讀存儲(chǔ)介質(zhì)。可讀存儲(chǔ)介質(zhì)例如可以是但不限于電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合??勺x存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式盤、硬盤、隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊盤只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。本技術(shù)的實(shí)施方式的程序產(chǎn)品可以采用便攜式緊湊盤只讀存儲(chǔ)器(cd-rom)并包括計(jì)算機(jī)程序,并可以在計(jì)算裝置上運(yùn)行。然而,本技術(shù)的程序產(chǎn)品不限于此,在本文件中,可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被命令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用??勺x信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了可讀計(jì)算機(jī)程序。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括但不限于電磁信號(hào)、光信號(hào)或上述的任意合適的組合。可讀信號(hào)介質(zhì)還可以是可讀存儲(chǔ)介質(zhì)以外的任何可讀介質(zhì),該可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由命令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。可讀介質(zhì)上包含的計(jì)算機(jī)程序可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于無(wú)線、有線、光纜、rf等等,或者上述的任意合適的組合??梢砸砸环N或多種程序設(shè)計(jì)語(yǔ)言的任意組合來(lái)編寫用于執(zhí)行本技術(shù)操作的計(jì)算機(jī)程序,程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言—諸如java、c++等,還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言—諸如“c”語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。計(jì)算機(jī)程序可以完全地在用戶計(jì)算裝置上執(zhí)行、部分地在用戶設(shè)備上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算裝置上部分在遠(yuǎn)程計(jì)算裝置上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算裝置或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算裝置的情形中,遠(yuǎn)程計(jì)算裝置可以通過(guò)任意種類的網(wǎng)絡(luò)包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)連接到用戶計(jì)算裝置,或者,可以連接到外部計(jì)算裝置(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng)連接)。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本技術(shù)的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本技術(shù)可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本技術(shù)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用計(jì)算機(jī)程序的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。本技術(shù)是參照根據(jù)本技術(shù)實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序命令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序命令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程設(shè)備的處理器執(zhí)行的命令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定功能的裝置。這些計(jì)算機(jī)程序命令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的命令產(chǎn)生包括命令裝置的制造品,該命令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定功能。這些計(jì)算機(jī)程序命令也可裝載到計(jì)算機(jī)或其他可編程設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的命令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定功能的步驟。盡管已描述了本技術(shù)的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本技術(shù)范圍的所有變更和修改。顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本技術(shù)進(jìn)行各種改動(dòng)和變型而不脫離本技術(shù)的精神和范圍。這樣,倘若本技術(shù)的這些修改和變型屬于本技術(shù)權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本技術(shù)也意圖包含這些改動(dòng)和變型在內(nèi)。
背景技術(shù):
1、為了更加快速的實(shí)現(xiàn)對(duì)待識(shí)別對(duì)象搜索、查詢、推薦等業(yè)務(wù)操作,會(huì)根據(jù)待識(shí)別對(duì)象的文本內(nèi)容,對(duì)待識(shí)別對(duì)象進(jìn)行標(biāo)簽識(shí)別。標(biāo)簽識(shí)別時(shí),針對(duì)同一待識(shí)別對(duì)象可識(shí)別出多個(gè)標(biāo)簽,且標(biāo)簽之間存在一定的關(guān)聯(lián)關(guān)系。
2、目前,標(biāo)簽之間的關(guān)聯(lián)關(guān)系是基于層次分類確定的;其中,層次分類是自然語(yǔ)言處理和計(jì)算機(jī)視覺等領(lǐng)域的多分類中重要的一項(xiàng)任務(wù),其主要的特點(diǎn)在于,層次分類中的標(biāo)簽具有上下級(jí)的關(guān)系,上級(jí)標(biāo)簽是下級(jí)標(biāo)簽的父級(jí),越往下級(jí)層次分類的粒度越細(xì)。
3、相關(guān)技術(shù)中,基于標(biāo)簽體系的多分類任務(wù),大多是將分類任務(wù)當(dāng)成幾個(gè)基礎(chǔ)的多分類任務(wù),直接預(yù)測(cè)待識(shí)別對(duì)象的二級(jí)標(biāo)簽,并直接由預(yù)測(cè)結(jié)果來(lái)回溯一級(jí)標(biāo)簽,這種方式導(dǎo)致對(duì)待識(shí)別對(duì)象標(biāo)簽識(shí)別的準(zhǔn)確率低。
4、因此,如何提高待識(shí)別對(duì)象標(biāo)簽識(shí)別的準(zhǔn)確率是目前需要解決的技術(shù)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供一種標(biāo)簽識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),用以提高待識(shí)別對(duì)象標(biāo)簽識(shí)別的準(zhǔn)確率。
2、第一方面,本技術(shù)實(shí)施例提供一種標(biāo)簽識(shí)別方法,該方法包括:
3、獲取待識(shí)別的待識(shí)別對(duì)象的文本信息,并提取出文本信息的文本語(yǔ)義特征;
4、基于文本語(yǔ)義特征對(duì)待識(shí)別對(duì)象進(jìn)行分類處理,獲得待識(shí)別對(duì)象的至少一個(gè)第一目標(biāo)標(biāo)簽及相應(yīng)的第一可信度;
5、分別提取至少一個(gè)第一目標(biāo)標(biāo)簽的標(biāo)簽語(yǔ)義特征,并基于獲得的至少一個(gè)第一可信度,對(duì)相應(yīng)的標(biāo)簽語(yǔ)義特征進(jìn)行拼接處理,獲得綜合標(biāo)簽特征;
6、基于綜合標(biāo)簽特征和文本語(yǔ)義特征,獲得待識(shí)別對(duì)象的至少一個(gè)第二目標(biāo)標(biāo)簽;其中,第二目標(biāo)標(biāo)簽為第一目標(biāo)標(biāo)簽的子標(biāo)簽。
7、第二方面,本技術(shù)實(shí)施例提供一種標(biāo)簽識(shí)別裝置,該裝置包括:
8、獲取單元,用于獲取待識(shí)別的待識(shí)別對(duì)象的文本信息,并提取出文本信息的文本語(yǔ)義特征;
9、分類單元,用于基于文本語(yǔ)義特征對(duì)待識(shí)別對(duì)象進(jìn)行分類處理,獲得待識(shí)別對(duì)象的至少一個(gè)第一目標(biāo)標(biāo)簽及相應(yīng)的第一可信度;
10、拼接單元,用于分別提取至少一個(gè)第一目標(biāo)標(biāo)簽的標(biāo)簽語(yǔ)義特征,并基于獲得的至少一個(gè)第一可信度,對(duì)相應(yīng)的標(biāo)簽語(yǔ)義特征進(jìn)行拼接處理,獲得綜合標(biāo)簽特征;
11、獲得單元,用于基于綜合標(biāo)簽特征和文本語(yǔ)義特征,獲得待識(shí)別對(duì)象的至少一個(gè)第二目標(biāo)標(biāo)簽;其中,第二目標(biāo)標(biāo)簽為第一目標(biāo)標(biāo)簽的子標(biāo)簽。
12、在一種可能的實(shí)現(xiàn)方式中,獲得單元具體用于:
13、對(duì)綜合標(biāo)簽特征和文本語(yǔ)義特征進(jìn)行融合處理,得到融合后的目標(biāo)融合語(yǔ)義特征;
14、基于目標(biāo)融合語(yǔ)義特征對(duì)待識(shí)別對(duì)象進(jìn)行分類處理,獲得待識(shí)別對(duì)象所屬的至少一個(gè)第二候選標(biāo)簽以及相應(yīng)的第二可信度;
15、從至少一個(gè)第二候選標(biāo)簽中,篩選出第二可信度符合篩選條件的,至少一個(gè)第二目標(biāo)標(biāo)簽。
16、在一種可能的實(shí)現(xiàn)方式中,獲得單元具體用于:
17、獲取用于特征融合的標(biāo)簽參數(shù)矩陣和文本參數(shù)矩陣;
18、基于標(biāo)簽參數(shù)矩陣對(duì)綜合標(biāo)簽特征進(jìn)行二階線性融合處理,得到二階融合標(biāo)簽特征;
19、基于文本參數(shù)矩陣對(duì)文本語(yǔ)義特征進(jìn)行二階線性融合處理,得到二階融合語(yǔ)義特征;
20、對(duì)二階融合標(biāo)簽特征和二階融合語(yǔ)義特征進(jìn)行融合處理,得到融合后的目標(biāo)融合語(yǔ)義特征。
21、在一種可能的實(shí)現(xiàn)方式中,獲取單元具體用于:
22、對(duì)文本信息進(jìn)行分詞處理,獲得相應(yīng)的至少一個(gè)文本分詞;
23、分別對(duì)至少一個(gè)文本分詞進(jìn)行特征提取,得到相應(yīng)的分詞語(yǔ)義特征,
24、對(duì)獲得的至少一個(gè)分詞語(yǔ)義特征進(jìn)行拼接處理,得到文本語(yǔ)義特征。
25、在一種可能的實(shí)現(xiàn)方式中,分類單元具體用于:
26、基于文本語(yǔ)義特征對(duì)待識(shí)別對(duì)象進(jìn)行分類處理,獲得待識(shí)別對(duì)象所屬的至少一個(gè)第一候選標(biāo)簽以及相應(yīng)的第一可信度;
27、從至少一個(gè)第一候選標(biāo)簽中,篩選出第一可信度符合可信度條件的至少一個(gè)第一目標(biāo)標(biāo)簽。
28、在一種可能的實(shí)現(xiàn)方式中,拼接單元具體用于:
29、采用至少一個(gè)第一可信度,分別對(duì)相應(yīng)的標(biāo)簽語(yǔ)義特征進(jìn)行加權(quán)處理,獲得至少一個(gè)加權(quán)標(biāo)簽特征;
30、將至少一個(gè)加權(quán)標(biāo)簽特征進(jìn)行串聯(lián)拼接處理,獲得綜合標(biāo)簽特征。
31、在一種可能的實(shí)現(xiàn)方式中,本技術(shù)實(shí)施例涉及的標(biāo)簽識(shí)別方法是通過(guò)標(biāo)簽識(shí)別模型執(zhí)行的;其中,標(biāo)簽識(shí)別裝置還包括訓(xùn)練單元,標(biāo)簽識(shí)別模型是訓(xùn)練單元通過(guò)如下方式訓(xùn)練獲得的:
32、根據(jù)樣本訓(xùn)練集,對(duì)待訓(xùn)練標(biāo)簽識(shí)別模型執(zhí)行循環(huán)迭代訓(xùn)練,獲得標(biāo)簽識(shí)別模型;在一次循環(huán)迭代中執(zhí)行如下操作:
33、從樣本訓(xùn)練集中選取訓(xùn)練樣本;其中,訓(xùn)練樣本為:包含第一標(biāo)注標(biāo)簽,以及第二標(biāo)注標(biāo)簽的歷史對(duì)象,第二標(biāo)注標(biāo)簽為第一標(biāo)注標(biāo)簽的子標(biāo)簽;
34、將訓(xùn)練樣本輸入待訓(xùn)練標(biāo)簽識(shí)別模型,預(yù)測(cè)歷史對(duì)象關(guān)聯(lián)的第一預(yù)測(cè)標(biāo)簽和第二預(yù)測(cè)標(biāo)簽;
35、基于第一預(yù)測(cè)標(biāo)簽與第二預(yù)測(cè)標(biāo)簽,構(gòu)建損失函數(shù),并采用損失函數(shù)對(duì)待訓(xùn)練標(biāo)簽識(shí)別模型進(jìn)行參數(shù)調(diào)整。
36、在一種可能的實(shí)現(xiàn)方式中,訓(xùn)練單元具體用于:
37、基于第一預(yù)測(cè)標(biāo)簽與第一標(biāo)注標(biāo)簽之間的主標(biāo)簽差異,確定第一損失函數(shù),基于第二預(yù)測(cè)標(biāo)簽與第二標(biāo)注標(biāo)簽之間的子標(biāo)簽差異,確定第二損失函數(shù),以及,基于第一預(yù)測(cè)標(biāo)簽與第二預(yù)測(cè)標(biāo)簽之間的關(guān)系差異,確定約束函數(shù);
38、基于第一損失函數(shù)、第二損失函數(shù)及約束函數(shù),構(gòu)建損失函數(shù);其中,約束函數(shù)用于保證,第二預(yù)測(cè)標(biāo)簽是第一預(yù)測(cè)標(biāo)簽的子標(biāo)簽。
39、在一種可能的實(shí)現(xiàn)方式中,待訓(xùn)練標(biāo)簽識(shí)別模型包括:第一分類層、融合層以及第二分類層;訓(xùn)練單元具體用于:
40、通過(guò)第一分類層,基于從歷史對(duì)象的歷史文本信息提取出的歷史文本語(yǔ)義特征,對(duì)歷史對(duì)象進(jìn)行分類處理,獲得至少一個(gè)第一預(yù)測(cè)標(biāo)簽;
41、對(duì)至少一個(gè)第一預(yù)測(cè)標(biāo)簽的歷史標(biāo)簽語(yǔ)義特征進(jìn)行拼接處理,獲得相應(yīng)的歷史綜合標(biāo)簽特征;
42、通過(guò)融合層,對(duì)歷史綜合標(biāo)簽特征和歷史文本語(yǔ)義特征進(jìn)行融合處理,得到融合后的歷史融合語(yǔ)義特征;
43、通過(guò)第二分類層,基于歷史融合語(yǔ)義特征對(duì)歷史對(duì)象進(jìn)行分類處理,獲得至少一個(gè)第二預(yù)測(cè)標(biāo)簽。
44、第三方面,本技術(shù)實(shí)施例提供一種計(jì)算設(shè)備,包括:存儲(chǔ)器和處理器,其中,存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)程序;處理器,用于執(zhí)行計(jì)算機(jī)程序以實(shí)現(xiàn)本技術(shù)實(shí)施例提供的標(biāo)簽識(shí)別方法的步驟。
45、第四方面,本技術(shù)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本技術(shù)實(shí)施例提供的標(biāo)簽識(shí)別方法的步驟。
46、第五方面,本技術(shù)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,其包括計(jì)算機(jī)程序,計(jì)算機(jī)程序存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中;當(dāng)計(jì)算設(shè)備的處理器從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取計(jì)算機(jī)程序時(shí),處理器執(zhí)行計(jì)算機(jī)程序,使得計(jì)算設(shè)備執(zhí)行本技術(shù)實(shí)施例提供的標(biāo)簽識(shí)別方法的步驟。
47、本技術(shù)有益效果如下:
48、本技術(shù)實(shí)施例提供一種標(biāo)簽識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),涉及文本處理、人工智能等技術(shù)領(lǐng)域;可應(yīng)用于云技術(shù)、人工智能、智慧交通、輔助駕駛、信息推薦等各種場(chǎng)景。
49、在本技術(shù)實(shí)施例中,針對(duì)待識(shí)別對(duì)象進(jìn)行標(biāo)簽識(shí)別時(shí),首先獲取待識(shí)別對(duì)象的文本信息,并提取出文本信息的文本語(yǔ)義特征;然后基于文本語(yǔ)義特征對(duì)待識(shí)別對(duì)象進(jìn)行分類處理,獲得待識(shí)別對(duì)象的至少一個(gè)第一目標(biāo)標(biāo)簽及相應(yīng)的第一可信息度,對(duì)于標(biāo)簽體系而言,層級(jí)越高,粒度越粗,識(shí)別難度更簡(jiǎn)短,同時(shí)標(biāo)簽識(shí)別準(zhǔn)確率比較高,即識(shí)別出的第一目標(biāo)標(biāo)簽的準(zhǔn)確率較高。
50、接著分別提取至少一個(gè)第一目標(biāo)標(biāo)簽的標(biāo)簽語(yǔ)義特征,并基于獲得的至少一個(gè)第一可信度,對(duì)相應(yīng)的標(biāo)簽語(yǔ)義特征進(jìn)行拼接處理,獲得綜合標(biāo)簽特征;最后基于綜合標(biāo)簽特征和文本語(yǔ)義特征,獲得待識(shí)別對(duì)象的至少一個(gè)第二目標(biāo)標(biāo)簽,第二目標(biāo)標(biāo)簽為第一目標(biāo)標(biāo)簽的子標(biāo)簽??梢姡诖_定第二目標(biāo)標(biāo)簽時(shí),將具有較高準(zhǔn)確性的上層標(biāo)簽識(shí)別結(jié)果作為先驗(yàn)知識(shí),與文本語(yǔ)義特征共同作為下層標(biāo)簽識(shí)別過(guò)程的輸入,在下層標(biāo)簽識(shí)別過(guò)程中融合更多的參考信息,且充分利用了標(biāo)簽層級(jí)關(guān)系,從而增強(qiáng)了識(shí)別效果,提高待識(shí)別對(duì)象標(biāo)簽識(shí)別的準(zhǔn)確率。