最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種生物信息工程師技能評級系統(tǒng)的制作方法

文檔序號:11143761閱讀:389來源:國知局
一種生物信息工程師技能評級系統(tǒng)的制造方法與工藝

本發(fā)明涉及計(jì)算機(jī)生物信息領(lǐng)域,具體地,涉及一種生物信息工程師技能評級系統(tǒng)。



背景技術(shù):

生物信息學(xué)是生命科學(xué)和計(jì)算機(jī)科學(xué)相結(jié)合的一門新學(xué)科,是以計(jì)算機(jī)為工具對生物信息進(jìn)行儲存、檢索和分析的學(xué)科。當(dāng)前從事生物信息分析的工程師,涉及到的技能包括生物學(xué)、計(jì)算機(jī)、數(shù)學(xué)、物理、信息科學(xué)等多個(gè)學(xué)科,工程師在進(jìn)行生物學(xué)研究時(shí),實(shí)驗(yàn)下游的數(shù)據(jù)分析部分需要借助計(jì)算機(jī)編程、數(shù)學(xué)統(tǒng)計(jì)、現(xiàn)有軟件等手段來得到實(shí)驗(yàn)結(jié)論。生物信息工程師需要進(jìn)行分析思路的設(shè)計(jì)、實(shí)現(xiàn)等,數(shù)據(jù)大多來源于DNA測序儀,以及其他設(shè)備。

目前,平臺或者用戶都急需對生物信息工程師進(jìn)行合理的評級,以便滿足各方的需求,而不同的生物信息工程師由于自身原因具有不同的工作能力,而現(xiàn)有技術(shù)中沒有對生物信息工程師評級的合理方法和系統(tǒng),倚靠人工進(jìn)行評級效率較低,且由于數(shù)據(jù)資源有限,評級的準(zhǔn)確性和可靠性較差,參考價(jià)值較低。沒有一個(gè)成熟、準(zhǔn)確、專門針對生物信息分析工程師的技能評級方法。

綜上所述,本申請發(fā)明人在實(shí)現(xiàn)本申請發(fā)明技術(shù)方案的過程中,發(fā)現(xiàn)上述技術(shù)至少存在如下技術(shù)問題:

在現(xiàn)有技術(shù)中,現(xiàn)有的生物信息分析工程師的技能評級方法存在效率、準(zhǔn)確率和可靠性較差的技術(shù)問題。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明提供了一種生物信息工程師技能評級系統(tǒng),解決了現(xiàn)有的生物信息分析工程師的技能評級方法存在效率、準(zhǔn)確率和可靠性較差的技術(shù)問題,實(shí)現(xiàn)了系統(tǒng)設(shè)計(jì)合理,準(zhǔn)確、高效、可靠的對生物信息工程師技能進(jìn)行評級的技術(shù)效果。

為解決上述技術(shù)問題,本申請?zhí)峁┝艘环N生物信息工程師技能評級系統(tǒng),所述系統(tǒng)包括:

生物信息分析類型數(shù)據(jù)庫,生物信息分析類型數(shù)據(jù)庫中包括:生物信息分析類型數(shù)據(jù)以及每種生物信息分析類型的難度系數(shù)數(shù)據(jù);

生物信息期刊數(shù)據(jù)庫,生物信息期刊數(shù)據(jù)庫中包括:期刊的基本信息、每年各期刊的影響因子、每年各期刊的特征因子;

收集單元,所述收集單元用于收集生物信息工程師的基本信息和用戶項(xiàng)目評價(jià)登記信息;

建立單元,所述建立單元用于將收集單元收集的信息作為訓(xùn)練樣本,基于生物信息分析類型數(shù)據(jù)庫和生物信息期刊數(shù)據(jù)庫建立分類器;

評級單元,所述評級單元用于基于建立的分類器,對生物信息工程師技能進(jìn)行評級。

進(jìn)一步的,所述生物信息分析類型數(shù)據(jù)庫的建立具體包括:

首先,分別建立DNA、RNA、環(huán)境微生物、蛋白質(zhì)組學(xué)、代謝組學(xué)、基因6大類數(shù)據(jù)庫,并建立小類生物信息分析類型數(shù)據(jù)庫(如DNA大類下包括動植物de novo測序、微生物de novo測序、人全基因組重測序、動植物全基因組重測序、目標(biāo)區(qū)域測序、全外顯子組測序、ChIP-seq、簡化基因組-RAD等),標(biāo)記每種分析類型的分析方法、分析內(nèi)容、模板信息;

然后,對于不同種類的分析類型,收集該類型相關(guān)項(xiàng)目作為樣本,根據(jù)行業(yè)經(jīng)驗(yàn)對樣本進(jìn)行評估,獲得每種生物信息分析類型的難度系數(shù);

然后,統(tǒng)計(jì)出每種分析類型的難度系數(shù)。

其中,通過對生物信息分析類型進(jìn)行合理的劃分,能夠建立準(zhǔn)確全面的生物信息分析類型數(shù)據(jù)庫,進(jìn)而能夠準(zhǔn)確的將生物信息工程師對應(yīng)到相應(yīng)的學(xué)科和領(lǐng)域,劃分更加細(xì)致準(zhǔn)確,對生物信息工程師的評級更加準(zhǔn)確。

進(jìn)一步的,所述生物信息期刊數(shù)據(jù)庫的建立具體為:收集SCI、JCR信息,建立生物信息期刊數(shù)據(jù)庫。

其中,美國《科學(xué)引文索引》(Science Citation Index,簡稱SCI)于1957年由美國科學(xué)信息研究所(Institute for Scientific Information,簡稱ISI)在美國費(fèi)城創(chuàng)辦,是由美國科學(xué)信息研究所(ISI)1961年創(chuàng)辦出版的引文數(shù)據(jù)庫,是國際公認(rèn)的進(jìn)行科學(xué)統(tǒng)計(jì)與科學(xué)評價(jià)的主要檢索工具,ISI每年出版JCR(《期刊引用報(bào)告》,全稱Journal Citation Reports)。JCR對包括SCI收錄的3800種核心期刊(光盤版)在內(nèi)的8000多種期刊(網(wǎng)絡(luò)版)之間的引用和被引用數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、運(yùn)算,并針對每種期刊定義了影響因子(Impact Factor)等指數(shù)加以報(bào)道。通過收集SCI、JCR信息,可以建立數(shù)據(jù)全面準(zhǔn)確的生物信息期刊數(shù)據(jù)庫,而利用數(shù)據(jù)全面準(zhǔn)確的生物信息期刊數(shù)據(jù)庫可以對生物信息工程師的論文期刊發(fā)表情況進(jìn)行評價(jià),進(jìn)而對生物信息工程師的技能評級提供準(zhǔn)確的參考因素。

進(jìn)一步的,所述基于生物信息分析類型數(shù)據(jù)庫和生物信息期刊數(shù)據(jù)庫建立分類器,具體包括:

步驟1:對每位生物信息分析工程師,分別計(jì)算學(xué)歷、工作年限、項(xiàng)目經(jīng)驗(yàn)、發(fā)表論文信息、用戶評價(jià)五個(gè)方面的得分;

步驟2:計(jì)算對應(yīng)每種工程師級別下學(xué)歷、工作年限、項(xiàng)目經(jīng)驗(yàn)、發(fā)表論文、用戶評價(jià)五個(gè)屬性的頻率;

步驟3:根據(jù)樸素貝葉斯分類算法,建立分類器。

其中,分類是數(shù)據(jù)挖掘的一種非常重要的方法。分類的概念是在已有數(shù)據(jù)的基礎(chǔ)上學(xué)會一個(gè)分類函數(shù)或構(gòu)造出一個(gè)分類模型(即我們通常所說的分類器(Classifier))。該函數(shù)或模型能夠把數(shù)據(jù)庫中的數(shù)據(jù)紀(jì)錄映射到給定類別中的某一個(gè),從而可以應(yīng)用于數(shù)據(jù)預(yù)測。總之,分類器是數(shù)據(jù)挖掘中對樣本進(jìn)行分類的方法的統(tǒng)稱,包含決策樹、邏輯回歸、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)等算法。本申請中建立分類器,可以良好的實(shí)現(xiàn)從生物信息分析類型數(shù)據(jù)庫和生物信息期刊數(shù)據(jù)庫以及生物信息工程師的基本信息和用戶項(xiàng)目評價(jià)登記信息中實(shí)現(xiàn)數(shù)據(jù)挖掘。

進(jìn)一步的,所述步驟1具體包括:

首先,對學(xué)歷建立HASH函數(shù)并映射到數(shù)值集合A作為學(xué)歷得分;

然后,對工作年限建立HASH函數(shù)并映射到數(shù)值集合B作為工作年限得分;

然后,對每個(gè)項(xiàng)目經(jīng)驗(yàn),查找生物信息分析類型數(shù)據(jù)庫,得到單個(gè)項(xiàng)目經(jīng)驗(yàn)的難度系數(shù),對每個(gè)工程師所有項(xiàng)目的難度系數(shù)采用統(tǒng)計(jì)方法計(jì)算,并映射到數(shù)值集合C作為項(xiàng)目經(jīng)驗(yàn)得分;

然后,對每篇發(fā)表論文,查找生物信息期刊數(shù)據(jù)庫,得到每篇發(fā)表論文當(dāng)年的影響因子,對每個(gè)工程師所有論文的影響因子采用統(tǒng)計(jì)方法計(jì)算,并映射到數(shù)值集合D作為發(fā)表論文得分;

然后,對每個(gè)項(xiàng)目的用戶評價(jià)等級采用統(tǒng)計(jì)方法計(jì)算,并映射到數(shù)值集合E作為用戶評價(jià)得分。

其中,通過上述方式,能夠?qū)γ课簧镄畔⒎治龉こ處煹母鞣矫娣謩e進(jìn)行分值評價(jià),能夠便于獲得準(zhǔn)確的工程師實(shí)際能力準(zhǔn)確對應(yīng)的分?jǐn)?shù)值,分別計(jì)算了學(xué)歷、工作年限、項(xiàng)目經(jīng)驗(yàn)、發(fā)表論文信息、用戶評價(jià)五個(gè)方面的得分;全面的考慮了工程師的教育、工作、項(xiàng)目經(jīng)驗(yàn)、論文信息等,因此,獲得的相應(yīng)整體得分能夠準(zhǔn)確的反應(yīng)工程師的相應(yīng)能力,作為評級的準(zhǔn)確參考因素。

進(jìn)一步的,所述系統(tǒng)還包括:校正單元,所述校正單元用于對評定結(jié)果進(jìn)行判斷,對于錯(cuò)誤分類校正后加入到訓(xùn)練樣本集,完善分類器。

本申請?zhí)峁┑囊粋€(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):

本申請中的生物信息工程師技能評級系統(tǒng)中建立有生物信息分析類型數(shù)據(jù)庫和生物信息期刊數(shù)據(jù)庫,利用生物信息分析類型數(shù)據(jù)庫可以準(zhǔn)確的對生物信息分析類型進(jìn)行類型劃分,便于將生物信息工程師劃分到相應(yīng)的擅長的準(zhǔn)確領(lǐng)域或科目,并且利用生物信息期刊數(shù)據(jù)庫可以獲得生物信息工程師在期刊上發(fā)布的論文信息,論文信息可以作為評價(jià)生物信息工程師技能等級的參考因素,然后,利用收集單元收集生物信息工程師的基本信息和用戶項(xiàng)目評價(jià)登記信息,進(jìn)一步的將這些信息作為生物信息工程師技能等級評價(jià)的參考因素;進(jìn)一步的,利用收集的信息作為訓(xùn)練樣本,基于生物信息分析類型數(shù)據(jù)庫和生物信息期刊數(shù)據(jù)庫建立分類器,基于建立的分類器,對生物信息工程師技能進(jìn)行評級,由于實(shí)現(xiàn)的系統(tǒng)自動評級,相對于傳統(tǒng)的人工評級效率較高,并且采用了多種全面的生物信息工程師數(shù)據(jù),并結(jié)合并結(jié)合合理的運(yùn)算,能夠更加準(zhǔn)確的計(jì)算出可靠的結(jié)果,使得評級結(jié)果更加準(zhǔn)確和可靠,所以,有效解決了現(xiàn)有的生物信息分析工程師的技能評級方法存在效率、準(zhǔn)確率和可靠性較差的技術(shù)問題,進(jìn)而實(shí)現(xiàn)了系統(tǒng)設(shè)計(jì)合理,準(zhǔn)確、高效、可靠的對生物信息工程師技能進(jìn)行評級的技術(shù)效果。

附圖說明

此處所說明的附圖用來提供對本發(fā)明實(shí)施例的進(jìn)一步理解,構(gòu)成本申請的一部分,并不構(gòu)成對本發(fā)明實(shí)施例的限定;

圖1是本申請中生物信息工程師技能評級系統(tǒng)的組成示意圖。

具體實(shí)施方式

本發(fā)明提供了一種生物信息工程師技能評級系統(tǒng),解決了現(xiàn)有的生物信息分析工程師的技能評級方法存在效率、準(zhǔn)確率和可靠性較差的技術(shù)問題,實(shí)現(xiàn)了系統(tǒng)設(shè)計(jì)合理,準(zhǔn)確、高效、可靠的對生物信息工程師技能進(jìn)行評級的技術(shù)效果。

為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點(diǎn),下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)描述。需要說明的是,在相互不沖突的情況下,本申請的實(shí)施例及實(shí)施例中的特征可以相互組合。

在下面的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述范圍內(nèi)的其他方式來實(shí)施,因此,本發(fā)明的保護(hù)范圍并不受下面公開的具體實(shí)施例的限制。

實(shí)施例一:

在實(shí)施例一中,請參考圖1,提供了一種生物信息工程師技能評級系統(tǒng),所述系統(tǒng)包括:

生物信息分析類型數(shù)據(jù)庫,生物信息分析類型數(shù)據(jù)庫中包括:生物信息分析類型數(shù)據(jù)以及每種生物信息分析類型的難度系數(shù)數(shù)據(jù);

生物信息期刊數(shù)據(jù)庫,生物信息期刊數(shù)據(jù)庫中包括:期刊的基本信息、每年各期刊的影響因子、每年各期刊的特征因子;

收集單元,所述收集單元用于收集生物信息工程師的基本信息和用戶項(xiàng)目評價(jià)登記信息;

建立單元,所述建立單元用于將收集單元收集的信息作為訓(xùn)練樣本,基于生物信息分析類型數(shù)據(jù)庫和生物信息期刊數(shù)據(jù)庫建立分類器;

評級單元,所述評級單元用于基于建立的分類器,對生物信息工程師技能進(jìn)行評級。

鑒于國內(nèi)外還沒有對生物信息分析工程師進(jìn)行評級的計(jì)算機(jī)系統(tǒng),本發(fā)明的目的是提供一種動態(tài)評級的方式,在少量人工的輔助下,對生物信息分析工程師專業(yè)技能水平進(jìn)行評級。

工程師級別分為:實(shí)習(xí)、初級、中級、高級、專家、泰斗。

具體評級步驟如下:

步驟1:收集并建立生物信息分析類型數(shù)據(jù)庫;

(1)分層級建立生物信息分析類型數(shù)據(jù)庫,建立DNA、RNA、環(huán)境微生物、蛋白質(zhì)組學(xué)、代謝組學(xué)、基因數(shù)據(jù)庫6大類、200多小類的生物信息分析類型數(shù)據(jù)庫,標(biāo)記每種分析類型的分析方法、分析內(nèi)容、模板等信息;

(2)對每一種分析類型,收集該類型的多個(gè)項(xiàng)目作為樣本,指定不同專業(yè)人員對樣本進(jìn)行評估,得到每種生物信息分析類型的難度系數(shù);

(3)對于包括多個(gè)分析類型的項(xiàng)目,指定不同專業(yè)人員對樣本進(jìn)行評估,得到每種生物信息分析類型的難度系數(shù);

(4)通過數(shù)理統(tǒng)計(jì)方法統(tǒng)計(jì)出每種分析類型的難度系數(shù)(當(dāng)前采用幾何平均值作為該類型的難度系數(shù))。

步驟2:收集近10年SCI、JCR資料,建立生物信息期刊數(shù)據(jù)庫,記錄每種期刊的基本信息和每年的影響因子和特征因子;

步驟3:收集多位生物信息分析工程師(實(shí)習(xí)、初級、中級、高級、專家、泰斗)的學(xué)歷、工作年限、項(xiàng)目經(jīng)驗(yàn)、發(fā)表論文和用戶項(xiàng)目評價(jià)登記信息作為訓(xùn)練樣本,通過數(shù)理統(tǒng)計(jì)方法建立分類器(當(dāng)前采用樸素貝葉斯分類算法);

(1)對每位生物信息分析工程師計(jì)算學(xué)歷、工作年限、項(xiàng)目經(jīng)驗(yàn)、發(fā)表論文和用戶評價(jià)五個(gè)方面的得分(離散數(shù)值);

(a)對學(xué)歷建立HASH函數(shù)并映射到【1,2,3,4,5】作為學(xué)歷得分;

(b)對工作年限建立HASH函數(shù)(分段函數(shù))并映射到【1,2,3,4,5】作為工作年限得分;

(c)對每個(gè)項(xiàng)目經(jīng)驗(yàn),查找生物信息分析類型數(shù)據(jù)庫,得到單個(gè)項(xiàng)目經(jīng)驗(yàn)的難度系統(tǒng),對所有項(xiàng)目的難度系數(shù)采用統(tǒng)計(jì)方法(當(dāng)前采用移動加權(quán)平均法)計(jì)算,并映射到【1,2,3,4,5,6,7,8,9,10】作為項(xiàng)目經(jīng)驗(yàn)得分;

(d)對每篇發(fā)表論文,查找生物信息期刊數(shù)據(jù)庫,得到每篇發(fā)表論文當(dāng)年的影響因子,對所有論文的影響因子采用統(tǒng)計(jì)方法(當(dāng)前采用移動加權(quán)平均法)計(jì)算,并映射到【1,2,3,4,5,6,7,8,9,10】作為發(fā)表論文得分;

(e)對每個(gè)項(xiàng)目的用戶評價(jià)等級采用統(tǒng)計(jì)方法(當(dāng)前采用移動加權(quán)平均法)計(jì)算,并映射到【1,2,3,4,5】作為用戶評價(jià)得分。

(2)計(jì)算對應(yīng)每種工程師級別(實(shí)習(xí)、初級、中級、高級、專家、泰斗)下學(xué)歷、工作年限、項(xiàng)目經(jīng)驗(yàn)、發(fā)表論文、用戶評價(jià)五個(gè)屬性的頻率;

(3)建立分類器(根據(jù)樸素貝葉斯分類算法)

步驟4:對每一位工程師,收集該工程師的學(xué)歷、工作年限、項(xiàng)目經(jīng)驗(yàn)、發(fā)表論文和用戶評價(jià)等級信息,使用分類器對該工程師的專業(yè)技能水平進(jìn)行評級

步驟5:人工對評定結(jié)果進(jìn)行判斷,對于錯(cuò)誤分類人工矯正后加入到訓(xùn)練樣本集,再次完善分類器;

步驟6:不斷收集訓(xùn)練樣本,訓(xùn)練完善分類器。

下面,舉例對本申請進(jìn)行介紹:首先根據(jù)事先收集的多個(gè)工程師詳細(xì)信息作為樣本進(jìn)行訓(xùn)練,按照具體評級步驟中的說明建立分類器。之后對一個(gè)工程師根據(jù)其學(xué)歷、工作年限、項(xiàng)目經(jīng)驗(yàn)、發(fā)表論文、用戶評價(jià)五個(gè)屬性值,按照分類器代入后就可以鑒別工程師級別(實(shí)習(xí)、初級、中級、高級、專家、泰斗)。

上述本申請實(shí)施例中的技術(shù)方案,至少具有如下的技術(shù)效果或優(yōu)點(diǎn):

本申請中的生物信息工程師技能評級系統(tǒng)中建立有生物信息分析類型數(shù)據(jù)庫和生物信息期刊數(shù)據(jù)庫,利用生物信息分析類型數(shù)據(jù)庫可以準(zhǔn)確的對生物信息分析類型進(jìn)行類型劃分,便于將生物信息工程師劃分到相應(yīng)的擅長的準(zhǔn)確領(lǐng)域或科目,并且利用生物信息期刊數(shù)據(jù)庫可以獲得生物信息工程師在期刊上發(fā)布的論文信息,論文信息可以作為評價(jià)生物信息工程師技能等級的參考因素,然后,利用收集單元收集生物信息工程師的基本信息和用戶項(xiàng)目評價(jià)登記信息,進(jìn)一步的將這些信息作為生物信息工程師技能等級評價(jià)的參考因素;進(jìn)一步的,利用收集的信息作為訓(xùn)練樣本,基于生物信息分析類型數(shù)據(jù)庫和生物信息期刊數(shù)據(jù)庫建立分類器,基于建立的分類器,對生物信息工程師技能進(jìn)行評級,由于實(shí)現(xiàn)的系統(tǒng)自動評級,相對于傳統(tǒng)的人工評級效率較高,并且采用了多種全面的生物信息工程師數(shù)據(jù),并結(jié)合并結(jié)合合理的運(yùn)算,能夠更加準(zhǔn)確的計(jì)算出可靠的結(jié)果,使得評級結(jié)果更加準(zhǔn)確和可靠,所以,有效解決了現(xiàn)有的生物信息分析工程師的技能評級方法存在效率、準(zhǔn)確率和可靠性較差的技術(shù)問題,進(jìn)而實(shí)現(xiàn)了系統(tǒng)設(shè)計(jì)合理,準(zhǔn)確、高效、可靠的對生物信息工程師技能進(jìn)行評級的技術(shù)效果。

盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。

顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1