本發(fā)明專利技術(shù)公開(kāi)了一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法及系統(tǒng),方法包括:收集智能科創(chuàng)項(xiàng)目多種來(lái)源的專業(yè)語(yǔ)料;構(gòu)建知識(shí)圖譜構(gòu)建模塊包括術(shù)語(yǔ)庫(kù)構(gòu)建模塊、術(shù)語(yǔ)聚類模塊和關(guān)系構(gòu)建模塊;以專業(yè)語(yǔ)料為核心,構(gòu)建專業(yè)詞庫(kù);將專業(yè)詞庫(kù)分割成以專業(yè)術(shù)語(yǔ)為中心的多個(gè)聚類;以聚類中的詞匯為節(jié)點(diǎn),構(gòu)建知識(shí)圖譜;構(gòu)建智能評(píng)估模塊包括智能評(píng)分模塊和智能評(píng)價(jià)模塊,輸出AI評(píng)語(yǔ)。本發(fā)明專利技術(shù)通過(guò)自然語(yǔ)言處理技術(shù)對(duì)項(xiàng)目計(jì)劃書進(jìn)行自動(dòng)化處理,大幅提升了審核效率;結(jié)合知識(shí)圖譜技術(shù),系統(tǒng)構(gòu)建專業(yè)化的知識(shí)庫(kù),為大語(yǔ)言模型提供背景知識(shí)支持,確保評(píng)估結(jié)果的專業(yè)性和一致性。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于自然語(yǔ)言處理領(lǐng)域,尤其涉及一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法及系統(tǒng)。
技術(shù)介紹
1、隨著社會(huì)對(duì)科技創(chuàng)新的大力支持和人工智能領(lǐng)域的飛速發(fā)展,創(chuàng)新創(chuàng)業(yè)類競(jìng)賽作為激發(fā)創(chuàng)新活力的重要平臺(tái),其項(xiàng)目評(píng)判審核機(jī)制的重要性日益凸顯。完善企業(yè)創(chuàng)新服務(wù)體系、深化創(chuàng)新創(chuàng)業(yè)機(jī)構(gòu)具有重要意義。
2、在此背景下,如何精準(zhǔn)且高效地挖掘項(xiàng)目的潛在市場(chǎng)與深層價(jià)值,成為各類創(chuàng)新創(chuàng)業(yè)競(jìng)賽亟待解決的關(guān)鍵問(wèn)題。項(xiàng)目計(jì)劃書作為項(xiàng)目核心價(jià)值和目標(biāo)的載體,不僅能夠幫助創(chuàng)新創(chuàng)業(yè)者在書寫過(guò)程中更加準(zhǔn)確地定位項(xiàng)目在市場(chǎng)中的位置和競(jìng)爭(zhēng)優(yōu)勢(shì),還能讓評(píng)審專家直觀了解項(xiàng)目的成熟度、可行性及未來(lái)潛力,為創(chuàng)新創(chuàng)業(yè)項(xiàng)目的價(jià)值評(píng)估提供了重要依據(jù)。
3、然而,傳統(tǒng)的人工評(píng)審模式存在主觀判斷差異大、評(píng)審成本高、效率低下等問(wèn)題,難以快速響應(yīng)日益增長(zhǎng)的創(chuàng)新創(chuàng)業(yè)需求。加之科技創(chuàng)新項(xiàng)目本身高風(fēng)險(xiǎn)、高投入的特點(diǎn)和科學(xué)指導(dǎo)資源的相對(duì)稀缺,參賽者面臨難以充分釋放創(chuàng)新潛能的困境,影響了創(chuàng)新成果的孵化和轉(zhuǎn)化。因此,探索更為高效公正的審核機(jī)制、加強(qiáng)對(duì)創(chuàng)新創(chuàng)業(yè)者的精準(zhǔn)支持和專業(yè)指導(dǎo),已成為破解當(dāng)前困境、推動(dòng)創(chuàng)新生態(tài)健康發(fā)展的迫切需求。
技術(shù)實(shí)現(xiàn)思路
1、專利技術(shù)目的:本專利技術(shù)的目的在于提供一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法及系統(tǒng)。旨在提升項(xiàng)目書審核效率,降低人為因素干擾,同時(shí)為創(chuàng)新創(chuàng)業(yè)者提供更加科學(xué)、客觀的評(píng)估支持。
2、技術(shù)方案:本專利技術(shù)的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,包括如下步驟:
3、步驟1、收集智能科創(chuàng)項(xiàng)目多種來(lái)源的專業(yè)語(yǔ)料;
4、步驟2、構(gòu)建知識(shí)圖譜構(gòu)建模塊包括術(shù)語(yǔ)庫(kù)構(gòu)建模塊、術(shù)語(yǔ)聚類模塊和關(guān)系構(gòu)建模塊;通過(guò)術(shù)語(yǔ)庫(kù)構(gòu)建模塊,以步驟1專業(yè)語(yǔ)料為核心,構(gòu)建專業(yè)詞庫(kù);通過(guò)術(shù)語(yǔ)聚類模塊將專業(yè)詞庫(kù)分割成以專業(yè)術(shù)語(yǔ)為中心的多個(gè)聚類;通過(guò)關(guān)系構(gòu)建模塊以聚類中的詞匯為節(jié)點(diǎn),構(gòu)建知識(shí)圖譜;
5、步驟3、構(gòu)建智能評(píng)估模塊包括智能評(píng)分模塊和智能評(píng)價(jià)模塊;通過(guò)智能評(píng)分模塊結(jié)合步驟2的知識(shí)圖譜和外部知識(shí)庫(kù)對(duì)知識(shí)圖譜進(jìn)行增強(qiáng)和融合預(yù)測(cè);采用動(dòng)態(tài)融合策略計(jì)算每個(gè)類別的評(píng)分,得到評(píng)分結(jié)果;通過(guò)智能評(píng)價(jià)模塊根據(jù)評(píng)分結(jié)果和知識(shí)圖譜的關(guān)鍵特征,得到評(píng)語(yǔ)集合并進(jìn)行優(yōu)化,輸出ai評(píng)語(yǔ);
6、步驟4、通過(guò)專家評(píng)估模塊,對(duì)ai評(píng)語(yǔ)進(jìn)一步分析,得到最終評(píng)價(jià)結(jié)果。
7、進(jìn)一步的,步驟1具體為:所述智能科創(chuàng)項(xiàng)目多種來(lái)源的專業(yè)語(yǔ)料包括學(xué)術(shù)論文、行業(yè)報(bào)告、技術(shù)文檔和專利。
8、進(jìn)一步的,步驟2具體包括如下步驟:
9、步驟2.1、所述術(shù)語(yǔ)庫(kù)構(gòu)建模塊用于以信息收集模塊收集的專業(yè)語(yǔ)料為核心,構(gòu)建專業(yè)詞庫(kù);設(shè)定文檔集合為d={d1,d2,…,dm},每份文檔di中的詞匯集合為ti={t1,t2,…,tn},對(duì)每個(gè)詞匯tj∈ti,計(jì)算其在文檔集合d中的tf-idf值,設(shè)定閾值θ,提取術(shù)語(yǔ)集合c:
10、c={ti∈ti∣tf-idf(ti,d)>θ};
11、步驟2.2、所述術(shù)語(yǔ)聚類模塊用于將詞匯集合ti分割成以專業(yè)術(shù)語(yǔ)為中心的多個(gè)聚類,通過(guò)glove模型將詞匯集合ti轉(zhuǎn)換為高維向量集合其中每個(gè)對(duì)應(yīng)于ti中的詞匯tj,以術(shù)語(yǔ)集合中的詞匯為聚類中心,計(jì)算每個(gè)詞匯向量與每個(gè)術(shù)語(yǔ)向量之間的距離并將其歸類到距離最近的聚類中心對(duì)應(yīng)的聚類ck中:
12、
13、其中,cluster(tj)表示詞匯tj所屬的聚類,聚類包含與術(shù)語(yǔ)相似的詞匯集合,nk表示第k個(gè)聚類中的術(shù)語(yǔ)數(shù)量;
14、步驟2.3、所述關(guān)系構(gòu)建模塊用于以聚類中的詞匯為節(jié)點(diǎn),構(gòu)建知識(shí)圖譜。
15、進(jìn)一步的,步驟2.3具體包括如下步驟:
16、步驟2.3.1、對(duì)包含tki的每個(gè)句子進(jìn)行依存句法分析,記錄每個(gè)詞匯與其上下文的關(guān)系集r={r1,r2,…,rm},將包含tki的每個(gè)句子輸入bert模型,獲取tki的動(dòng)態(tài)上下文向量
17、步驟2.3.2、將聚類中心作為中心結(jié)點(diǎn)對(duì)于關(guān)系集r中的每一個(gè)關(guān)系rj,識(shí)別與tki相關(guān)的詞匯wj,并將這些詞匯作為相應(yīng)的節(jié)點(diǎn)vj=vj添加到圖中,在中心節(jié)點(diǎn)vi與相關(guān)節(jié)點(diǎn)vj之間建立有向邊,邊的標(biāo)簽為關(guān)系rj,表示邊之間的語(yǔ)義關(guān)系;
18、步驟2.3.3、對(duì)于每個(gè)相關(guān)詞匯wj,若其具有動(dòng)態(tài)上下文向量則將wj作為新的中心節(jié)點(diǎn),重復(fù)上述步驟,進(jìn)一步解析其上下文關(guān)系,形成多層次的知識(shí)圖譜結(jié)構(gòu);將所有中心節(jié)點(diǎn)及其相關(guān)節(jié)點(diǎn)按照關(guān)系連接起來(lái),最終組織成知識(shí)圖譜g。
19、進(jìn)一步的,步驟3具體包括如下步驟:
20、步驟3.1、所述智能評(píng)分模塊包括:知識(shí)圖譜增強(qiáng)模塊和融合預(yù)測(cè)模塊,用于接收用戶提交的項(xiàng)目書文本,通過(guò)抽取的項(xiàng)目書詞匯集合w={w1,w2,…,wn},結(jié)合特征向量和動(dòng)態(tài)融合策略,計(jì)算項(xiàng)目書的智能評(píng)分s;
21、步驟3.2、通過(guò)知識(shí)圖譜增強(qiáng)模塊結(jié)合內(nèi)部知識(shí)圖譜g和外部知識(shí)庫(kù)wikidata,生成詞匯集合w的特征向量,并利用輸入的項(xiàng)目書文本對(duì)知識(shí)圖譜g進(jìn)行補(bǔ)充,對(duì)于詞匯集合w中的每個(gè)詞,從知識(shí)圖譜g中查詢對(duì)應(yīng)的節(jié)點(diǎn)nw,若節(jié)點(diǎn)nw存在,則獲取相鄰節(jié)點(diǎn)集合nadj(w)={n1,n2,…,nk};
22、對(duì)于每個(gè)相鄰節(jié)點(diǎn)ni∈nadj(w),如果ni在詞匯集合w中存在匹配,則計(jì)算其權(quán)重wi:
23、
24、其中,d(v(ni),v(nw))表示節(jié)點(diǎn)ni和節(jié)點(diǎn)nw的特征向量之間的距離,dmin和dmax分別為距離的最小值和最大值,用于歸一化處理;
25、對(duì)于每個(gè)詞匯wi,更新其特征向量vrel(w):
26、
27、其中,nmatch表示詞匯集合w中存在匹配的相鄰節(jié)點(diǎn)集合;
28、步驟3.3、通過(guò)融合預(yù)測(cè)模塊將知識(shí)圖譜生成的特征信息融入評(píng)分預(yù)測(cè),得到最終評(píng)分;將詞匯集合w輸入預(yù)訓(xùn)練的fasttext模型中,獲取模型預(yù)測(cè)向量其中,pi表示文本屬于類別i的概率,根據(jù)預(yù)測(cè)概率pi是否超過(guò)閾值γ,累加基礎(chǔ)分?jǐn)?shù)first_score:
29、
30、其中,為指示函數(shù),當(dāng)條件為真時(shí)取值1,否則取值0;
31、步驟3.4、通過(guò)計(jì)算知識(shí)圖譜增強(qiáng)模塊生成的節(jié)點(diǎn)集合nmatch間的相似度得到額外分?jǐn)?shù)additional_score;結(jié)合知識(shí)圖譜生成的特征向量采用動(dòng)態(tài)融合策略計(jì)算每個(gè)類別的評(píng)分si:
32、si=α·pi+β·vi,
33、其中,α為fasttext模型預(yù)測(cè)向量pi的權(quán)重系數(shù),表示fasttext的初次預(yù)測(cè)結(jié)果對(duì)最終評(píng)分的貢獻(xiàn)度,β為知識(shí)圖譜特征向量vi的權(quán)重系數(shù),表示知識(shí)圖譜生成的特征信息對(duì)最終評(píng)分的貢獻(xiàn)度,si為融合后的評(píng)分向量;
34、將評(píng)分向量輸入fasttext模型進(jìn)行預(yù)測(cè),生成概率分布p=[p1,p2,…,pc],結(jié)合賽事評(píng)分標(biāo)準(zhǔn),設(shè)置理想分布d=[d1,d2,…,dc],其中di代表第i類的理想得分比例,通過(guò)計(jì)算p與理想分布d間的偏差,得到第本文檔來(lái)自技高網(wǎng)
...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟1具體為:所述智能科創(chuàng)項(xiàng)目多種來(lái)源的專業(yè)語(yǔ)料包括學(xué)術(shù)論文、行業(yè)報(bào)告、技術(shù)文檔和專利。
3.根據(jù)權(quán)利要求1所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟2具體包括如下步驟:
4.根據(jù)權(quán)利要求3所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟2.3具體包括如下步驟:
5.根據(jù)權(quán)利要求1所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟3具體包括如下步驟:
6.根據(jù)權(quán)利要求5所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟3.5中,所述關(guān)鍵特征包括文本中的關(guān)鍵詞、實(shí)體、與評(píng)分標(biāo)準(zhǔn)相關(guān)的屬性。
7.根據(jù)權(quán)利要求1所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟4具體為:將用戶提供的關(guān)鍵詞輸入預(yù)訓(xùn)練的GPT大語(yǔ)言模型,通過(guò)語(yǔ)義分析精準(zhǔn)檢索相關(guān)的歷史項(xiàng)目計(jì)劃書數(shù)據(jù),整合生成科創(chuàng)項(xiàng)目原型文本;將智能評(píng)估模塊標(biāo)注過(guò)的項(xiàng)目計(jì)劃書提供給專家進(jìn)行下載和查看,基于系統(tǒng)生成的評(píng)分和評(píng)語(yǔ),對(duì)項(xiàng)目進(jìn)行分析和評(píng)估。
8.一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)系統(tǒng),用于實(shí)現(xiàn)如權(quán)利要求1-7任意一項(xiàng)所述的方法,其特征在于,所述評(píng)價(jià)系統(tǒng)包括數(shù)據(jù)庫(kù)模塊、信息收集模塊、知識(shí)圖譜構(gòu)建模塊、智能評(píng)估模塊、科創(chuàng)項(xiàng)目原型生成模塊、專家評(píng)估模塊;
9.一種計(jì)算機(jī)裝置,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序以實(shí)現(xiàn)權(quán)利要求1所述方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序/指令,其特征在于,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1所述方法的步驟。
...
【技術(shù)特征摘要】
1.一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟1具體為:所述智能科創(chuàng)項(xiàng)目多種來(lái)源的專業(yè)語(yǔ)料包括學(xué)術(shù)論文、行業(yè)報(bào)告、技術(shù)文檔和專利。
3.根據(jù)權(quán)利要求1所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟2具體包括如下步驟:
4.根據(jù)權(quán)利要求3所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟2.3具體包括如下步驟:
5.根據(jù)權(quán)利要求1所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟3具體包括如下步驟:
6.根據(jù)權(quán)利要求5所述的一種基于自然語(yǔ)言處理的智能科創(chuàng)項(xiàng)目評(píng)價(jià)方法,其特征在于,步驟3.5中,所述關(guān)鍵特征包括文本中的關(guān)鍵詞、實(shí)體、與評(píng)分標(biāo)準(zhǔn)相關(guān)的屬性。
7.根據(jù)權(quán)利要求1所述的一...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:林佳,劉琦,金媛媛,葉慧,
申請(qǐng)(專利權(quán))人:南京信息工程大學(xué),
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。