System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及交叉學科領域,特別涉及一種基于關鍵詞的學科交叉測量方法。
技術介紹
1、跨學科研究涉及多學科知識的融合,是解決當代復雜社會挑戰和推動科學創新不可或缺的手段,也是創造高影響力知識和實踐創新的關鍵因素。隨著科技的快速發展,解決當今復雜科學問題所需的方案和突破往往超越了單一學科的局限,需要依賴多學科理論或技術的融合進行跨學科研究。據2017年統計顯示,在諾貝爾獎研究成果中基于跨學科合作獲獎的占49.07%。因此,探索學科交叉的本質、形式和規律,對于促進科學的發展和社會的進步具有重要的意義。
2、通過對國內外學科交叉測度相關文獻的調研發現,現有研究主要采用了兩種方法:分析研究人員的學術背景或作者之間的合作模式,或者考察出版物及其引用情況。這些研究利用學者信息調研、機構或期刊學科類別映射,在不同學科交叉測度指標的計算下得出具體學科交叉度的大小。例如,liu等人在科學技術與辯證法,6,105-109中通過統計諾貝爾生理學或醫學獎獲得者獲得本專業以外學位的情況揭示了跨學科研究對原創性科學成果的決定作用。zhang等人在情報學報,37(3),231-242以2014—2016年社會科學領域高被引學者的研究成果為例,測度科學合作中的不同學科機構之間的學科交叉程度,證明了跨學科機構合作對跨學科科學成果的產出具有一定的促進作用。wang等人在scientometrics,111,2023-2039以wos數據庫中應用數學、計算科學、運籌學與管理科學三個領域的60位高產作者為例,從目標文獻、參考文獻、施引文獻出發測量其學科交叉
3、然而,目前大多數研究,包括上文所提及的,主要集中關注于宏觀層面的學科交叉,而基于微觀層面的跨學科知識結構研究相對較為有限。在微觀層面,論文關鍵詞被視為最基本的知識載體,能夠簡單直接地反映研究論文的思想和主題。與學科級或主題級方法相比,關鍵詞在研究跨學科領域與其組成學科之間的知識聯系時采用了更細粒度的視角。學科關鍵字的集合涵蓋了某一學科的主要研究重點。因此,來自兩個或多個學科的交叉關鍵詞可以揭示跨學科研究的內容。這一理念是本研究選擇以關鍵詞為導向探索跨學科交叉的基礎,從而深入研究在這一細粒度層面上出現的微妙的互動和知識結構
技術實現思路
1、本專利技術的目的在于克服現有學科交叉測量技術中所存在的研究主體的細粒度不足以及度量方法全面性上存在缺陷的問題,提供一種基于關鍵詞的學科交叉測量方法。
2、在第一方面,本專利技術提供一種多指標合成的計算方式,使用熵加權方法對基于所述語義分析、所述層次結構分析和所述網絡結構分析得到的指標進行整合,包括如下步驟:
3、s1:提取學科論文關鍵字;
4、s2:通過對所得學科論文關鍵字數據集進行語義分析得到反映學科知識相似度的指標,通過對所得學科論文關鍵字層次結構分析別得到衡量不同學科之間跨學科性的指標,通過對所得學科論文關鍵字網絡結構分析分得到跨學科強度測量指標;
5、s3:使用熵加權方法對所述語義分析指標、所述層次結構分析指標,所述網絡結構分析指標進行整合,所得結果指標離散度越大,熵值越小,指標對綜合評價的影響越大。
6、優選地,步驟s1包含如下步驟:
7、s11:根據停用詞列表刪除學科論文標題和摘要中無意義的詞;
8、s12:將處理后的數據作為自然語言處理工具yake關鍵字提取器的輸入并提取出其中的名詞短語。
9、優選的,在步驟s2中的語義分析還包含步驟:用余弦相似度計算得到所述語義分析指標。
10、優選的,所述語義分析是對整理所得的語料庫分別進行處理得到一個矩陣和一個向量序列,對兩者進行余弦計算得到所述語義分析指標。
11、進一步優選的,所述語義分析包括如下步驟:
12、stepa:過濾學科的論文標題和摘要中出現頻率低于指定閾值的關鍵字;
13、step?b:使用詞頻-逆向文件頻率算法來計算不同學科文檔中每個關鍵字的術語頻率-逆文檔頻率,從而構建一個學科-關鍵術語矩陣;將語料庫輸入到一個word2vec模型中進行訓練,使用cbow方法將文檔數據中的學科關鍵項轉換為低維向量空間中的點,生成一個指定維數關鍵字向量序列;
14、step?c:對矩陣和向量都進行l2歸一化,將歸一化后的學科關鍵字矩陣與關鍵字向量相乘得到學科關鍵字向量;
15、step?d:采用余弦相似度計算學科關鍵詞向量之間的相似性,來量化學科之間的語義關系,計算結果記為psemantic,代表學科x和學科y語義上的學科知識相似度,即反映了學科x和學科y之間基于文檔內容的跨學科相互作用程度。
16、
17、優選的,步驟s2中的層次結構分析包含:基于taxogen模型計算得到所述層次結構分析指標。
18、優選的,所述層次結構分析是基于分層結構進行分析確定主題關鍵詞貢獻度并量化知識距離,對兩者進行計算得到所述層次結構分析指標。
19、進一步優選的,所述層次分析包括如下步驟:
20、stepa:基于taxogen模型構建分層結構;
21、step?b:通過分析關鍵詞對各層級主題的代表性和關鍵詞在主題內的分配概率,可以定義層次化的主題-關鍵詞貢獻度;結合學科-主題和相應的主題-關鍵詞的分配概率可以確定了各學科關鍵詞在各學科層次主題下的貢獻,由此可以得出主題t下關鍵詞k的學科貢獻度ctk:
22、ctk=dt×ftk
23、式中:dt表示主題t的文檔頻率,ftk表示關鍵詞k在主題t下的學科語料庫中出現的頻次;
24、step?c:通過將兩兩學科主題樹基于同一關鍵詞將不同層次不同主題進行匹配,其層次深度之和代表跨學科知識交互和傳播路徑,兩個概念之間的距離越長,學科知識的關聯范圍和相似性都越低,知識距離可以通過下列公式來量化:
25、
26、式中:kd是所述知識距離的量化值,wtk是某學科主題t下的關鍵字k,f是d和l的傳遞函數,l是之間的最短路徑長度,d是層次語義網絡中包含者的深度,即兩個關鍵詞之間最低共同祖先的深度;
27、step?d:通過主題關鍵詞貢獻度和知識距離構建了度量指標,可以基于層次結構計算得到所述層次結構分析指標,計算公式為:
28、
29、式中:phierarchy是所述層次結構分析指標,kd是所述知識距離的量化值,n(x,y)是學科x與學科y之間的共同關鍵字數量,是基于共同關鍵詞的知識關聯過程中可能組合成的路徑數量,t表示某學科單位主題的關鍵詞個數。
30、優選的,步驟s2中的網絡結構分析還包含:基于學科共詞網絡計算得到所述網絡結構分析指標。
31、優選的,所述網絡結構分析是通過研究關鍵詞網絡得到節點在網絡內的影響力指標,將該指標應用到多學科之中經計算得到基于網絡結構的所述網絡結構分析指標。
32、進一步優選的,本文檔來自技高網...
【技術保護點】
1.一種基于關鍵詞的學科交叉測量方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種基于關鍵詞的學科交叉測量方法,其特征在于,所述步驟S1具體包括以下步驟:
3.根據權利要求1所述的測量方法,其特征在于,所述步驟S2中的語義分析是對所述學科論文關鍵字數據集分別進行處理得到一個矩陣和一個向量序列,對兩者進行余弦相似度計算得到所述語義分析指標。
4.根據權利要求3所述的測量方法,其特征在于,所述語義分析包括如下步驟:
5.根據權利要求1所述的測量方法,其特征在于,所述步驟S2中的層次結構是基于分層結構進行分析確定主題關鍵詞貢獻度并量化知識距離,對兩者進行計算得到所述層次結構分析指標。
6.根據權利要求5所述的測量方法,其特征在于,所述層次分析包括如下步驟:
7.根據權利要求1所述的測量方法,其特征在于,所述步驟S2中的網絡結構分析是通過研究關鍵詞網絡得到節點在網絡內的影響力指標,將影響力指標應用到多學科之中經計算得到基于網絡結構的所述網絡結構分析指標。
8.根據權利要求7所述的測量方法,其特
9.根據權利要求1所述的測量方法,其特征在于,步驟S3具體包含如下步驟:
10.一種測量方法,其特征在于,包括至少一個整合方法,以及與所述至少一個整合方法連接的三個分析方法;所述整合方法需基于三個分析方法,所述三個分析方法被所述至少一個整合方法處理,以使所述至少一個整合方法能夠執行權利要求1至12中任一項所述的方法。
...【技術特征摘要】
1.一種基于關鍵詞的學科交叉測量方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種基于關鍵詞的學科交叉測量方法,其特征在于,所述步驟s1具體包括以下步驟:
3.根據權利要求1所述的測量方法,其特征在于,所述步驟s2中的語義分析是對所述學科論文關鍵字數據集分別進行處理得到一個矩陣和一個向量序列,對兩者進行余弦相似度計算得到所述語義分析指標。
4.根據權利要求3所述的測量方法,其特征在于,所述語義分析包括如下步驟:
5.根據權利要求1所述的測量方法,其特征在于,所述步驟s2中的層次結構是基于分層結構進行分析確定主題關鍵詞貢獻度并量化知識距離,對兩者進行計算得到所述層次結構分析指標。
6.根據權利要求5所述的測量方...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。