• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當(dāng)前位置: 首頁 > 專利查詢>武漢大學(xué)專利>正文

    一種結(jié)合注意力機(jī)制LSTM和神經(jīng)主題模型的服務(wù)發(fā)現(xiàn)方法技術(shù)

    技術(shù)編號(hào):25989086 閱讀:34 留言:0更新日期:2020-10-20 18:57
    本發(fā)明專利技術(shù)公開了一種結(jié)合注意力機(jī)制LSTM和神經(jīng)主題模型的服務(wù)發(fā)現(xiàn)方法,包括以下步驟:1:從Web服務(wù)描述語言的標(biāo)簽中提取出自然語言詞匯并進(jìn)行預(yù)處理;2:對(duì)1中提取出的關(guān)鍵詞進(jìn)行語義增強(qiáng)并經(jīng)過神經(jīng)主題模型的處理得到描述的主題信息;3:利用預(yù)訓(xùn)練的詞向量對(duì)1中的關(guān)鍵詞匯進(jìn)行嵌入;4:在步驟2和3的基礎(chǔ)上,通過結(jié)合注意力機(jī)制的雙向LSTM進(jìn)行描述的特征提取;5:在步驟4的基礎(chǔ)上,通過對(duì)查詢請(qǐng)求和服務(wù)描述的特征向量計(jì)算相似度,從注冊服務(wù)庫中,找到相似度最高的k個(gè)服務(wù)。本發(fā)明專利技術(shù)的有益效果是:通過處理Web服務(wù)的描述中存在的語義信息并使用外部信息對(duì)其進(jìn)行增強(qiáng),基于用戶查詢的語義,在大量注冊服務(wù)中找到滿足用戶功能需求的服務(wù)。

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    一種結(jié)合注意力機(jī)制LSTM和神經(jīng)主題模型的服務(wù)發(fā)現(xiàn)方法
    本專利技術(shù)涉及計(jì)算機(jī)
    ,具體涉及一種基于注意力機(jī)制的LSTM和神經(jīng)主題模型相結(jié)合的服務(wù)發(fā)現(xiàn)方法。
    技術(shù)介紹
    面向服務(wù)的體系結(jié)構(gòu)促成了軟件開發(fā)和集成的新范例,其中系統(tǒng)功能封裝為松散耦合且可互操作的服務(wù)。因此,為了滿足現(xiàn)代軟件應(yīng)用程序開發(fā)中的高度互操作性和靈活性需求,越來越多的Web服務(wù)和云服務(wù)被開發(fā)出來。Web服務(wù)數(shù)量的激增給開發(fā)人員帶來了便利,但同時(shí)也給從大規(guī)模服務(wù)注冊中心快速選擇出滿足用戶需要的合適的服務(wù)帶來了困難。在現(xiàn)有的服務(wù)注冊中心中,Web服務(wù)大部分被用(WSDL)Web服務(wù)描述語言進(jìn)行描述。從描述中提取出的關(guān)鍵詞數(shù)量十分有限且語義稀疏,并且這些關(guān)鍵詞難以組成合理的自然語句。在大多數(shù)服務(wù)搜索引擎中采用的關(guān)鍵字匹配方法可能會(huì)檢索到不相關(guān)的服務(wù)或丟失相關(guān)的服務(wù),針對(duì)這些問題有兩類改進(jìn)的方法。第一類方法使用域本體注釋服務(wù)和查詢,并利用本體推理進(jìn)行服務(wù)匹配。但是,構(gòu)造這樣的本體并在語義上注釋W(xué)eb服務(wù)是一項(xiàng)耗時(shí)且難以實(shí)際應(yīng)用的任務(wù)。另一類方法使用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行服務(wù)匹配的方法。通過例如LDA模型來獲取服務(wù)的描述和用戶的查詢文本的主題分布,以及結(jié)合詞向量和主題模型來緩解服務(wù)描述的語義稀疏問題。本申請(qǐng)專利技術(shù)人在實(shí)施本專利技術(shù)的過程中,發(fā)現(xiàn)現(xiàn)有技術(shù)的方法,至少存在如下技術(shù)問題:一些自然語言處理領(lǐng)域的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法在服務(wù)聚類和服務(wù)推薦等方面取得了一定的進(jìn)展,但由于復(fù)雜的深度學(xué)習(xí)模型和方法需要大量的包含上下文信息的語句作為訓(xùn)練語料,因此這些方法仍難以被直接應(yīng)用于服務(wù)發(fā)現(xiàn)領(lǐng)域。由此可知,現(xiàn)有技術(shù)中的方法存在服務(wù)發(fā)現(xiàn)效果不佳的技術(shù)問題。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)提出一種基于注意力機(jī)制的LSTM和神經(jīng)主題模型相結(jié)合的服務(wù)發(fā)現(xiàn)方法,用于解決或者至少部分解決現(xiàn)有技術(shù)中的方法存在的服務(wù)發(fā)現(xiàn)效果不佳的技術(shù)問題。為了解決上述技術(shù)問題,本專利技術(shù)提供了一種基于注意力機(jī)制的LSTM和神經(jīng)主題模型相結(jié)合的服務(wù)發(fā)現(xiàn)方法,包括:S1:分別對(duì)Web服務(wù)描述和查詢請(qǐng)求進(jìn)行關(guān)鍵詞抽取,對(duì)抽取出的服務(wù)描述關(guān)鍵詞和查詢請(qǐng)求關(guān)鍵詞進(jìn)行預(yù)處理;S2:對(duì)預(yù)處理后的服務(wù)描述關(guān)鍵詞進(jìn)行語義增強(qiáng)并經(jīng)過神經(jīng)主題模型的處理得到服務(wù)描述的主題信息,對(duì)預(yù)處理后的查詢請(qǐng)求關(guān)鍵詞進(jìn)行語義增強(qiáng)并經(jīng)過神經(jīng)主題模型的處理得到查詢請(qǐng)求的主題信息;S3:通過詞嵌入技術(shù)將預(yù)處理后的服務(wù)描述關(guān)鍵詞和查詢請(qǐng)求關(guān)鍵詞轉(zhuǎn)化為向量化形式,并得到服務(wù)描述的詞向量矩陣和查詢請(qǐng)求的詞向量矩陣;S4:基于服務(wù)描述的主題信息和服務(wù)描述的詞向量矩陣,通過結(jié)合注意力機(jī)制的雙向LSTM對(duì)服務(wù)描述進(jìn)行特征提取,得到服務(wù)描述的語義特征向量,基于查詢請(qǐng)求的主題信息和查詢請(qǐng)求的詞向量矩陣,通過結(jié)合注意力機(jī)制的雙向LSTM對(duì)查詢請(qǐng)求進(jìn)行特征提取,得到查詢請(qǐng)求的語義特征向量;S5:對(duì)查詢請(qǐng)求的語義特征向量和服務(wù)描述的語義特征向量計(jì)算相似度,從注冊服務(wù)庫中找出與查詢請(qǐng)求相似度最高的k個(gè)服務(wù),其中,k為大于0的正整數(shù)。在一種實(shí)施方式中,S1具體包括:S1.1:分別對(duì)Web服務(wù)描述和查詢請(qǐng)求進(jìn)行關(guān)鍵詞抽取,抽取出自然語言詞匯作為服務(wù)描述關(guān)鍵詞和查詢請(qǐng)求關(guān)鍵詞;S1.2:對(duì)抽取出的自然語言詞匯進(jìn)行分詞、去除停用詞以及詞形還原處理。在一種實(shí)施方式中,S2具體包括:S2.1:從預(yù)設(shè)百科類網(wǎng)站中查詢與抽取出的服務(wù)描述關(guān)鍵詞、查詢請(qǐng)求關(guān)鍵詞對(duì)應(yīng)的詞條,并從中選取對(duì)詞條進(jìn)行釋義的第一段作為增強(qiáng)語義的內(nèi)容添加到提取出的關(guān)鍵詞中;S2.2:對(duì)進(jìn)行語義增強(qiáng)后的服務(wù)描述和查詢請(qǐng)求描述信息進(jìn)行詞袋化處理,得到服務(wù)描述的詞袋向量和查詢請(qǐng)求的詞袋向量;S2.3:將服務(wù)描述的詞袋向量和查詢請(qǐng)求的詞袋向量作為神經(jīng)主題模型的輸入,通過多層感知機(jī)的處理得到重參數(shù)化的參數(shù),重參數(shù)化的結(jié)果經(jīng)過softmax歸一化作為服務(wù)描述的主題信息和查詢請(qǐng)求的主題信息。在一種實(shí)施方式中,S3具體包括:對(duì)S1中預(yù)處理后的服務(wù)描述關(guān)鍵詞通過預(yù)訓(xùn)練好的詞向量模型,查找到對(duì)應(yīng)詞匯的詞向量,并將服務(wù)描述中所有詞匯的向量拼接成為服務(wù)描述對(duì)應(yīng)的詞向量矩陣;對(duì)S1中預(yù)處理后的查詢請(qǐng)求關(guān)鍵詞通過預(yù)訓(xùn)練好的詞向量模型,查找到對(duì)應(yīng)詞匯的詞向量,并將查詢請(qǐng)求中所有詞匯的向量拼接成為查詢請(qǐng)求對(duì)應(yīng)的詞向量矩陣。在一種實(shí)施方式中,S4具體包括:S4.1:使用雙向LSTM對(duì)S3中得到的服務(wù)描述的詞向量矩陣和查詢請(qǐng)求的詞向量矩陣進(jìn)行序列特征提取,得到服務(wù)描述的詞向量矩陣和查詢請(qǐng)求的詞向量矩陣中每一個(gè)詞對(duì)應(yīng)的上下文向量;S4.2:通過注意力機(jī)制基于提取出的上下文向量、服務(wù)描述的主題信息以及查詢請(qǐng)求的主題信息,通過一個(gè)全連接層和激活函數(shù)以及歸一化處理,得到每一個(gè)詞匯的相關(guān)系數(shù),其中,每一個(gè)詞對(duì)應(yīng)一個(gè)權(quán)重,用以表示當(dāng)前詞匯和描述整體主題分布的相關(guān)系數(shù);S4.3:基于S4.2中得到的每一個(gè)詞匯的相關(guān)性系數(shù),對(duì)S4.1中得到的上下文向量矩陣進(jìn)行加權(quán)求和,將加權(quán)就和結(jié)果作為服務(wù)描述的語義特征向量和查詢請(qǐng)求的語義特征向量。在一種實(shí)施方式中,S5具體包括:對(duì)查詢請(qǐng)求的語義特征向量和服務(wù)描述的語義特征向量計(jì)算余弦相似度,并進(jìn)行排序,將相似度符合預(yù)設(shè)條件的服務(wù)描述作為滿足用戶查詢中的功能需求的服務(wù)進(jìn)行返回。在一種實(shí)施方式中,S2.3中通過輸入服務(wù)描述詞袋向量得到服務(wù)描述的主題信息,利用多層感知機(jī)處理輸入,采用如下公式:π=relu(Wπ·XBoW+bπ),μ=relu(Wμ·π+bμ),logσ=relu(Wσ·π+bσ),其中,語義增強(qiáng)后的服務(wù)描述的詞袋形式表述為XBoW,π為中間變量用于計(jì)算后續(xù)的μ、σ,μ、σ分別為后續(xù)重參數(shù)過程中的均值和標(biāo)準(zhǔn)差,W*表示多層感知機(jī)的參數(shù)矩陣,b*表示多層感知機(jī)的偏置項(xiàng),relu激活函數(shù)的公式如下:relu(x)=max(0,x)S2.3中使用到的重參數(shù)化過程的公式如下:u=Drawu~N(0,1)z=u*σ+μ其中,通過從標(biāo)準(zhǔn)正態(tài)分布中進(jìn)行采樣得到服從標(biāo)準(zhǔn)正態(tài)分布的多元隨機(jī)變量u,使用上文中計(jì)算得出的均值μ和標(biāo)準(zhǔn)差σ進(jìn)行放縮和平移,得到向量z,并使用softmax函數(shù)進(jìn)行歸一化輸出為服務(wù)描述的主題分布,公式描述如下:θ=softmax(relu(Wθ·z+bθ))其中Wθ、bθ分別為多層感知機(jī)參數(shù)矩陣和偏置項(xiàng),θ為當(dāng)前輸入文本的未進(jìn)行歸一化的主題分布。在一種實(shí)施方式中,S4.1使用雙向LSTM對(duì)S3中的詞向量矩陣進(jìn)行特征提取,采用如下公式:ft=sig(Wf·[ht-1,xt]+bf)it=sig(Wi·[ht-1,xt]+bi)ot=sig(Wo[ht-1,xt]+bo)ht=ot⊙tanh(Ct)對(duì)于時(shí)間步t,其輸入為對(duì)應(yīng)詞匯的嵌入表達(dá)xt,W*表示多層感知機(jī)的參數(shù)矩陣,b*表示多層感知機(jī)的偏本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點(diǎn)】
    1.一種基于注意力機(jī)制的LSTM和神經(jīng)主題模型相結(jié)合的服務(wù)發(fā)現(xiàn)方法,其特征在于,包括:/nS1:分別對(duì)Web服務(wù)描述和查詢請(qǐng)求進(jìn)行關(guān)鍵詞抽取,對(duì)抽取出的服務(wù)描述關(guān)鍵詞和查詢請(qǐng)求關(guān)鍵詞進(jìn)行預(yù)處理;/nS2:對(duì)預(yù)處理后的服務(wù)描述關(guān)鍵詞進(jìn)行語義增強(qiáng)并經(jīng)過神經(jīng)主題模型的處理得到服務(wù)描述的主題信息,對(duì)預(yù)處理后的查詢請(qǐng)求關(guān)鍵詞進(jìn)行語義增強(qiáng)并經(jīng)過神經(jīng)主題模型的處理得到查詢請(qǐng)求的主題信息;/nS3:通過詞嵌入技術(shù)將預(yù)處理后的服務(wù)描述關(guān)鍵詞和查詢請(qǐng)求關(guān)鍵詞轉(zhuǎn)化為向量化形式,并得到服務(wù)描述的詞向量矩陣和查詢請(qǐng)求的詞向量矩陣;/nS4:基于服務(wù)描述的主題信息和服務(wù)描述的詞向量矩陣,通過結(jié)合注意力機(jī)制的雙向LSTM對(duì)服務(wù)描述進(jìn)行特征提取,得到服務(wù)描述的語義特征向量,基于查詢請(qǐng)求的主題信息和查詢請(qǐng)求的詞向量矩陣,通過結(jié)合注意力機(jī)制的雙向LSTM對(duì)查詢請(qǐng)求進(jìn)行特征提取,得到查詢請(qǐng)求的語義特征向量;/nS5:對(duì)查詢請(qǐng)求的語義特征向量和服務(wù)描述的語義特征向量計(jì)算相似度,從注冊服務(wù)庫中找出與查詢請(qǐng)求相似度最高的k個(gè)服務(wù),其中,k為大于0的正整數(shù)。/n

    【技術(shù)特征摘要】
    1.一種基于注意力機(jī)制的LSTM和神經(jīng)主題模型相結(jié)合的服務(wù)發(fā)現(xiàn)方法,其特征在于,包括:
    S1:分別對(duì)Web服務(wù)描述和查詢請(qǐng)求進(jìn)行關(guān)鍵詞抽取,對(duì)抽取出的服務(wù)描述關(guān)鍵詞和查詢請(qǐng)求關(guān)鍵詞進(jìn)行預(yù)處理;
    S2:對(duì)預(yù)處理后的服務(wù)描述關(guān)鍵詞進(jìn)行語義增強(qiáng)并經(jīng)過神經(jīng)主題模型的處理得到服務(wù)描述的主題信息,對(duì)預(yù)處理后的查詢請(qǐng)求關(guān)鍵詞進(jìn)行語義增強(qiáng)并經(jīng)過神經(jīng)主題模型的處理得到查詢請(qǐng)求的主題信息;
    S3:通過詞嵌入技術(shù)將預(yù)處理后的服務(wù)描述關(guān)鍵詞和查詢請(qǐng)求關(guān)鍵詞轉(zhuǎn)化為向量化形式,并得到服務(wù)描述的詞向量矩陣和查詢請(qǐng)求的詞向量矩陣;
    S4:基于服務(wù)描述的主題信息和服務(wù)描述的詞向量矩陣,通過結(jié)合注意力機(jī)制的雙向LSTM對(duì)服務(wù)描述進(jìn)行特征提取,得到服務(wù)描述的語義特征向量,基于查詢請(qǐng)求的主題信息和查詢請(qǐng)求的詞向量矩陣,通過結(jié)合注意力機(jī)制的雙向LSTM對(duì)查詢請(qǐng)求進(jìn)行特征提取,得到查詢請(qǐng)求的語義特征向量;
    S5:對(duì)查詢請(qǐng)求的語義特征向量和服務(wù)描述的語義特征向量計(jì)算相似度,從注冊服務(wù)庫中找出與查詢請(qǐng)求相似度最高的k個(gè)服務(wù),其中,k為大于0的正整數(shù)。


    2.如權(quán)利要求1所述的服務(wù)發(fā)現(xiàn)方法,其特征在于,S1具體包括:
    S1.1:分別對(duì)Web服務(wù)描述和查詢請(qǐng)求進(jìn)行關(guān)鍵詞抽取,抽取出自然語言詞匯作為服務(wù)描述關(guān)鍵詞和查詢請(qǐng)求關(guān)鍵詞;
    S1.2:對(duì)抽取出的自然語言詞匯進(jìn)行分詞、去除停用詞以及詞形還原處理。


    3.如權(quán)利要求1所述的方法,其特征在于,S2具體包括:
    S2.1:從預(yù)設(shè)百科類網(wǎng)站中查詢與抽取出的服務(wù)描述關(guān)鍵詞、查詢請(qǐng)求關(guān)鍵詞對(duì)應(yīng)的詞條,并從中選取對(duì)詞條進(jìn)行釋義的第一段作為增強(qiáng)語義的內(nèi)容添加到提取出的關(guān)鍵詞中;
    S2.2:對(duì)進(jìn)行語義增強(qiáng)后的服務(wù)描述和查詢請(qǐng)求描述信息進(jìn)行詞袋化處理,得到服務(wù)描述的詞袋向量和查詢請(qǐng)求的詞袋向量;
    S2.3:將服務(wù)描述的詞袋向量和查詢請(qǐng)求的詞袋向量作為神經(jīng)主題模型的輸入,通過多層感知機(jī)的處理得到重參數(shù)化的參數(shù),重參數(shù)化的結(jié)果經(jīng)過softmax歸一化作為服務(wù)描述的主題信息和查詢請(qǐng)求的主題信息。


    4.如權(quán)利要求1所述的服務(wù)發(fā)現(xiàn)方法,其特征在于,S3具體包括:
    對(duì)S1中預(yù)處理后的服務(wù)描述關(guān)鍵詞通過預(yù)訓(xùn)練好的詞向量模型,查找到對(duì)應(yīng)詞匯的詞向量,并將服務(wù)描述中所有詞匯的向量拼接成為服務(wù)描述對(duì)應(yīng)的詞向量矩陣;
    對(duì)S1中預(yù)處理后的查詢請(qǐng)求關(guān)鍵詞通過預(yù)訓(xùn)練好的詞向量模型,查找到對(duì)應(yīng)詞匯的詞向量,并將查詢請(qǐng)求中所有詞匯的向量拼接成為查詢請(qǐng)求對(duì)應(yīng)的詞向量矩陣。


    5.如權(quán)利要求1所述的服務(wù)發(fā)現(xiàn)方法,其特征在于,S4具體包括:
    S4.1:使用雙向LSTM對(duì)S3中得到的服務(wù)描述的詞向量矩陣和查詢請(qǐng)求的詞向量矩陣進(jìn)行序列特征提取,得到服務(wù)描述的詞向量矩陣和查詢請(qǐng)求的詞向量矩陣中每一個(gè)詞對(duì)應(yīng)的上下文向量;
    S4.2:通過注意力機(jī)制基于提取出的上下文向量、服務(wù)描述的主題信息以及查詢請(qǐng)求的主題信息,通過一個(gè)全連接層和激活函數(shù)以及歸一化處理,得到每一個(gè)詞匯的相關(guān)系數(shù),其中,每一個(gè)詞對(duì)應(yīng)一個(gè)權(quán)重,用以表示當(dāng)前詞匯和描述整體主題分布的相關(guān)系數(shù);
    S4.3:基于S4.2中得到的每一個(gè)詞匯的相關(guān)性系數(shù),對(duì)S4.1中得到的上下文向量矩陣進(jìn)行加權(quán)求和,將加權(quán)就和結(jié)果作為服務(wù)描述的語義特征向量和查詢請(qǐng)求的語義特征向量。


    6.如權(quán)利要求1所述的服務(wù)發(fā)現(xiàn)方法,其特征在于,S5具體包括:
    對(duì)查詢請(qǐng)求的語義特征向量和服務(wù)描述的語義特征向量計(jì)算余弦相似度,并進(jìn)行排序,將相似度符合預(yù)設(shè)條件的服務(wù)...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:李兵姚力王健
    申請(qǐng)(專利權(quán))人:武漢大學(xué)
    類型:發(fā)明
    國別省市:湖北;42

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 亚洲一区AV无码少妇电影☆| 天堂一区人妻无码| 日韩精品无码区免费专区| 亚洲精品偷拍无码不卡av| 一道久在线无码加勒比| 亚洲av无码片在线观看| 亚洲高清无码专区视频| 97久久精品亚洲中文字幕无码| 亚洲精品无码你懂的| 免费A级毛片无码A∨| 日韩乱码人妻无码系列中文字幕 | 一本一道中文字幕无码东京热 | 精品无码国产污污污免费网站| 无码中文av有码中文a| 精品无码成人片一区二区98 | 无码人妻AⅤ一区二区三区水密桃| 免费A级毛片无码A∨| 亚洲精品国产日韩无码AV永久免费网 | 精品三级AV无码一区| 亚洲中文字幕无码久久2017| 韩国精品一区二区三区无码视频| 无码丰满熟妇juliaann与黑人| 人妻系列无码专区无码中出| 在线高清无码A.| 亚洲AV永久青草无码精品| 国产AV无码专区亚洲AV毛网站 | 一本色道无码不卡在线观看| 丰满亚洲大尺度无码无码专线| 亚洲成A∨人片在线观看无码| 亚洲Av无码精品色午夜| 久久久无码精品亚洲日韩按摩| 中文字幕久无码免费久久| 国产AV无码专区亚洲Av| 国产精品无码无卡在线播放| 日日日日做夜夜夜夜无码| 中文午夜乱理片无码| 日韩AV无码久久一区二区| 中文字幕无码精品亚洲资源网久久 | 国产精品无码A∨精品影院| 国产AV一区二区三区无码野战| 中文字幕人妻三级中文无码视频|