<rt id="i8eqo"></rt>

<li id="i8eqo"></li>

當前位置: 首頁 > 專利查詢>百度在線網(wǎng)絡(luò)技術(shù)北京有限公司專利>正文

一種用于識別短文本類別信息的方法、裝置和計算機設(shè)備制造方法及圖紙

技術(shù)編號：7529560 閱讀：203 留言：0更新日期：2012-07-12 13:11

一種計算機實現(xiàn)的用于識別短文本類別信息的短文本處理方法、裝置及計算機設(shè)備，根據(jù)本發(fā)明專利技術(shù)的方案通過獲取待分類的短文本信息；獲取分別基于多個預(yù)訓(xùn)練的分類模型組獲得的該短文本信息的多個類別判斷結(jié)果；并基于第一預(yù)定規(guī)則，根據(jù)所述多個類別判斷結(jié)果，來綜合確定所述待分類短文本信息的類別信息。與現(xiàn)有技術(shù)相比，本發(fā)明專利技術(shù)具有以下優(yōu)點：1)本發(fā)明專利技術(shù)通過多個短文本特征信息來綜合判斷短文本信息的類別，提高了判斷準確率；2)本發(fā)明專利技術(shù)通過迭代訓(xùn)練并分類的方式實現(xiàn)已分類短文本信息的自動擴展；3)通過生成短文本匹配詞典，能夠?qū)崟r獲取短文本信息的類別信息。

全部詳細技術(shù)資料下載

【技術(shù)實現(xiàn)步驟摘要】

本專利技術(shù)涉及計算機網(wǎng)絡(luò)技術(shù)，尤其涉及一種用于識別短文本類別信息的方法、裝置和計算機設(shè)備。
技術(shù)介紹
在現(xiàn)代互聯(lián)網(wǎng)技術(shù)中，如何根據(jù)來自用戶的搜索信息來提供符合用戶需求的搜索結(jié)果，無疑十分重要。現(xiàn)有技術(shù)中所采用的一種技術(shù)方案為通過獲得與來自用戶的搜索信息相關(guān)的相關(guān)關(guān)鍵詞，并根據(jù)該等相關(guān)關(guān)鍵詞來觸發(fā)其對應(yīng)的搜索結(jié)果。因此，如何獲取與搜索信息相關(guān)的相關(guān)關(guān)鍵詞，十分重要。現(xiàn)有技術(shù)中判斷文本信息相關(guān)度的方案多用于判斷大段文本內(nèi)容的相似度，而來自用戶的搜索信息多為短文本信息，判斷大段文本內(nèi)容相似度的方案并不適用于判斷短文本信息的相似度。
技術(shù)實現(xiàn)思路
本專利技術(shù)的目的是提供一種用于識別短文本類別信息的方法、裝置和計算機設(shè)備。根據(jù)本專利技術(shù)的一個方面，提供一種計算機實現(xiàn)的用于識別短文本類別信息的方法，其中，該方法包括以下步驟a獲取待分類的短文本信息；b獲取分別基于多個預(yù)訓(xùn)練的分類模型組獲得的該短文本信息的多個類別判斷結(jié)果；c基于第一預(yù)定規(guī)則，根據(jù)所述多個類別判斷結(jié)果，來綜合確定所述待分類短文本信息的類別信息；其中，每個分類模型組包含一個或多個分類模型，各分類模型組分別通過采用不同的預(yù)設(shè)短文本特征信息進行訓(xùn)練而得到。根據(jù)本專利技術(shù)的另一個方面，還提供了一種計算機實現(xiàn)的用于識別短文本類別信息的短文本處理裝置，其中，該短文本處理裝置包括第一獲取裝置、用于獲取待分類的短文本信息；類別獲取裝置、用于獲取分別基于多個預(yù)訓(xùn)練的分類模型組獲得的該短文本信息的多個類別判斷結(jié)果；確定裝置、用于基于第一預(yù)定規(guī)則，根據(jù)所述多個類別判斷結(jié)果，來綜合確定所述待分類短文本信息的類別信息；其中，每個分類...

【技術(shù)保護點】

【技術(shù)特征摘要】

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：田浩，萬偉，
申請(專利權(quán))人：百度在線網(wǎng)絡(luò)技術(shù)北京有限公司，
類型：發(fā)明
國別省市：

全部詳細技術(shù)資料下載我是這個專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評論

還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)

電商短文本意圖識別技術(shù)

缺少用于表的增強類別技術(shù)

如何識別ip地址的類別技術(shù)