System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本公開涉及自然語(yǔ)言處理,具體涉及一種煤炭行業(yè)詞庫(kù)分類方法。
技術(shù)介紹
1、鑒于煤炭行業(yè)的高門檻性、非普遍性和專業(yè)性,煤炭行業(yè)研究人員提出的一些關(guān)鍵術(shù)語(yǔ)并不能被普通的行業(yè)詞庫(kù)識(shí)別,這嚴(yán)重影響了煤炭行業(yè)自然語(yǔ)言處理的精度,為了提高煤炭行業(yè)自然語(yǔ)言處理的精度,需要構(gòu)建煤炭行業(yè)詞庫(kù)。
2、相關(guān)技術(shù)中,煤炭行業(yè)相關(guān)詞庫(kù)的質(zhì)量不一,由此,如何從多個(gè)詞庫(kù)中確定高質(zhì)量的行業(yè)詞庫(kù)成為重點(diǎn)研究方向。
技術(shù)實(shí)現(xiàn)思路
1、本公開旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
2、為此,本公開的目的在于提出一種煤炭行業(yè)詞庫(kù)分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
3、本公開第一方面實(shí)施例提出的煤炭行業(yè)詞庫(kù)分類方法,方法包括:
4、獲取初始詞庫(kù),長(zhǎng)序列文本和短序列文本,其中,長(zhǎng)序列文本具有對(duì)應(yīng)的第一標(biāo)注分類信息,短序列文本具有對(duì)應(yīng)的第二標(biāo)注分類信息;
5、將初始詞庫(kù)和長(zhǎng)序列文本一并輸入至第一文本分類模型中,以獲取第一文本分類模型輸出的第一預(yù)測(cè)分類信息;
6、將長(zhǎng)序列文本輸入至第一文本分類模型中,以獲取第一文本分類模型輸出的第二預(yù)測(cè)分類信息;
7、將初始詞庫(kù)和短序列文本一并輸入至第二文本分類模型中,以獲取第二文本分類模型輸出的第三預(yù)測(cè)分類信息;
8、將短序列文本輸入至第二文本分類模型中,以獲取第二文本分類模型輸出的第四預(yù)測(cè)分類信息;
9、根據(jù)第一標(biāo)注分類信息、第二標(biāo)注分類信息、第一預(yù)測(cè)分類信息、第二預(yù)測(cè)分
10、本公開第二方面實(shí)施例提出的煤炭行業(yè)詞庫(kù)分類裝置,裝置包括:
11、獲取模塊,用于獲取初始詞庫(kù),長(zhǎng)序列文本和短序列文本,其中,長(zhǎng)序列文本具有對(duì)應(yīng)的第一標(biāo)注分類信息,短序列文本具有對(duì)應(yīng)的第二標(biāo)注分類信息;
12、第一輸入模塊,用于將初始詞庫(kù)和長(zhǎng)序列文本一并輸入至第一文本分類模型中,以獲取第一文本分類模型輸出的第一預(yù)測(cè)分類信息;
13、第二輸入模塊,用于將長(zhǎng)序列文本輸入至第一文本分類模型中,以獲取第一文本分類模型輸出的第二預(yù)測(cè)分類信息;
14、第三輸入模塊,用于將初始詞庫(kù)和短序列文本一并輸入至第二文本分類模型中,以獲取第二文本分類模型輸出的第三預(yù)測(cè)分類信息;
15、第四輸入模塊,用于將短序列文本輸入至第二文本分類模型中,以獲取第二文本分類模型輸出的第四預(yù)測(cè)分類信息;
16、確定模塊,用于根據(jù)第一標(biāo)注分類信息、第二標(biāo)注分類信息、第一預(yù)測(cè)分類信息、第二預(yù)測(cè)分類信息、第三預(yù)測(cè)分類信息和第四預(yù)測(cè)分類信息,從初始詞庫(kù)中確定目標(biāo)詞庫(kù)。
17、本公開第三方面實(shí)施例提出的電子設(shè)備,包括:存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,處理器執(zhí)行程序時(shí)實(shí)現(xiàn)如本公開第一方面實(shí)施例提出的煤炭行業(yè)詞庫(kù)分類方法。
18、本公開第四方面實(shí)施例提出了一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本公開第一方面實(shí)施例提出的煤炭行業(yè)詞庫(kù)分類方法。
19、本公開第五方面實(shí)施例提出了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)計(jì)算機(jī)程序產(chǎn)品中的指令由處理器執(zhí)行時(shí),執(zhí)行如本公開第一方面實(shí)施例提出的煤炭行業(yè)詞庫(kù)分類方法。
20、本公開提供的煤炭行業(yè)詞庫(kù)分類方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),至少存在以下有益效果:通過(guò)獲取初始詞庫(kù),長(zhǎng)序列文本和短序列文本,其中,長(zhǎng)序列文本具有對(duì)應(yīng)的第一標(biāo)注分類信息,短序列文本具有對(duì)應(yīng)的第二標(biāo)注分類信息,將初始詞庫(kù)和長(zhǎng)序列文本一并輸入至第一文本分類模型中,以獲取第一文本分類模型輸出的第一預(yù)測(cè)分類信息,將長(zhǎng)序列文本輸入至第一文本分類模型中,以獲取第一文本分類模型輸出的第二預(yù)測(cè)分類信息,將初始詞庫(kù)和短序列文本一并輸入至第二文本分類模型中,以獲取第二文本分類模型輸出的第三預(yù)測(cè)分類信息,將短序列文本輸入至第二文本分類模型中,以獲取第二文本分類模型輸出的第四預(yù)測(cè)分類信息,根據(jù)第一標(biāo)注分類信息、第二標(biāo)注分類信息、第一預(yù)測(cè)分類信息、第二預(yù)測(cè)分類信息、第三預(yù)測(cè)分類信息和第四預(yù)測(cè)分類信息,從初始詞庫(kù)中確定目標(biāo)詞庫(kù),由此,能夠從多個(gè)初始詞庫(kù)中準(zhǔn)確地確定目標(biāo)詞庫(kù),提升煤炭行業(yè)詞庫(kù)的分類效果。
21、本公開附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本公開的實(shí)踐了解到。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種煤炭行業(yè)詞庫(kù)分類方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述獲取初始詞庫(kù),包括:
3.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述第一標(biāo)注分類信息、所述第二標(biāo)注分類信息、所述第一預(yù)測(cè)分類信息、所述第二預(yù)測(cè)分類信息、所述第三預(yù)測(cè)分類信息和所述第四預(yù)測(cè)分類信息,從所述初始詞庫(kù)中確定目標(biāo)詞庫(kù),包括:
4.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述第一分類精度、所述第二分類精度、所述第三分類精度和所述第四分類精度,從所述初始詞庫(kù)中確定目標(biāo)詞庫(kù),包括:
5.如權(quán)利要求4所述的方法,其特征在于,在所述根據(jù)所述第一標(biāo)注分類信息、所述第二標(biāo)注分類信息、所述第一預(yù)測(cè)分類信息和所述第二預(yù)測(cè)分類信息,從所述初始詞庫(kù)中確定目標(biāo)詞庫(kù)之后,還包括:
6.如權(quán)利要求5所述的方法,其特征在于,所述確定與所述目標(biāo)詞庫(kù)對(duì)應(yīng)的詞庫(kù)類型,包括:
7.一種煤炭行業(yè)詞庫(kù)分類裝置,其特征在于,所述裝置包括:
8.如權(quán)利要求7所述的裝置,其特征在于,所述獲取模塊,還用于:
9.一種
10.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-6中任一項(xiàng)所述的方法。
...【技術(shù)特征摘要】
1.一種煤炭行業(yè)詞庫(kù)分類方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述獲取初始詞庫(kù),包括:
3.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述第一標(biāo)注分類信息、所述第二標(biāo)注分類信息、所述第一預(yù)測(cè)分類信息、所述第二預(yù)測(cè)分類信息、所述第三預(yù)測(cè)分類信息和所述第四預(yù)測(cè)分類信息,從所述初始詞庫(kù)中確定目標(biāo)詞庫(kù),包括:
4.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述第一分類精度、所述第二分類精度、所述第三分類精度和所述第四分類精度,從所述初始詞庫(kù)中確定目標(biāo)詞庫(kù),包括:
5.如權(quán)利要求4所述的方法,其特征在于,...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:孫闖,程健,楊培培,賈琨,周子博,方乾,宋鄭一凡,
申請(qǐng)(專利權(quán))人:煤炭科學(xué)研究總院有限公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。