The test data processing method, a device and a terminal for question answering system. The method includes: receiving test data to test the question answering system, which look forward to, each test data including the test question and the corresponding test, the QA system includes knowledge base, the knowledge base including the anticipated problem for each test; ask the semantic expressions to generate the corresponding test, asked to characterize the semantics of the semantic expression; according to the result of the comparison between the semantic expressions of different test question, the test question or its corresponding to deal with the problems, so that the test data between semantic repetition. By adopting the technical proposal of the invention, the test data of the question answering system can be optimized, and the accuracy of the knowledge base test can be improved.
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及數(shù)據(jù)處理
,尤其涉及一種問答系統(tǒng)的測(cè)試數(shù)據(jù)處理方法、裝置及終端。
技術(shù)介紹
隨著智能問答技術(shù)的發(fā)展,越來越多的平臺(tái)(例如,QQ、Skype、電商客服系統(tǒng)、MSN平臺(tái)、微信平臺(tái)、短消息服務(wù)平臺(tái)等)都在采用智能問答系統(tǒng)。智能問答系統(tǒng)可以基于用戶的問題從知識(shí)庫(kù)輸出相對(duì)應(yīng)的答案。為了保證輸出答案的準(zhǔn)確性,現(xiàn)有技術(shù)一般是枚舉足夠多的測(cè)試問對(duì)智能問答系統(tǒng)進(jìn)行測(cè)試;或者,通過人工去寫語義規(guī)則來捕捉對(duì)于同一答案的足夠多的問法。但是,通過枚舉足夠多的測(cè)試問的方式耗時(shí)耗力;采用人工去寫語義規(guī)則的方式對(duì)寫語義規(guī)則的人(通常是知識(shí)建設(shè)人員)有比較高的要求,例如,需要了解語義規(guī)則如何編寫、有哪些語法符號(hào)、詞類名會(huì)是什么、相似度計(jì)算邏輯是什么等;而且不同的知識(shí)建設(shè)人員對(duì)語義規(guī)則的理解和寫法可能會(huì)有偏差。上述兩種方式均會(huì)導(dǎo)致測(cè)試問差異性大,重復(fù)性大,進(jìn)而影響對(duì)知識(shí)庫(kù)測(cè)試的準(zhǔn)確性。
技術(shù)實(shí)現(xiàn)思路
本專利技術(shù)解決的技術(shù)問題是如何優(yōu)化問答系統(tǒng)的測(cè)試數(shù)據(jù),進(jìn)而提高對(duì)知識(shí)庫(kù)測(cè)試的準(zhǔn)確性。為解決上述技術(shù)問題,本專利技術(shù)實(shí)施例提供一種問答系統(tǒng)的測(cè)試數(shù)據(jù)處理方法,問答系統(tǒng)的測(cè)試數(shù)據(jù)處理方法包括:接收待測(cè)試問答系統(tǒng)的測(cè)試數(shù)據(jù),每一測(cè)試數(shù)據(jù)包括測(cè)試問和其對(duì)應(yīng)的期待問題,其中,所述待測(cè)試問答系統(tǒng)包括知識(shí)庫(kù),所述知識(shí)庫(kù)中包括所述期待問題;對(duì)于每一測(cè)試問,生成對(duì)應(yīng)的語義表達(dá)式,所述語義表達(dá)式用以表征所述測(cè)試問的語義;根據(jù)不同測(cè)試問的語義表達(dá)式之間的比較結(jié)果,對(duì)所述測(cè)試問或其對(duì)應(yīng)的期待問題進(jìn)行處理,以使得所述測(cè)試數(shù)據(jù)之間語義不重復(fù)??蛇x的,所述對(duì)于每一測(cè)試問,生成對(duì)應(yīng)的語義表達(dá)式包括:對(duì)所述每一 ...
【技術(shù)保護(hù)點(diǎn)】
一種問答系統(tǒng)的測(cè)試數(shù)據(jù)處理方法,其特征在于,包括:接收待測(cè)試問答系統(tǒng)的測(cè)試數(shù)據(jù),每一測(cè)試數(shù)據(jù)包括測(cè)試問和其對(duì)應(yīng)的期待問題,其中,所述待測(cè)試問答系統(tǒng)包括知識(shí)庫(kù),所述知識(shí)庫(kù)中包括所述期待問題;對(duì)于每一測(cè)試問,生成對(duì)應(yīng)的語義表達(dá)式,所述語義表達(dá)式用以表征所述測(cè)試問的語義;根據(jù)不同測(cè)試問的語義表達(dá)式之間的比較結(jié)果,對(duì)所述測(cè)試問或其對(duì)應(yīng)的期待問題進(jìn)行處理,以使得所述測(cè)試數(shù)據(jù)之間語義不重復(fù)。
【技術(shù)特征摘要】
1.一種問答系統(tǒng)的測(cè)試數(shù)據(jù)處理方法,其特征在于,包括:接收待測(cè)試問答系統(tǒng)的測(cè)試數(shù)據(jù),每一測(cè)試數(shù)據(jù)包括測(cè)試問和其對(duì)應(yīng)的期待問題,其中,所述待測(cè)試問答系統(tǒng)包括知識(shí)庫(kù),所述知識(shí)庫(kù)中包括所述期待問題;對(duì)于每一測(cè)試問,生成對(duì)應(yīng)的語義表達(dá)式,所述語義表達(dá)式用以表征所述測(cè)試問的語義;根據(jù)不同測(cè)試問的語義表達(dá)式之間的比較結(jié)果,對(duì)所述測(cè)試問或其對(duì)應(yīng)的期待問題進(jìn)行處理,以使得所述測(cè)試數(shù)據(jù)之間語義不重復(fù)。2.根據(jù)權(quán)利要求1所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,所述對(duì)于每一測(cè)試問,生成對(duì)應(yīng)的語義表達(dá)式包括:對(duì)所述每一測(cè)試問進(jìn)行分詞處理,以得到多個(gè)詞;分別對(duì)所述多個(gè)詞中的每個(gè)詞進(jìn)行詞性標(biāo)注處理,以得到所述每個(gè)詞的詞性信息;根據(jù)所述詞性信息對(duì)所述多個(gè)詞進(jìn)行過濾處理,保留詞性信息為預(yù)設(shè)詞性的詞;判斷過濾保留的每個(gè)詞所屬的詞類,所述語義表達(dá)式包括所述過濾保留的每個(gè)詞的詞類,其中,每一詞類包括多個(gè)詞語。3.根據(jù)權(quán)利要求2所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,采用以下方式確定不同測(cè)試問的語義表達(dá)式之間的比較結(jié)果:計(jì)算所述不同測(cè)試問的語義表達(dá)式的語義相似度;根據(jù)所述語義相似度確定所述比較結(jié)果。4.根據(jù)權(quán)利要求3所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,所述對(duì)于每一測(cè)試問,生成對(duì)應(yīng)的語義表達(dá)式還包括:在所述多個(gè)詞包含預(yù)設(shè)重點(diǎn)詞時(shí),對(duì)所述預(yù)設(shè)重點(diǎn)詞所屬的詞類增加權(quán)重標(biāo)注;其中,所述詞類包括初始權(quán)重,在計(jì)算所述不同測(cè)試問的語義表達(dá)式的語義相似度時(shí),如果所述詞類存在權(quán)重標(biāo)注,則在所述初始權(quán)重基礎(chǔ)上的增加所述詞類的語義權(quán)重。5.根據(jù)權(quán)利要求3所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,所述對(duì)于每一測(cè)試問,生成對(duì)應(yīng)的語義表達(dá)式還包括:在所述多個(gè)詞包含有序詞語組合時(shí),對(duì)所述有序詞語組合所屬的多個(gè)詞類增加有序標(biāo)注;其中,在計(jì)算所述不同測(cè)試問的語義表達(dá)式的語義相似度時(shí),如果所述詞類存在有序標(biāo)注,則根據(jù)所述有序標(biāo)注指示的順序計(jì)算所述語義相似度。6.根據(jù)權(quán)利要求3所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,所述根據(jù)所述詞性信息對(duì)所述多個(gè)詞進(jìn)行過濾處理時(shí),還保留權(quán)重大于設(shè)定值的詞。7.根據(jù)權(quán)利要求6所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,還包括:對(duì)所述權(quán)重大于設(shè)定值的詞所屬的詞類增加疑問標(biāo)注;其中,在計(jì)算所述不同測(cè)試問的語義表達(dá)式的語義相似度時(shí),如果所述詞類存在疑問標(biāo)注,則將所述語義表達(dá)式展開成為包含所述詞類和不包含所述詞類的兩個(gè)子表達(dá)式。8.根據(jù)權(quán)利要求3所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,所述根據(jù)所述語義相似度確定所述比較結(jié)果包括:當(dāng)所述語義相似度達(dá)到設(shè)定閾值時(shí),則確定所述比較結(jié)果為所述不同測(cè)試問一致,否則確定所述比較結(jié)果為所述不同測(cè)試問不一致。9.根據(jù)權(quán)利要求8所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,所述根據(jù)所述語義表達(dá)式的比較結(jié)果對(duì)所述測(cè)試問進(jìn)行處理包括:如果對(duì)應(yīng)同一期待問題的不同測(cè)試問生成的所述語義表達(dá)式的比較結(jié)果為所述不同測(cè)試問一致,則將所述不同測(cè)試問刪減為一個(gè)測(cè)試問。10.根據(jù)權(quán)利要求8所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,所述根據(jù)所述語義表達(dá)式的比較結(jié)果對(duì)所述測(cè)試問對(duì)應(yīng)的期待問題進(jìn)行處理包括:如果對(duì)應(yīng)不同期待問題的不同測(cè)試問生成的所述語義表達(dá)式的比較結(jié)果為所述不同測(cè)試問一致,則發(fā)送提示信息,以提示所述不同期待問題是語義近似的重復(fù)期待問題。11.根據(jù)權(quán)利要求10所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,所述知識(shí)庫(kù)包括多個(gè)知識(shí)點(diǎn),每一知識(shí)點(diǎn)包括標(biāo)準(zhǔn)問和所述標(biāo)準(zhǔn)問對(duì)應(yīng)的擴(kuò)展問,所述不同期待問題均為所述知識(shí)庫(kù)中的不同標(biāo)準(zhǔn)問。12.根據(jù)權(quán)利要求11所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,所述發(fā)送提示信息的同時(shí),還包括:提示用戶選擇所述知識(shí)庫(kù)中的所述不同標(biāo)準(zhǔn)問對(duì)應(yīng)的知識(shí)點(diǎn)中一個(gè)知識(shí)點(diǎn),將所述知識(shí)庫(kù)中的所述不同標(biāo)準(zhǔn)問以及所述不同標(biāo)準(zhǔn)問對(duì)應(yīng)的擴(kuò)展問合并至選中的知識(shí)點(diǎn),并提示用戶將所述選中的知識(shí)點(diǎn)中的標(biāo)準(zhǔn)問之外的其他標(biāo)準(zhǔn)問作為所述選中的知識(shí)點(diǎn)的擴(kuò)展問。13.根據(jù)權(quán)利要求2所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,還包括:將所述語義表達(dá)式、所述測(cè)試問及其對(duì)應(yīng)的期待問題進(jìn)行存儲(chǔ),以用于在所述詞類包括的所述多個(gè)詞發(fā)生變化時(shí),重新生成所述語義表達(dá)式。14.根據(jù)權(quán)利要求2至13任一項(xiàng)所述的測(cè)試數(shù)據(jù)處理方法,其特征在于,所述預(yù)設(shè)詞性包括名詞、動(dòng)詞、副詞和預(yù)設(shè)重點(diǎn)疑問詞的一種或多種。15.一種問答系統(tǒng)的測(cè)試數(shù)據(jù)處理裝置,其特征在于,包括:接收模塊,用以接收待測(cè)試問答系統(tǒng)的測(cè)試數(shù)據(jù),每一測(cè)試數(shù)據(jù)包括測(cè)試問和其對(duì)應(yīng)的期待問題,其中,...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:曾永梅,朱頻頻,
申請(qǐng)(專利權(quán))人:上海智臻智能網(wǎng)絡(luò)科技股份有限公司,
類型:發(fā)明
國(guó)別省市:上海;31
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。