提供對用戶進行輔助的裝置,針對用戶感興趣的問題,能容易地作成保證能在提問應答系統中得到具有一定以上的精度的回答的提問句。提問句生成裝置與提問應答系統一起使用,包括:單詞接收單元,其接收成為提問句生成的基礎的單詞等(480);和提問句生成用數據庫(502),其由提問句生成用的多個條目構成。多個條目各自以單詞作為鍵且包含在提問應答系統中使用的與該單詞同時出現的回答句句型。提問句生成裝置還包括:提問句生成部(506),其以由單詞接收單元接收到的單詞等(480)作為鍵從提問句生成用數據庫(502)中檢索回答句句型,從檢索到的回答句句型和接收到的單詞等(480)生成提問句。
【技術實現步驟摘要】
【國外來華專利技術】提問句生成裝置以及計算機程序
本專利技術涉及提問應答系統,特別涉及使利用者更易于使用提問應答系統的技術。
技術介紹
已經開發出了應用自然語言處理技術的各種提問應答系統。在這樣的系統中,若將自然語言句子所構成的提問句提供給系統,則回答以自然語言句子給出。在計算機技術以及網絡技術實現了長足進步的現在,廣泛利用這樣的提問應答系統的條件已經齊備。但是,廣泛滲透到一般的用戶的提問應答系統可以說完全沒有。作為其理由而能考慮各種理由。例如在現有的提問應答系統中,用戶關于自己感興趣的事情創建提問句,提供給提問應答系統,并接收其回答。但是,即使如這樣對提問應答系統提問,也很少會得到正確的答案,大多情況下必須多次重新進行提問。若這樣的情況重復發生,最初對提問應答系統懷有興趣的用戶最后也不再利用提問應答系統。另外,即使用戶懷有某些疑問,很多情況下也不能將其表現為具體的提問。而提問應答系統若不以某些形態進行具體的提問,就得不到回答。因此,即使有某些疑問,只要不能使其成為明確的提問句的形態,就得不到正確的回答,結果是難以效率良好地使用提問應答系統。另一方面,還有利用所謂的關鍵詞的信息檢索這樣的技術。在該技術中,若將關鍵詞提供給系統,就從數據庫中檢索與該關鍵詞關聯高的句子,對用戶顯示該句子。在該方法中,存在以下問題:若找不到正確的關鍵詞就得不到適合的信息作為針對提問的回答。并且,由于對于提問不能得到精確的回答,因此還存在必須閱讀檢索到的大量文檔的問題。作為這樣的對關鍵詞檢索進行輔助的技術,有以下所謂的關鍵詞建議功能:若輸入關鍵詞,就實時輔助顯示與該關鍵詞同時輸入的機會多的關鍵詞。用戶能通過選擇被建議的關鍵詞來提高檢索的精度。但是,存在即使使用了關鍵詞建議功能也不能使關鍵詞之間的關系明確這樣的問題??雌饋硎?,只要不能指定多個關鍵詞在怎樣的狀況下使用,檢索的精度就會停滯在某種程度的階段。結果,不能解決用戶不閱讀大量的文檔就得不到回答這樣的問題。
技術實現思路
專利技術要解決的課題現有的提問應答系統未滲透到用戶的原因被認為是作成提問句時的成本的高低。在提問應答系統中,用戶根據自身的興趣來作成適當的提問句并不一定很容易。例如,對于雖然對TPP感興趣但不知道能問詢什么才好的用戶來說,現有的提問應答系統無能為力。另外,為了得到更好的結果,用戶需要多次創建提問句并進行變更來對系統進行詢問。即使用戶為了作成提問句而花費了時間,只要所得到的回答與其時間不相稱,用戶就也不會再積極地利用提問應答系統。另一方面,在利用了關鍵詞建議功能的關鍵詞檢索的情況下,輸入成為關鍵詞的羅列。得到的結果雖然也可能是與關鍵詞的關聯高的文檔,但給出針對用戶的提問的適當的回答的可能性不高。其結果是,用戶為了得到針對自己的疑問的回答而需要閱讀大量的檢索的結果得到的文檔,便利性很低。因此,在利用自然語言處理技術的提問應答系統中,謀求用于使提問句的作成成本降低且用戶能容易地生成基于自然語言句子的適當的提問句的技術。這時,期望不準備人工的回答就能生成對各種領域的用戶的提問都能得到適當的回答的提問句。因此,本專利技術的目的在于,提供對用戶進行輔助的裝置以及計算機程序,在想要利用提問應答系統針對用戶感興趣的問題得到回答的情況下,用戶能容易地作成能得到精度高的回答的提問句。本專利技術的其他目的在于,提供對用戶進行輔助的裝置以及計算機程序,針對用戶感興趣的問題,能容易地作成保證能在提問應答系統中得到具有一定以上的精度的回答的提問句。用于解決課題的手段本專利技術的第1局面所涉及的提問句生成裝置與提問應答系統一起使用,包括:單詞接收單元,其接收成為提問句生成的基礎的單詞或單詞串;和提問句生成用數據庫,其由提問句生成用的多個記錄構成。多個記錄各自以單詞作為鍵(key)且包含在提問應答系統中使用的與該單詞同時出現的回答句句型(pattern)。提問句生成裝置還包括第1提問句生成單元,該第1提問句生成單元以由單詞接收單元接收到的單詞作為鍵從提問句生成用數據庫中檢索回答句句型,從檢索到的回答句句型和接收到的單詞生成提問句。優選地,提問句生成裝置還包括:同義詞辭典,其保存單詞或回答句句型、或者該雙方的同義關系或含意關系;和提問句歸并單元,其響應于提問句生成單元生成了多個提問句這一情況,參照同義詞辭典將多個提問句歸并成更少數量的提問句并輸出。更優選地,提問句生成裝置還包括:詞庫(thesaurus),其保存將單詞或回答句句型、或者該雙方按照它們的意思在體系上進行分類后的分類信息;和提問句歸并單元,其響應于提問句生成單元生成了多個提問句這一情況,參照詞庫將多個提問句歸并成更少數量的提問句并輸出。更優選地,單詞接收單元能接收多個單詞,提問句生成用數據庫能以由單詞接收單元接收到的多個單詞作為鍵來檢索與該多個單詞同時出現的回答句句型。提問句生成單元可以包括提問/回答生成單元,該提問/回答生成單元以由單詞接收單元接收到的單詞作為鍵從提問句生成用數據庫中檢索回答句句型,從檢索到的回答句句型和接收到的單詞生成提問句以及針對該提問句的回答句。提問應答系統可以包括事實型提問應答子系統,該事實型提問應答子系統若被提供事實型的提問句,則將該提問句的句型和該提問句中包含的單詞或單詞串作為鍵來檢索回答句生成用數據庫并生成回答句候補。提問應答系統的回答句生成用數據庫和提問句生成裝置的所述提問句生成用數據庫能包含從相同的語料庫生成的共同的記錄。優選地,提問應答系統還包括非事實型提問應答子系統,該非事實型提問應答子系統若被提供非事實型的提問句,則從語料庫中提取多個成為回答句候補的段(passage),通過預先學習完畢的分數算出單元算出表示作為針對被提供的提問的回答的適合度的分數,將具有最上位的分數的回答句候補作為針對被提供的所述提問的回答而輸出。提問句生成裝置還包括:提問句數據庫,其存儲多個提問句,該多個提問句各自是從預先準備的不具有提問和回答這樣的明示的區別的段的集合內的任一個段生成的提問句,且以成為生成該提問句的基礎的段作為回答;第2提問句生成單元,其若接收到成為提問句生成的基礎的單詞或單詞串,則參照提問句數據庫,從成為該提問句生成的基礎的單詞或單詞串、或者它們的同義詞或含有它們的意思的詞、和存儲于提問句數據庫的提問句生成新的提問句并輸出;和用于將第1提問句生成單元以及第2提問句生成單元輸出的提問句匯總輸出的單元。本專利技術的第2局面所涉及的提問句生成裝置與提問應答系統一起使用。提問應答系統包括非事實型提問應答子系統,該非事實型提問應答子系統若被提供非事實型的提問句,則從語料庫中提取多個成為回答句候補的段,通過預先學習完畢的分數算出單元在各段算出表示作為針對上述提問的回答的適合度的分數,將具有最上位的分數的回答句候補作為針對上述提問的回答而輸出。提問句生成裝置包括:提問句數據庫,其存儲多個提問句,該多個提問句各自是從語料庫內的任一個段生成的提問句,且以成為生成該提問句的基礎的段作為回答;和提問句生成單元,其若接收到成為提問句生成的基礎的單詞或單詞串,則參照提問句數據庫,從成為該提問句生成的基礎的單詞或單詞串、或者它們的同義詞或含有它們的意思的詞、和存儲于提問句數據庫的提問句生成新的提問句并輸出。本專利技術的第3局面所涉及的計算機程序是使計算機作為與提本文檔來自技高網...

【技術保護點】
一種提問句生成裝置,與提問應答系統一起使用,其中,所述提問句生成裝置包括:單詞接收單元,其接收成為提問句生成的基礎的單詞或單詞串;和提問句生成用數據庫,其由提問句生成用的多個記錄構成,所述多個記錄各自以單詞作為鍵且包含在所述提問應答系統中使用的與該單詞同時出現的回答句句型,所述提問句生成裝置還包括:第1提問句生成單元,其以由所述單詞接收單元接收到的單詞作為鍵從所述提問句生成用數據庫中檢索回答句句型,從檢索到的回答句句型和接收到的所述單詞生成提問句。
【技術特征摘要】
【國外來華專利技術】2014.08.21 JP 2014-1687021.一種提問句生成裝置,與提問應答系統一起使用,其中,所述提問句生成裝置包括:單詞接收單元,其接收成為提問句生成的基礎的單詞或單詞串;和提問句生成用數據庫,其由提問句生成用的多個記錄構成,所述多個記錄各自以單詞作為鍵且包含在所述提問應答系統中使用的與該單詞同時出現的回答句句型,所述提問句生成裝置還包括:第1提問句生成單元,其以由所述單詞接收單元接收到的單詞作為鍵從所述提問句生成用數據庫中檢索回答句句型,從檢索到的回答句句型和接收到的所述單詞生成提問句。2.根據權利要求1所述的提問句生成裝置,其中,所述提問句生成裝置還包括:同義詞辭典,其保存單詞或回答句句型、或者該雙方的同義關系或含意關系;和提問句歸并單元,其響應于所述提問句生成單元生成了多個提問句這一情況,參照所述同義詞辭典將所述多個提問句歸并成更少數量的提問句并輸出。3.根據權利要求1所述的提問句生成裝置,其中,所述提問句生成裝置還包括:詞庫,其保存將單詞或回答句句型、或者該雙方按照它們的意思在體系上進行分類后的分類信息;和提問句歸并單元,其響應于所述提問句生成單元生成了多個提問句這一情況,參照所述詞庫將所述多個提問句歸并成更少數量的提問句并輸出。4.根據權利要求1~3中任一項所述的提問句生成裝置,其中,所述單詞接收單元能接收多個單詞,所述提問句生成用數據庫能以由所述單詞接收單元接收到的多個單詞作為鍵來檢索與該多個單詞同時出現的回答句句型。5.根據權利要求1~4中任一項所述的提問句生成裝置,其中,所述提問句生成單元包括:提問/回答生成單元,其以由所述單詞接收單元接收到的單詞作為鍵從所述提問句生成用數據庫中檢索回答句句型,從檢索到的回答句句型和接收到的所述單詞生成提問句以及針對該提問句的回答句。6.根據權利要求1~5中任一項所述的提問句生成裝置,其中,所述提問應答系統包括:事實型提問應答子系統,其若被提供事實型的提問句,則將該提問句的句型和該提問句中包含的單詞或單詞串作為鍵來檢索回答句生成用數據庫并生成回答句候補,所述提問應答系統的所述回答句生成用數據庫和所述提問句生成裝置的所述提問句生成用數據庫包含從相同的語料庫生成的共同的記錄。7.根據權利要求1~6中任一項所述的提問句生成裝置,其中...
【專利技術屬性】
技術研發人員:鳥澤健太郎,后藤淳,朱利安·克洛埃特澤,川田拓也,
申請(專利權)人:國立研究開發法人情報通信研究機構,
類型:發明
國別省市:日本,JP
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。