描述了用于實(shí)現(xiàn)數(shù)字個(gè)人助理的系統(tǒng)、方法、裝置和計(jì)算機(jī)程序產(chǎn)品。數(shù)字個(gè)人助理能夠確定用戶詢問(wèn)了旨在與數(shù)字個(gè)人助理的人物進(jìn)行交互的問(wèn)題或作出這樣的陳述。響應(yīng)于確定用戶詢問(wèn)了這樣的問(wèn)題或作出了這樣的陳述,數(shù)字個(gè)人助理通過(guò)在數(shù)字個(gè)人助理的用戶界面內(nèi)或通過(guò)該用戶界面顯示或回放與流行文化參考相關(guān)聯(lián)的多媒體對(duì)象來(lái)提供針對(duì)這樣的問(wèn)題或這樣的陳述的響應(yīng)。附加地或替換地,響應(yīng)于確定用戶詢問(wèn)了這樣的問(wèn)題或作出了這樣的陳述,數(shù)字個(gè)人助理通過(guò)生成或回放包括與流行文化參考相關(guān)聯(lián)的人員的聲音的模仿的語(yǔ)音來(lái)提供對(duì)這樣的問(wèn)題或這樣的陳述的響應(yīng)。
【技術(shù)實(shí)現(xiàn)步驟摘要】
【國(guó)外來(lái)華專利技術(shù)】背景擬人化的計(jì)算機(jī)交互在人工智能領(lǐng)域是非常普遍的實(shí)踐。數(shù)字個(gè)人助理的制造者可向他們的助理灌輸人格,使得保持與用戶非常高的交互水平并還建立用戶與助理之間的信任元素,從而促進(jìn)對(duì)數(shù)字個(gè)人助理的持續(xù)使用以及與數(shù)字個(gè)人助理的交互。一種用于將交互水平保持為高的技術(shù)需要使得由數(shù)字個(gè)人助理提供的響應(yīng)有趣且有娛樂(lè)性。數(shù)字個(gè)人助理的一些傳統(tǒng)實(shí)現(xiàn)被編程來(lái)在用戶用隨意的語(yǔ)調(diào)詢問(wèn)問(wèn)題時(shí)生成有趣的文本響應(yīng)。然而,傳統(tǒng)的數(shù)字個(gè)人助理在呈現(xiàn)打趣的響應(yīng)時(shí)通常沒(méi)有充分利用數(shù)字畫布的全部靈活性。它們也沒(méi)有在提供響應(yīng)時(shí)充分利用現(xiàn)今文本到語(yǔ)音合成技術(shù)的力量來(lái)聽上去有趣或不同。此外,不存在數(shù)字助理的可被用于表達(dá)打趣響應(yīng)的任一方面的視覺表示。概述本文中描述了用于實(shí)現(xiàn)數(shù)字個(gè)人助理的系統(tǒng)、方法、裝置和計(jì)算機(jī)程序產(chǎn)品。數(shù)字個(gè)人助理能夠確定用戶詢問(wèn)了旨在與數(shù)字個(gè)人助理的人物進(jìn)行交互的問(wèn)題或作出了這樣的陳述,而非例如請(qǐng)求數(shù)字個(gè)人助理來(lái)代表用戶獲得信息或執(zhí)行某個(gè)其他任務(wù)。響應(yīng)于確定用戶詢問(wèn)了這樣的問(wèn)題或作出了這樣的陳述,數(shù)字個(gè)人助理通過(guò)在數(shù)字個(gè)人助理的用戶界面內(nèi)或通過(guò)該用戶界面顯示或回放與流行文化參考相關(guān)聯(lián)的多媒體對(duì)象來(lái)提供針對(duì)這樣的問(wèn)題或這樣的陳述的響應(yīng)。附加地或替換地,響應(yīng)于確定用戶詢問(wèn)了這樣的問(wèn)題或作出了這樣的陳述,數(shù)字個(gè)人助理可通過(guò)生成或回放包括與流行文化參考相關(guān)聯(lián)的人員的聲音的模仿的語(yǔ)音來(lái)提供對(duì)這樣的問(wèn)題或這樣的陳述的響應(yīng)。進(jìn)一步,數(shù)字個(gè)人助理可通過(guò)以下來(lái)提供響應(yīng):在數(shù)字個(gè)人助理的用戶界面內(nèi)顯示包括與流行文化參考相關(guān)聯(lián)的引用的文本、在數(shù)字個(gè)人助理的用戶界面內(nèi)顯示喚起流行文化參考的數(shù)字個(gè)人助理的視覺表示和/或在數(shù)字個(gè)人助理的用戶界面內(nèi)顯示可被用戶激活來(lái)訪問(wèn)與流行文化參考相關(guān)聯(lián)的內(nèi)容的鏈接。具體地,本文中描述了用于實(shí)現(xiàn)數(shù)字個(gè)人助理的方法。根據(jù)該方法,接收到數(shù)字個(gè)人助理的用戶的發(fā)言的數(shù)字表示。至少基于對(duì)發(fā)言的數(shù)字表示的分析,確定該發(fā)言包括旨在與數(shù)字個(gè)人助理的人物進(jìn)行交互的發(fā)言。響應(yīng)于至少確定該發(fā)言包括旨在與數(shù)字個(gè)人助理的人物進(jìn)行交互的發(fā)言,數(shù)字個(gè)人助理被致使生成針對(duì)該發(fā)言的響應(yīng)。針對(duì)該發(fā)言的響應(yīng)包括被顯示在數(shù)字個(gè)人助理的用戶界面內(nèi)或被其回放并與流行文化參考相關(guān)聯(lián)的多媒體對(duì)象(例如,圖像、視頻內(nèi)容或音頻內(nèi)容)。替換地或附加地,針對(duì)該發(fā)言的響應(yīng)包括由數(shù)字個(gè)人助理生成或回放的并包括與流行文化參考相關(guān)聯(lián)的人員的聲音的模仿的語(yǔ)音。在上述方法的一個(gè)實(shí)施例中,針對(duì)該發(fā)言的響應(yīng)還包括被顯示在數(shù)字個(gè)人助理的用戶界面內(nèi)的文本,該文本包括與流行文化參考相關(guān)聯(lián)的引用。在另一實(shí)施例中,語(yǔ)音包括與流行文化參考相關(guān)聯(lián)的引用。在還一實(shí)施例中,針對(duì)該發(fā)言的響應(yīng)還包括被顯示在數(shù)字個(gè)人助理的用戶界面內(nèi)的并喚起流行文化參考的數(shù)字個(gè)人助理的視覺表示。進(jìn)一步根據(jù)這樣的實(shí)施例,數(shù)字個(gè)人助理的視覺表示可包括數(shù)字個(gè)人助理的動(dòng)畫。在又一實(shí)施例中,針對(duì)該發(fā)言的響應(yīng)還包括被顯示在數(shù)字個(gè)人助理的用戶界面內(nèi)的并可被用戶激活來(lái)訪問(wèn)與流行文化參考相關(guān)聯(lián)的內(nèi)容的鏈接。取決于上述方法的實(shí)現(xiàn),致使針對(duì)該發(fā)言的響應(yīng)被生成可包括標(biāo)識(shí)針對(duì)該發(fā)言的多個(gè)適格響應(yīng)并接著從該多個(gè)針對(duì)發(fā)言的適格響應(yīng)中選擇針對(duì)該發(fā)言的響應(yīng)。根據(jù)另一實(shí)現(xiàn),致使針對(duì)該發(fā)言的響應(yīng)被生成包括將該發(fā)言匹配到發(fā)言類型分層樹內(nèi)的一特定發(fā)言類型(發(fā)言類型分層樹中的每一個(gè)發(fā)言類型具有與其相關(guān)聯(lián)的一個(gè)或多個(gè)響應(yīng))并從與該特定發(fā)言類型相關(guān)聯(lián)的響應(yīng)中選擇針對(duì)該發(fā)言的響應(yīng)。根據(jù)又一實(shí)現(xiàn),致使針對(duì)該發(fā)言的響應(yīng)被生成包括確定該發(fā)言與一趨勢(shì)話題相關(guān)聯(lián)并且響應(yīng)于確定該發(fā)言與該趨勢(shì)話題相關(guān)聯(lián),從與該趨勢(shì)話題相關(guān)聯(lián)的一個(gè)或多個(gè)響應(yīng)中選擇針對(duì)該發(fā)言的響應(yīng)。根據(jù)還一實(shí)現(xiàn),致使針對(duì)該發(fā)言的響應(yīng)被生成包括確定該發(fā)言是針對(duì)其存在旨在表達(dá)數(shù)字個(gè)人助理的人物的一個(gè)或多個(gè)預(yù)定義的響應(yīng)的發(fā)言,并且響應(yīng)于確定該發(fā)言是針對(duì)其存在旨在表達(dá)數(shù)字個(gè)人助理的人物的一個(gè)或多個(gè)預(yù)定
義的響應(yīng)的發(fā)言,從該一個(gè)或多個(gè)預(yù)定義的響應(yīng)中選擇針對(duì)該發(fā)言的響應(yīng)。在上述方法的另一實(shí)施例中,致使針對(duì)該發(fā)言的響應(yīng)被生成包括向執(zhí)行數(shù)字個(gè)人助理的計(jì)算設(shè)備發(fā)送音頻文件,該音頻文件包括語(yǔ)音或標(biāo)識(shí)該音頻文件的信息。在還一實(shí)施例中,致使針對(duì)該發(fā)言的響應(yīng)被生成包括向執(zhí)行數(shù)字個(gè)人助理的計(jì)算設(shè)備提供文本,該文本要由數(shù)字個(gè)人助理的文本到語(yǔ)音組件處理來(lái)生成語(yǔ)音。本文中還描述了一計(jì)算設(shè)備。該計(jì)算設(shè)備包括至少一個(gè)處理器和存儲(chǔ)器。存儲(chǔ)器存儲(chǔ)供至少一個(gè)處理器執(zhí)行的計(jì)算機(jī)程序邏輯。計(jì)算機(jī)程序邏輯包括被配置成當(dāng)由所述至少一個(gè)處理器執(zhí)行時(shí)執(zhí)行各操作的一個(gè)或多個(gè)組件。該一個(gè)或多個(gè)組件包括數(shù)字個(gè)人助理。數(shù)字個(gè)人助理被配置成捕捉表示用戶的發(fā)言的音頻并將該音頻傳送到數(shù)字個(gè)人助理后端。該發(fā)言包括旨在與數(shù)字個(gè)人助理的人物進(jìn)行交互的發(fā)言。數(shù)字個(gè)人助理還被配置成至少基于接收自數(shù)字個(gè)人助理后端的信息來(lái)提供針對(duì)該發(fā)言的響應(yīng)。提供響應(yīng)包括生成或回放包括與流行文化參考相關(guān)聯(lián)的人員的聲音的模仿的語(yǔ)音。在該計(jì)算設(shè)備的一個(gè)實(shí)施例中,數(shù)字個(gè)人助理被配置成回放包括該語(yǔ)音的音頻文件。在該計(jì)算設(shè)備的另一實(shí)施例中,數(shù)字個(gè)人助理被配置成將文本到語(yǔ)音轉(zhuǎn)換應(yīng)用到文本以生成語(yǔ)音。在該計(jì)算設(shè)備的另一實(shí)施例中,提供響應(yīng)還包括以下中的至少一個(gè):由數(shù)字個(gè)人助理的用戶界面顯示或回放多媒體對(duì)象,該多媒體對(duì)象與流行文化參考相關(guān)聯(lián);在數(shù)字個(gè)人助理的用戶界面內(nèi)顯示文本,該文本包括與流行文化參考相關(guān)聯(lián)的引用;在數(shù)字個(gè)人助理的用戶界面內(nèi)顯示喚起流行文化參考的數(shù)字個(gè)人助理的視覺表示;以及在數(shù)字個(gè)人助理的用戶界面內(nèi)顯示可被用戶激活來(lái)訪問(wèn)與流行文化參考相關(guān)聯(lián)的內(nèi)容的鏈接。本文中描述了另一計(jì)算設(shè)備。該計(jì)算設(shè)備包括至少一個(gè)處理器和存儲(chǔ)器。存儲(chǔ)器存儲(chǔ)供至少一個(gè)處理器執(zhí)行的計(jì)算機(jī)程序邏輯。計(jì)算機(jī)程序邏輯包括被配置成當(dāng)由所述至少一個(gè)處理器執(zhí)行時(shí)執(zhí)行各操作的一個(gè)或多個(gè)組件。該一個(gè)或多個(gè)組件包括數(shù)字個(gè)人助理。數(shù)字個(gè)人助理被配置成捕捉表示用戶的發(fā)言的音頻并將該音頻傳送到數(shù)字個(gè)人助理后端。該發(fā)言包括旨在與數(shù)字個(gè)人助理的
人物進(jìn)行交互的發(fā)言。數(shù)字個(gè)人助理還被配置成至少基于接收自數(shù)字個(gè)人助理后端的信息來(lái)提供針對(duì)該發(fā)言的響應(yīng)。提供響應(yīng)包括由數(shù)字個(gè)人助理的用戶界面顯示或回放與流行文化參考相關(guān)聯(lián)的多媒體對(duì)象。在該計(jì)算設(shè)備的一個(gè)實(shí)施例中,該多媒體對(duì)象包括圖像、視頻內(nèi)容或音頻內(nèi)容。在該計(jì)算設(shè)備的另一實(shí)施例中,提供響應(yīng)還包括以下中的至少一個(gè):生成或回放包括與流行文化參考相關(guān)聯(lián)的人員的聲音的模仿的語(yǔ)音;在數(shù)字個(gè)人助理的用戶界面內(nèi)顯示文本,該文本包括與流行文化參考相關(guān)聯(lián)的引用;在數(shù)字個(gè)人助理的用戶界面內(nèi)顯示喚起流行文化參考的數(shù)字個(gè)人助理的視覺表示;以及在數(shù)字個(gè)人助理的用戶界面內(nèi)顯示可被用戶激活來(lái)訪問(wèn)與流行文化參考相關(guān)聯(lián)的內(nèi)容的鏈接。提供本概述以便以簡(jiǎn)化的形式介紹以下在詳細(xì)描述中進(jìn)一步描述的一些概念。本
技術(shù)實(shí)現(xiàn)思路
并不旨在標(biāo)識(shí)所要求保護(hù)主題的關(guān)鍵特征或必要特征,也不旨在用于限制所要求保護(hù)主題的范圍。此外,注意到所要求保護(hù)的主題不限于在詳細(xì)描述和/或本文的其它章節(jié)中所述的特定實(shí)施例。本文呈現(xiàn)這些實(shí)施例僅用于說(shuō)明性的用途。基于本文所包含的描述,其它實(shí)施例對(duì)于相關(guān)領(lǐng)域的技術(shù)人員將是顯而易見的。附圖簡(jiǎn)述合并在此并作為說(shuō)明書一部分的附圖與說(shuō)明書一起示出了本專利技術(shù)的實(shí)施例,本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種用于實(shí)現(xiàn)數(shù)字個(gè)人助理的方法,包括:接收所述數(shù)字個(gè)人助理的用戶的發(fā)言的數(shù)字表示;至少基于對(duì)所述發(fā)言的數(shù)字表示的分析,確定所述發(fā)言包括旨在與所述數(shù)字個(gè)人助理的人物進(jìn)行交互的發(fā)言;以及響應(yīng)于至少確定所述發(fā)言包括旨在與所述數(shù)字個(gè)人助理的人物進(jìn)行交互的發(fā)言,致使包括以下至少之一的針對(duì)所述發(fā)言的響應(yīng)被所述數(shù)字個(gè)人助理生成:被顯示在所述數(shù)字個(gè)人助理的用戶界面內(nèi)的或被所述數(shù)字個(gè)人助理的用戶界面回放的多媒體對(duì)象,所述多媒體對(duì)象與流行文化參考相關(guān)聯(lián);以及被所述數(shù)字個(gè)人助理生成或回放的語(yǔ)音,所述語(yǔ)音包括與所述流行文化參考相關(guān)聯(lián)的人員的聲音的模仿。
【技術(shù)特征摘要】
【國(guó)外來(lái)華專利技術(shù)】2014.01.15 US 14/156,0091.一種用于實(shí)現(xiàn)數(shù)字個(gè)人助理的方法,包括:接收所述數(shù)字個(gè)人助理的用戶的發(fā)言的數(shù)字表示;至少基于對(duì)所述發(fā)言的數(shù)字表示的分析,確定所述發(fā)言包括旨在與所述數(shù)字個(gè)人助理的人物進(jìn)行交互的發(fā)言;以及響應(yīng)于至少確定所述發(fā)言包括旨在與所述數(shù)字個(gè)人助理的人物進(jìn)行交互的發(fā)言,致使包括以下至少之一的針對(duì)所述發(fā)言的響應(yīng)被所述數(shù)字個(gè)人助理生成:被顯示在所述數(shù)字個(gè)人助理的用戶界面內(nèi)的或被所述數(shù)字個(gè)人助理的用戶界面回放的多媒體對(duì)象,所述多媒體對(duì)象與流行文化參考相關(guān)聯(lián);以及被所述數(shù)字個(gè)人助理生成或回放的語(yǔ)音,所述語(yǔ)音包括與所述流行文化參考相關(guān)聯(lián)的人員的聲音的模仿。2.如權(quán)利要求1所述的方法,其特征在于,針對(duì)所述發(fā)言的響應(yīng)還包括被顯示在所述數(shù)字個(gè)人助理的所述用戶界面內(nèi)的文本,所述文本包括與所述流行文化參考相關(guān)聯(lián)的引用。3.如權(quán)利要求1所述的方法,其特征在于,針對(duì)所述發(fā)言的響應(yīng)還包括被顯示在所述數(shù)字個(gè)人助理的所述用戶界面內(nèi)的并喚起所述流行文化參考的所述數(shù)字個(gè)人助理的視覺表示。4.如權(quán)利要求1所述的方法,其特征在于,所述多媒體對(duì)象包括:被顯示在所述數(shù)字個(gè)人助理的所述用戶界面內(nèi)的圖像或視頻內(nèi)容或被所述數(shù)字個(gè)人助理的所述用戶界面回放的音頻內(nèi)容。5.如權(quán)利要求1所述的方法,其特征在于,針對(duì)所述發(fā)言的響應(yīng)還包括:被顯示在所述數(shù)字個(gè)人助理的所述用戶界面內(nèi)的并能被所述用戶激活來(lái)訪問(wèn)與所述流行文化參考相關(guān)聯(lián)的內(nèi)容的鏈接。6.如權(quán)利要求1所述的方法,其特征在于,致使針對(duì)所述發(fā)言的響應(yīng)被生成包括:將所述發(fā)言匹配到發(fā)言類型分層樹內(nèi)的特定發(fā)言類型,所述發(fā)言類型分層樹中的每個(gè)發(fā)言類型具有與其相關(guān)聯(lián)的一個(gè)或多個(gè)響應(yīng);以及從與所述特定發(fā)言類型相關(guān)聯(lián)的響應(yīng)中選...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:M·萊迪,R·J·霍華德三世,D·B·哈里森,S·馬雷科扎德,
申請(qǐng)(專利權(quán))人:微軟技術(shù)許可有限責(zé)任公司,
類型:發(fā)明
國(guó)別省市:美國(guó);US
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。