讓人工智能語音助手聽上去像人類 真的是好事?

5月13日消息,《連線》網站撰文稱,數字助手的聲音聽上去很像是人類,就是好事情嗎?那的確可能會使得人們更想要使用它,但也可能會帶來意想不到的影響:助手的功能變弱,變得沒那么有用。這提出了一個重要的問題:人們究竟想要從虛擬助手那里得到什么呢?
以下是文章主要內容:
向Alexa詢問天氣狀況,它會用愉快的音調告訴你天氣晴朗。讓它給你講個笑話,它就會用它標志性的斷奏給你講個雙關笑話。叫它唱首歌,它就會唱出自動調諧的民謠。亞馬遜的虛擬助手擁有著各種各樣像人類的機靈功能——但它的聲音出賣了它:Alexa還只是個機器人。
為了幫助Alexa擺脫機器人口音,亞馬遜最近升級了它的語音合成標記語言標簽,讓開發者能夠用來給Alexa的技能或者應用編造出更加自然的語音模式。那些新標簽可讓Alexa做各種口頭活動,如低聲說話,停頓,爆出咒罵的話,調整語音的速度、音量、語氣強調和音高。這意味著Alexa和其它的數字助手可能不久之后就會聽上去不那么像是機器人,而更像是人類。但在這兩個極端之間取得良好的平衡對于語音交互設計師而言仍是一大挑戰,且提出了人們真正想要從語音助手那里得到什么的重要問題。
讓表達更加細致入微
先進的語言標簽之于計算機生成的語音的作用,就像是標點符號和表情符號之于文本通訊的作用:增加信息的帶寬。簡單的標記語言可讓語音助手區分1996和1,996,或者區分相同發音的單詞不同的用法。先進的標簽可讓它們傳達比以往多得多的信息。你知道你是如何看待“聽起來不錯”短信和帶表情符號的“聽起來不錯”短信之間的差異的嗎?發出抑揚之聲的能力也將讓數字助手能夠做出細致入微的表達。
更加細致的助手可能會更有幫助。俄亥俄州立大學語音心理學家勞拉·瓦格納(Laura Wagner)表示,“聲音的音樂要素有助于你形成一種期待。”語音的抑揚可帶來更加高效的描述,減少歧義性。它還有望給Alexa帶來相對于來自蘋果和谷歌的數字助手的情感優勢。“如果它聽上去像人的話,我們會很喜歡它。”瓦格納說道。有證據顯示,人們對于能夠“隨即地進行互動”(即能夠跟另一個人進行響應式的來回交談)的物體有更強的連接。“Alexa聽上去越像人,我就越想要信任她,越想要使用她。”瓦格納說。
當然,那也解釋了為什么亞馬遜想要讓Alexa聽上去盡可能地像是人類。
功能或弱化
不過,亞馬遜也面臨著讓Alexa聽上去太像人的風險。2月,該公司發布了“speechcon”——數十個Alexa能夠更加準確地發音的感嘆詞,如argh(哎啊)、cheerio(好呀)和d’oh。亞馬遜想要給它的虛擬助手加上一層個性,但像那樣的怪異模式會讓Alexa變得沒那么有用。
卡內基梅隆大學計算機科學家阿蘭·布萊克(Alan Black)表示,“如果Alexa開始說出諸如‘hmm’和‘well’的話時,你會不自覺地跟著她那么說話。”布萊克在1990年代幫助開辟了語音合成標記標簽的應用。人往往會不自覺地模仿對話者的會話風格;讓數字助手的說話方式變得太隨便的話,人們也會跟著那么說話。“這樣的代價就是,數字助手可能會聽不出用戶在說些什么。”布萊克說。
以功能弱化為代價來改進語音助手的個性,是越來越多的用戶界面設計師們將要解決的一個折中問題。舊金山設計咨詢公司Fjord的聊天機器人設計師約翰·瓊斯(John Jones)說道,“我們是想要說話的個性,還是想要給予我們信息的實用功能?我想很多情況下我們都會更想要可給給予我們信息的實用功能。”僅僅因為Alexa能夠說出俗語和流行文化用語來,并不意味著它應該那么做。有時候你只希望它能夠帶來效用。數字助手應當用簡短的回復來回應直接的指令,又或許直接沉默不語——而不是發出“booyah”(一種喜悅的叫法)的聲音。(亞馬遜添加的另一個speechcon。)
?????投稿郵箱:jiujiukejiwang@163.com ??詳情訪問99科技網:http://www.hacbq.cn
推薦資訊
























