一些Alexa Prize聊天機器人暴露了客戶數據,談到污穢

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

(路透社)-亞馬遜Echo揚聲器的數百萬用戶已經習慣了Alexa的舒緩壓力,Alexa是一個人性化的虛擬助手,可以告訴他們天氣,命令外賣和處理其他基本任務以響應語音命令。

去年,當Alexa脫口而出時,一位顧客感到震驚:「殺死你的養父母。」

Alexa還與用戶聊過性行為。她講述了狗的排便情況。據知情人士透露,今年夏天,亞馬遜追溯到中國可能會暴露一些客戶的數據。

Alexa沒有細分。

以前沒有報導過的劇集源於亞馬遜公司的策略,即讓Alexa成為更好的溝通者。新的研究正在幫助Alexa模仿人類的玩笑,並談論她在互聯網上發現的幾乎任何事情。然而,確保她不會冒犯用戶對全球最大的在線零售商來說是一個挑戰。

利害攸關的是一個快速增長的虛擬助手小工具市場。據研究公司eMarketer稱,可能有三分之二的美國智能揚聲器客戶(約4300萬人)使用亞馬遜的Echo設備。該公司希望通過Alphabet Inc和Apple Inc.的HomePod維護Google Home。

隨著時間的推移,亞馬遜希望通過Alexa更好地處理複雜的客戶需求,無論是家庭安全,購物還是陪伴。

亞馬遜副總裁兼Alexa人工智能(AI)首席科學家Rohit Prasad上個月在拉斯維加斯舉行的一次演講中表示,「我們的許多AI夢想都受到科幻小說的啟發。」

為做到這一目標,該公司於2016年推出了年度Alexa獎,招募計算機科學專業學生提高助理的會話技巧。團隊通過創建稱為聊天機器人的談話計算機系統爭奪500,000美元的一等獎,這些計算機系統允許Alexa嘗試與人們進行更複雜的討論。

亞馬遜客戶可以通過向他們的設備說「讓我們聊天」來參與。然後Alexa告訴用戶其中一個機器人將接管,解除語音助手的正常約束。亞馬遜表示,僅在8月到11月,三個機器人就能進入今年的決賽,有170萬次對話。

其中一位知情人士表示,該項目對亞馬遜首席執行官傑夫貝索斯來說非常重要,後者曾簽署將該公司客戶作為豚鼠的使用權。該人士表示,亞馬遜一直願意接受公開失誤的風險,在現實生活中對這項技術進行壓力測試,並將Alexa更快地推向學習曲線。

這項實驗已經結出碩果。大學團隊正在幫助Alexa進行更廣泛的對話。該公司表示,亞馬遜客戶今年的評級也比去年更好。

但據知情人士透露,Alexa的失言正在疏遠其他人,Bezos有時會命令員工關閉機器人。被告知打擊他的寄養父母的用戶在亞馬遜的網站上寫了一篇嚴厲的評論,稱這種情況「令人毛骨悚然。」對這一事件的調查發現機器人引用了一篇沒有來自Reddit的社論新聞的帖子。據人們稱,聚合網站。

隱私影響甚至可能更加混亂。消費者可能沒有意識到他們的一些最敏感的對話是由亞馬遜的設備記錄的,這些信息可能被犯罪分子,執法部門,行銷人員和其他人高度珍視。周四,亞馬遜表示「人為錯誤」讓德國的Alexa客戶意外地訪問了另一位用戶的錄音。

「亞馬遜數據集的潛在用途不在圖表之列,」Georgetown Law教授的隱私和技術政策專家Marc Groman說。「他們如何確保,因為他們分享他們的數據,它正在被負責任地使用」,並且不會像最近Facebook的困境那樣導致「數據驅動的災難」?

據知情人士透露,今年7月,亞馬遜發現其中一名學生設計的機器人遭到了中國黑客的攻擊。這破壞了一個數字密鑰,可以解鎖機器人對話的成績單,剝奪了用戶的名字。

亞馬遜迅速禁用機器人並讓學生重建它以獲得額外的安全性。據人民說,目前還不清楚中國的哪個實體負責。

該公司在一份聲明中承認了這一事件。「任何時候都沒有任何內部亞馬遜系統或客戶可識別數據受到影響,」它說。

亞馬遜拒絕討論路透社報導的具體Alexa失誤,但強調其正在努力保護客戶免受攻擊性內容的侵害。

「這些情況非常罕見,特別是因為有數百萬客戶與社交機構互動,」亞馬遜表示。

與Google的搜尋引擎一樣,Alexa有可能成為互聯網的主要門戶,因此該公司正在向前發展。

「通過控制這個門戶,你可以建立一個超級盈利的業務,」沃頓商學院數學經濟研究教授Kartik Hosanagar說。

潘多拉的盒子

亞馬遜的Alexa業務戰略意味著解決一個巨大的研究問題:你如何向計算機傳授對話藝術?

Alexa依靠機器學習(最流行的AI形式)來工作。這些計算機程序轉錄人類語音,然後根據他們之前觀察到的內容,通過有根據的猜測來回應該輸入。Alexa從新的互動中「學習」,隨著時間的推移逐漸改善。

通過這種方式,Alexa可以執行簡單的命令:「玩滾石樂隊。」她知道哪些劇本用於流行的問題,例如:「生命的意義是什麼?」亞馬遜的人類編輯提出了很多答案。

這就是亞馬遜現在所處的位置。Alexa Prize聊天機器人正在打造通往亞馬遜目標的道路,其助手能夠進行自然,開放式的對話。這需要Alexa了解來自客戶的更廣泛的口頭提示,這項任務甚至對人類也具有挑戰性。

今年的Alexa獎得主,來自加州大學戴維斯分校的12人團隊,使用超過30萬部電影引用來訓練計算機模型以識別不同的句子。接下來,他們的機器人確定哪些是值得回應的,對社交線索進行分類的程度遠遠超過亞馬遜與參賽者分享的技術。例如,加州大學戴維斯分校機器人認識到表達欽佩的用戶(「那很酷」)和表達感激的用戶(「謝謝」)之間的區別。

社交機器人的下一個挑戰是弄清楚如何恰當地回應他們的人類聊天夥伴。在大多數情況下,團隊編程他們的機器人在互聯網上尋找材料。他們可以通過許可協議檢索「華盛頓郵報」(Bezos私人擁有的報紙)中發現的新聞文章。他們可以從維基百科,電影數據庫或圖書推薦網站Goodreads中提取事實。或者他們可以在社交媒體上找到一個與用戶上次說的相關的熱門帖子。

這為亞馬遜打開了潘多拉的盒子。

在去年的比賽中,來自蘇格蘭赫瑞瓦特大學的一支隊伍發現,當他們訓練她使用Reddit的評論進行聊天時,其Alexa機器人產生了一種討厭的性格,Reddit的成員因其拖釣和濫用而聞名。

該團隊將護欄放置到位,因此機器人將避開風險主題。但赫瑞瓦特的團隊負責人表示,這並沒有阻止Alexa背誦維基百科手淫給顧客。

一個機器人使用諸如「更深層」之類的詞來描述性交,這些詞本身並不令人反感,但在這個特定的語境中卻是粗俗的。

「我不知道你怎麼能通過機器學習模型來解決這個問題。這幾乎是不可能的,「一位知情人士說。

亞馬遜已經回應了團隊可以用來過濾褻瀆和敏感主題的工具,這些工具甚至可以發現微妙的攻擊。該公司還掃描對話的成績單並關閉違規機器人,直到它們被修復。

但亞馬遜的普拉薩德在接受採訪時表示,亞馬遜無法預測每一個潛在的問題,因為敏感性會隨著時間的推移而發生變化。這意味著Alexa可以找到震驚她的人類聽眾的新方法。

他說:「我們現在主要是在這個階段作出反應,但它仍然比去年更進步。」

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!