Google經過過程圖靈測試的AI實測:4次成功完成任務,3次靠的是人工

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

乾明 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

Google神操作,驚掉人下巴。

作為全球AI第一大廠,「人類希望」的寄托,Google,竟然幹出用真人偽裝AI的勾當。

所以剛一被《紐約時報》曝光,圈里立即炸開鍋。

核心所指,就是去年亮相的那個真假難辨的打電話AI:Duplex

谷歌通過圖靈測試的AI實測:4次成功完成任務,3次靠的是人工

實測成功4次,3次背後是人工

去年I/O大會,打電話AI Duplex一經亮相就技驚四座、震動全球,那一聲「嗯哼」更是令人印象深刻。

其後Google董事長、圖靈獎得主John Hennessy也親自上陣打Call,說在電話預約領域,這個AI已經通過了圖靈測試。

谷歌通過圖靈測試的AI實測:4次成功完成任務,3次靠的是人工

而今年I/O,GoogleCEO皮猜還專門披露,一年內已在全美40多州商用。

那意思就是靜水流深,正在廣泛深入基層服務人民群眾。

然而《紐約時報》記者好奇一試,結果尷尬。

為了更好測試,他們還專門找了兩部Pixel智慧型手機,內置了Google助理,而且在預訂餐廳服務時,如果需要電話預訂,就能啟動Duplex.

幾天之內,《紐約時報》記者使用10多次。

但成功預訂的4次中,有3次源於Duplex背後的人工。

更直白來說,75%的成功電話預訂背後,由「偽裝」成AI的人類完成。

完全由AI做到預訂的,只有一次。

谷歌通過圖靈測試的AI實測:4次成功完成任務,3次靠的是人工

《紐約時報》記者也說,就在這一次中,確實也能展現GoogleAI的實力,不僅交流流暢應對自如,而且還有一些小停頓和語氣詞,讓交流顯得更逼真。

在被餐廳經理問及「幾個人吃飯」、「什麼時候」、「姓名」,「手機號」等信息時,GoogleAI都應對自如,準確回答。

甚至餐廳經理冷不防問出「有孩子嗎?」這樣的問題,GoogleAI還能隨機應變,回答說:「我幫客戶預訂,所以我不太確定。」

然而遺憾的是,測試中成功預訂的4次,有且僅有這一次,是真AI。

即便測試樣本還不是足夠多,但也能說明很大問題。

而且Google利用人類呼叫員「偽裝」AI被發現,最初也源自一則餐廳「舉報」。

愛爾蘭口音的Google「AI」

吉米·陳(Jimmy Tran),泰餐廳Lao Thai Kitchen的員工,之前接到一通來自「Google助理」(Google Assistant)的電話。

這是一個有明顯愛爾蘭口音的男聲,希望預訂周末兩個人用餐的位置。

小陳原本挺激動,畢竟他也多少聽聞。通過Google撥打而來的訂座電話,不是普通的打Call,背後是瘋狂的GoogleAI——Duplex.

但小陳很驚訝——這個「AI」口音為何真得不像AI?不僅是愛爾蘭口音,而且說話的語氣語調,「像個人」。

於是小陳單刀直入詢問:你是人還是AI?

對方馬上回答:哦,不,我不是機器人。然後還笑出聲來。

谷歌通過圖靈測試的AI實測:4次成功完成任務,3次靠的是人工

最後留下一臉懵逼的小陳,他決定向《紐約時報》尋求答案。

然而不問不知道。

Google官方:1/4電話由人類撥出

因為Google官方大大方方承認,打電話給泰餐小陳的,確實是Google呼叫中心的員工。

而且目前通過Duplex撥打的電話中,約有25%由人類完全操作,在其他非人工操作的情況下,有15%的呼叫受到了人為干預。

當然,打電話AI Duplex背後還有人類呼叫中心這件事,Google之前從未披露過。

甚至一直以來,Google展現的姿態,都是完全AI,完全自動化,完全不需要人類。

谷歌通過圖靈測試的AI實測:4次成功完成任務,3次靠的是人工

只是之前官方博客里,有雲淡風輕提到過,機器能夠自主完成大部分任務,並識別自己無法處理的情況,然後讓人類來處理。

聽起來只是一種保障用戶體驗的冗餘行為。

萬萬沒想到,人類不僅直接參與,而且1/4的電話都在「偽裝」 成AI。

而如果按照《紐約時報》的隨手測試,實際上3/4都是人類員工所為。

所以這就是Google如今的做事方式?

業務和產品淪為「泡麵」——包裝精美誘人,然後在旮旯角落留下一句「效果僅供參考」?

Google回應:出於對餐廳尊敬

而且Google的解釋和回應,也讓人困惑。

Google說,Duplex之所以有時依賴人工,部分原因在於,是出於對餐廳的尊重。

負責Google助理業務的高管尼克·福克斯(Nick Fox)解釋,為保證餐廳方面的體驗,Google沒有在Duplex中強力去人工化。

但Google也在不斷隨著時間推進改進產品,改進自動化系統,並逐漸減少人工干預的需要。

Duplex的產品經理也表示,還有些餐廳不知道能不能電話預訂,所以這類餐廳會優先選擇人類打電話。

也就是說,只有那些明確接受電話訂座的餐廳,Google系統才會讓AI出馬。

然而《紐約時報》馬上用實例打臉。

因為就在一個之前成功用Duplex訂座成功的餐廳,再次試圖用GoogleAI預訂時,Google派出的是人類。

《紐約時報》猜測,可能是Duplex系統的學習速度還沒那麼快。

因為之前The Verge的相關報導中,還提到了另一個原因:這項技術還很年輕、使用有限。目前Google仍在使用人工呼叫來幫助獲取數據、訓練AI。

但無論如何,Google一手塑造的瘋狂AI,這次算是破功了。

大家習慣了「多少人工就有多少智能」的說法,但Google在應用級人工智能產品中,玩起「人工」+「智能」的模式,依然令人震驚。

事情曝光後,也有人評論說:

難以置信,當他們在舞台上現場表演時,我很驚訝。他們完全撒謊了,我真的希望有人起訴他們。那天他們在舞台上欺騙了成千上萬的人。

谷歌通過圖靈測試的AI實測:4次成功完成任務,3次靠的是人工

不過也有Google鐵桿支持者認為,Google這樣謹慎而不激進地引入Duplex,是明智的。

不知道你是否還記得Duplex橫空出世的樣子。

只是Demo再炫酷,現在也被現實給了一記尷尬耳光。

谷歌通過圖靈測試的AI實測:4次成功完成任務,3次靠的是人工

你怎麼看?

《紐約時報》源報導:

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

量子位 QbitAI · 頭條號簽約作者

վ’ᴗ’ ի 追蹤AI技術和產品新動態

‘,

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!