在上周的一場比賽中,GoogleAI贏了99%的工程師

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

上周四上午9點,舊金山某處出現了一個不同尋常的情景——一群衣著隨便的人,大多是男性,在諾布山的一個美術舞廳里閒逛了起來。很快,他們三三之間組成了小組。

接下來的話題相當直接:你最喜歡的編程語言是什麼?你最擅長哪種數據分析框架?更微妙的是,談話逐漸轉向了Kaggle.com的排名,這個網站把數據科學變成了一種運動。

這200多名與會者是從Kaggle.com網站的頂級梯隊中選取的,他們組成多個小組,在線下進行8個半小時的數據處理挑戰。這是波瀾創業公司Logicai組織的一個名為Kaggle Days的活動的一部分,該活動旨在為該網站愛好者提供交流和離線競爭的場景。

參賽者從一家匿名汽車零部件製造商那里得到數據,通過這些數據,他們要預測工廠產出中的不良批次。其中有一個團隊非常特別,因為它將公然採用「欺騙」手段:這個由3名Google研究員組成的小組不打算自己上場,而是用一款名為AutoML的AI軟件參與競爭。

這麼做的目的是為了探究一個越發火熱的問題:AI會如何影響人類?

這些年AI的快速發展,使人們對其替代人類工作的擔憂越來越多,不過,此前,人們主要關注內容簡單、社會地位較低的工作崗位,如卡車司機和商店收銀員。但暫時還很少人思考,AI可以替代人類到什麼地步?一些高技術含量、高智力要求的崗位是否會被AI占據?

在比賽進行到90分鐘後,參與者都已經拿到關鍵數據,找到了喜歡工作地點,除了幾個人躲在旅館安靜的角落里之外,大多數人選擇擠在2個沒有窗戶的舞廳里,俯身看筆記本電腦,他們可以隨時領取咖啡和能量豐富的小吃,現場的網路連接也很好。

在其中一個舞廳中,Kaggle.com上排名第一的「大師」伊格洛維科夫(Vladimir Iglovikov)站在一旁,為那些需要幫助的競爭對手提供建議。他表示,這個網站給了他很大幫助,包括幫他收集機構處理數據和為Lyft開發自動駕駛汽車視覺系統等。

現場樹立著一塊大螢幕,上面是比賽即時排行榜,參賽的工程師就在這塊大螢幕的陰影下辛勤工作。工程師們通過向網站提交代碼進行測試來衡量他們在比賽中的成果,分數會實時顯示在螢幕上。

對於AI可能取代頂尖編程人員這一點,伊格洛維科夫表示懷疑,在場的大多數人也都認為,AI軟件不可能與世界頂尖數據科學迷的創造力相媲美。

不過他可以看到自動化AI在公司內部具有破壞性。他說:「我可以用電腦工作取代我自己的一些工作。」那些因為缺乏專業知識或資源而很少使用數據科學的公司,將成為最大受益者。

11點多,讓人震驚的結果出現了,AutoML提交了第1個自動生成的代碼,在排行榜上名列第2,領先了絕大多數人。但這對於Google團隊來說一點都不奇怪,該軟件是3年前他們花巨資發明的,一開始的目的就是要替代自己部分工作。很快,這個初始階段的AI在自己的工作範圍內,已經可以做得比人類好。

許多AI技術都是從被稱為神經網路的程序中衍生出來的,這些網路以受人腦神經元啟發的方式處理數據。Google超強的AI程序,部分來自於研究人員基於神經網路創造出的新形狀或架構。

AutoML地獨到之處在於,它能夠自動生成和測試新神經網路架構。Google工程師發現,憑借這一點,隨著時間的推移,這個軟件過程可以創造出比人類創造的更強大、更有效的模型。如今,圖像識別軟件ImageNet精確識別物件的神經網路算法,就是由神經網路而非人類設計的。

2018年,Google雲計算部門發布了商用版本的AutoML,幫助其他人創建自定義圖像識別軟件。上周比賽的前一天,該公司宣布該版本現在可以處理視頻和表格格式的數據。

不過,在諾布山比賽中,Google團隊使用的是該軟件的研究級版本,而非商用版本。中午前不久,他們提交了第2套代碼,並取得了領先。這個成績超出了他們的預期。根據過去的比賽經驗,比賽時長通常以月而非小時為單位,他們一開始設定的目標只是排在前10%。

到下午3:30時,AI的領先已經達到看似難以追趕的程度。不過,它此後沒能延續強勢,被人類逐漸追上。當參賽者在下午5:30集合觀看最後得分時,現場爆發出一種由衷而欣慰的歡呼——人類贏得了冠軍。那麼AI排第幾呢?第2。

冠軍組合是當天早上才第1次碰面的2人組,其中一人是SONY的數據科學家艾庫特魯格(Erkut Aykutlug),另一位是Exosite的軟件工程師彭(Mark Peng)。後者對Google的AI軟件了如指掌,這可能是他們取勝的原因之一。他們構建了多種模型來檢驗數據集,模型產生的不同結果最終激發出更好的方法來處理丟失數據值等問題。

「我不認為AutoML能取代數據科學家,」彭一開始表示。他認為,要讓AutoML變得實用及強大,消耗的資源將得不償失。Google則持不同的觀點,他們認為可以通過提高內部AI晶片的能力,使AutoML變得更智能、更便宜。當彭了解公司項目的雄心壯志時,他不禁驚嘆,「這太瘋狂了」。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!