尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
雖然自動駕駛技術的革命性不容置疑,但不管是伺機反擊的傳統汽車品牌,還是新入場的科技巨頭們,似乎在這項技術的預測準確性上都有失水準,如果不是眼見大家都在真金白銀地投入研發,像自動駕駛這樣一再跳票,恐怕很難再取得這個世界的信任了。
實際上,如果當初你無條件地相信各位CEO的預測,一輛全自動駕駛的汽車離你可能只有幾個月的時間,而現在擺在眼前的事實顯然並非如此。2015年,Elon Musk預測到了2018年他就能帶來一輛全自動駕駛的特斯拉,我們並不需要常規性地嘲笑他的不靠譜,畢竟,當時處於同一樂觀陣營的,還有Google。
現在,Delphi和MobileEye的Level 4自動駕駛系統定於2019年出街,而同年Nutonomy計劃在新加坡街頭做到自己部署數千輛無人駕駛計程車的承諾。通用汽車也宣布將在2019年開啟全自動駕駛汽車的生產——這種車型沒有方向盤也不允許駕駛者干預。這一系列的規劃背後當然有相當規模的資金予以支撐,但是,有個前提,軟件的發展必須得跟上這個行業想像的速度。
撇開自動駕駛面臨的道德困境不談,一味地升級計算機影像和機械操作等環節似乎在技術上對自動駕駛的推動比較緩慢,在這種局面下,相信把自動駕駛技術進階的希望寄托在AI(人工智能)身上的人應該不在少數,畢竟數據處理是決勝的關鍵陣地。
但是,AI真的像我們想像的對自動駕駛那麼友好嗎?
從表面上看,做到完全的自動駕駛似乎比以往任何時候離我們都近:Waymo在亞利桑那州的測試雖然範圍有限,但的確是在公共道路上完成了測試。特斯拉和很多跟隨者已經開發並開始出售在一定條件下工作的自動駕駛輔助系統,如果發生任何意外情況,這些系統也會允許司機進行干預。盡管這些系統不可避免地會出現一些問題,有些甚至是致命的,比如為大家所熟知的Uber的事故。但在技術邏輯正確的前提下,只要系統能夠正常進化,看起來我們離無需對系統進行干預這一天似乎不會太遠了。
但事實上,完全自動駕駛的做到可能比我們想像的更遠。AI專家越來越擔心,在自動駕駛系統能夠可靠地避免事故之前,可能還有數年甚至數十年的路要走。隨著已經做到了自動學習和訓練的系統開始真正面對現實世界的混亂,像紐約大學的Gary Marcus這樣的專家正準備開始意料之中的痛苦的重新校準,這種糾偏被稱為「人工智能的冬季(AI Winter)」。這種也許是汽車行業意料之外的技術延遲,可能會給那些高度依賴自動駕駛技術的公司帶來災難性的後果——讓整整一代人與完全的自動駕駛徹底無緣。
其實,我們很容易理解為什麼汽車公司對自動駕駛持有如此樂觀的態度。在過去十年中,深度學習——一種使用分層機器學習算法從海量數據中提取結構化信息的方法,已經在人工智能領域和技術行業中取得了以前幾乎無法想像的進步。不管是Google搜尋,Facebook新聞Feed還是會話式語音識別算法,背後都有深度學習的賦能。而在互聯網之外,我們使用深度學習來偵測地震、預測心臟病以及做到無數原本看來不太可能的創新。
但如我們所知,深度學習需要大量的訓練數據才能正常工作,這些數據需要包含算法將遇到的每一類場景。例如,像Google Images這樣的系統非常善於識別動物,前提是必須有足夠的數據來向系統展示每種動物的樣子。Marcus將這種任務描述為「插值」,對所有標記為某種動物的圖像進行識別和比對,並確定新圖片是否屬於該組。
工程師可以在數據來自何處以及如何構建數據架構時表現出自己的創造性,但對給定算法可達到的邊界卻必須設置嚴格的限制。相同的算法無法識別豹貓,除非它看到成千上萬張豹貓的照片——即使系統看到過無數家貓和美洲虎的照片,並且知道豹貓是一種介於兩者之間的動物。這個過程我們稱之為「概括」,這其實是一套完全不同的技能。
長期以來,研究人員認為他們可以通過正確的算法提高系統的概括技能,但最近的研究表明,傳統的深度學習在做「概括」工作時比我們想像的更糟糕。一項研究發現,傳統的深度學習系統甚至在同一視頻的不同幀上進行識別時都會出現問題,背景中一點微小的變化會讓系統將同一只北極熊標記為狒狒,貓鼬或黃鼠狼。
Marcus指出聊天機器人熱潮就是一個典型的炒作「概括」技能的例子。「我們曾經以為到2015年就能看到讓我們滿意的聊天機器人,」他說,「但顯然我們並沒有成功,因為這不僅僅是個收集數據的問題。」當你在網上與一個人交談時,你不僅僅想要對方能夠隨時回憶起早期的對話,還希望他們能夠有針對性地回應你,並利用更普適性的會話技巧來產生與你之間的一些獨有的互動。而就我們現在了解的情況,深度學習還無法產生這種理想中的聊天機器人。
這讓對深度學習寄予厚望的特斯拉和其他探索自動駕駛技術的企業面臨一個可怕的問題:利用深度學習賦能的自動駕駛技術會像圖像搜尋,語音識別和其他人工智能的成功案例一樣逐漸進化並最終成功,還是會遇到像聊天機器人同樣的門檻?自動駕駛技術到底應該歸類於插值問題還是概括問題?駕駛,到底有多難預測?