尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
機器人緊緊地抓住門把手,或者把塑膠香蕉投進碗中,亦或是用力在金屬箱附近推動樂高積木……
如果您參觀過加州大學伯克利分校 Sergey Levine 教授的實驗室,您可能會看到這樣一些場景。
Sergey Levine 的機器人實驗室也許有一天會成為機器人的「遊樂場」。
機器人為什麼會玩耍?因為智慧就體現在生物通過戳東西、推動物體和觀察發生的事情來了解自己的物理環境。
Levine 解釋說:「證明智慧存在的唯一證據是在人類身上,而人類存在於物質世界中,是具體化的。事實上,我們所知道的所有智慧生物都是具體化的。也許他們不必如此,但我們並不知道例外情況。」
因此,更廣泛地講,「我認為機器人實際上是人工智能的一個透視鏡」,他說道。
機器訓練也應遵循「達爾文進化論」
Levine 認為,多年來,人們從機器人技術上得到的重大收獲之一便是,它證實了「莫拉維克悖論」(Moravec’s paradox)。
卡內基梅隆大學機器人學教授 Hans Moravec 在其 1988 年出版的《智力後裔:機器人和人類智能的未來》(Mind Children: The Future of Robot and Human Intelligence) 一書中談到了 AI 的二分法。
機器可以被教會做「人類覺得困難的事情」,比如對戰一局國際象棋。但機器在「對我們來說輕而易舉的事情」上做得卻不盡人意,比如基本的運動技能。
Levine 表示:「如果您想讓一台機器下國際象棋,這實際上會相對容易些。但如果您想要一台機器來拾起棋子,卻難於上青天。」
Moravec 把這種二分法看成是一條可製造智能機器的「重大線索」。他主張遵循達爾文進化論的路線來構建智能。也就是說,先從基本的感覺運動系統逐步發展,自下而上,然後才是更高的推理能力。
缺乏機器學習的現成數據
有人要喝咖啡嗎?教機器學習可以創造能夠與人類一起生活和工作的機器人。
與網上無數的貓圖片不同,目前還沒有可供機器人學習的現成數據。因此,他的實驗室專注於讓機器「連續幾周探索環境,自主地推動物體、操控物體,然後了解所處的世界」。
Levine 使用各種機器學習技術來訓練機器人,包括 CNN,尤其使用了增強學習,即通過從當前狀態推斷到目標狀態來規劃抵達目的地的路徑。然後,機器人在測試時使用該策略來執行這些任務的新實例。
在訓練階段,玩物體遊戲是「無人監督的」。目前人類尚未設計出機器人在執行任務時應該做出的精確動作,甚至也未指定目標。
神經網路確定了機器人應該做到的目標,然後確定了用於做到該目標的策略,包括機器人肢體的運動角度。
「學會學習」
場外訓練利用了 NVIDIA GPU 集群。在測試期間,每個機器人都連接一個 GPU,用於運行已學習到的策略。在一些更具挑戰性的測試中(例如通過觀看一段人類的視頻演示來學習一項新策略),每台機器都連接了功能更強大的 NVIDIA DGX-1。
Levine 表示,GPU 計算能力為 AI 帶來兩大好處。通過加速訓練,它「允許我們更快地進行科研工作。」其次,在推理過程中,GPU 的強大功能可以實時做出反應,這對「機器人來說至關重要」。
「當機器人真正處於物質世界中時,如果它正在運動,例如閉門飛行,」類似無人機的情況,「它需要在撞到門之前弄清楚門是關著的。」
Levine 團隊在增強學習方面的工作變得越發複雜。其中之一便是,教會機器人在測試時執行任務,就像它在訓練中學到的那樣。更具挑戰性的是,讓機器人學習能夠解決新奇任務的策略。Levine 稱,機器正在「學會學習」。
後者稱為元學習(meta-learning),是他實驗室日益關注的焦點。在近期發表的一篇名為《復合視覺運動任務的一次性分層模仿學習》(One-shot Hierarchical Imitation Learning of Compound Visuomotor Tasks) 的論文中,機器人首先觀察人類演示一個簡單的「原始」任務,比如將物體扔進碗中。它制定了一項策略來模仿該動作。
在測試時,機器人將從事一項「復合」任務,比如將物體扔進碗中,然後沿著桌子移動碗。機器人利用其先前處理簡單任務掌握的經驗,形成一「系列」策略,並借此來連續執行動作。
伯克利人工智能研究實驗室也參與了我們的 NVIDIA AI 實驗室計劃。
Levine 的機器人僅在看到人類演示一次復合任務後,就能夠模仿人類所演示的任務,這就是所謂的「一次性」學習。
機器人的成長
Levine 非常留意對 AI 持懷疑態度的人,比如紐約大學教授 Gary Marcus。Levine同意 Marcus 的觀點,即今天的深度學習並不會帶來更高的推理能力。
形成更高的推理能力可能是機器人生命周期中的一個過程,而不是單個神經網路。
他說:「我認為,如果未來機器人也能像我們一樣擁有童年,那將是一件了不起的事情。」這樣,機器人會通過各種發育階段來取得進步。
Levine 若有所思地說,在最終的成年期,機器人的心智將會繼續發展。
「如果你有個機器人須執行某種任務,比如進行施工。在停歇時,這個機器人不會只是坐在小房間里收拾塵土,實際上,它做事情的方式會和人類一樣。」
回歸現實
要使機器人能自行發育,我們還需從事大量的系統工程工作,並將其與深度學習相結合。但 Levine 相信,「在未來五年左右的時間里,我們將看到這些事情成為現實。」
「它可能從工業機器人開始,比如倉庫、雜貨店的機器人。但我認為我們會在日常生活中看到越來越多的機器人。」
轉載自微信號NVIDIA_China