尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
為了在城市環境中高效運行,移動機器人和其他自主系統應該能夠在人行道上安全移動並避免與行人或其他障礙物發生碰撞。對於專門為巡邏城市環境而編程的送貨機器人或系統來說尤其如此。
佐治亞理工學院和史丹佛大學的研究人員最近開發了 AlienGo,這是一種四足機器人,可以遵循公共地圖服務生成的特定路線,同時保持在人行道上並避免與障礙物或人類發生碰撞。這個機器人在 arXiv 上預先發表的一篇論文中提出,它基於一個新的、高性能的兩階段學習框架,用於安全人行道導航。
機器人在現實世界中自主導航現實世界的障礙軌跡。圖片來源:索羅金等。
「作為這個項目的一部分,我們開發了一種智能四足機器人,可以在現實世界中的人行道上導航,」進行這項研究的研究人員之一 Sehoon Ha 告訴 TechXplore:「我們的工作受到現有工作的兩個分支的啟發:自動駕駛和室內機器人導航。然而,由於室外人行道導航通常發生在沒有任何引導車道的各種行人和障礙物的非結構化環境中,我們還提出了一套學習技術和算法來解決這些特定的挑戰。」
最初,該團隊訓練了一個人工神經網路,以在模擬中導航簡單的人行道環境。第一個被稱為「專家」的算法是使用高速顯著世界模擬器進行訓練的,並且可以拜訪模擬的所謂「特權狀態」。
隨後,這個「專家」網路在高保真模擬中將它學到的行為轉移到「學生」算法中。最終,這個「學生」網路產生了逼真的傳感器觀察結果,類似於現實世界的人行道圖像。
「‘學生’使用自定義訓練的語義特征網路生成抽象,隨後用於控制機器人,」參與該研究的另一位研究員 Maks Sorokin 說:「這種方法基於我們的經驗,即使用幼稚的端到端訓練很難獲得所需的行為,僅僅是因為問題太難了。」
使用他們開發的兩階段學習框架,Ha、Sorokin 和他們的同事能夠在模擬中使用「特權」資訊獲得有效的策略,然後將框架獲得的行為轉移到真正的四足機器人上。當團隊評估該框架後,他們發現它在人行道導航方面的性能優於其他最先進的模型。然後,他們還在真實環境中測試了他們的框架,將其應用於在亞特蘭大的人行道上導航的 AlienGo 機器人。
機器人在現實世界的戶外自主導航各種現實世界的人行道。圖片來源:索羅金等。
為了在城市環境中高效運行,移動機器人和其他自主系統應該能夠在人行道上安全移動並避免與行人或其他障礙物發生碰撞。對於專門為巡邏城市環境而編程的送貨機器人或系統來說尤其如此。
佐治亞理工學院和史丹佛大學的研究人員最近開發了 AlienGo,這是一種四足機器人,可以遵循公共地圖服務生成的特定路線,同時保持在人行道上並避免與障礙物或人類發生碰撞。這個機器人在 arXiv 上預先發表的一篇論文中提出,它基於一個新的、高性能的兩階段學習框架,用於安全人行道導航。
機器人在現實世界中自主導航現實世界的障礙軌跡。圖片來源:索羅金等。
「作為這個項目的一部分,我們開發了一種智能四足機器人,可以在現實世界中的人行道上導航,」進行這項研究的研究人員之一 Sehoon Ha 告訴 TechXplore:「我們的工作受到現有工作的兩個分支的啟發:自動駕駛和室內機器人導航。然而,由於室外人行道導航通常發生在沒有任何引導車道的各種行人和障礙物的非結構化環境中,我們還提出了一套學習技術和算法來解決這些特定的挑戰。」
最初,該團隊訓練了一個人工神經網路,以在模擬中導航簡單的人行道環境。第一個被稱為「專家」的算法是使用高速顯著世界模擬器進行訓練的,並且可以拜訪模擬的所謂「特權狀態」。
隨後,這個「專家」網路在高保真模擬中將它學到的行為轉移到「學生」算法中。最終,這個「學生」網路產生了逼真的傳感器觀察結果,類似於現實世界的人行道圖像。
「‘學生’使用自定義訓練的語義特征網路生成抽象,隨後用於控制機器人,」參與該研究的另一位研究員 Maks Sorokin 說:「這種方法基於我們的經驗,即使用幼稚的端到端訓練很難獲得所需的行為,僅僅是因為問題太難了。」
使用他們開發的兩階段學習框架,Ha、Sorokin 和他們的同事能夠在模擬中使用「特權」資訊獲得有效的策略,然後將框架獲得的行為轉移到真正的四足機器人上。當團隊評估該框架後,他們發現它在人行道導航方面的性能優於其他最先進的模型。然後,他們還在真實環境中測試了他們的框架,將其應用於在亞特蘭大的人行道上導航的 AlienGo 機器人。
機器人在現實世界的戶外自主導航各種現實世界的人行道。圖片來源:索羅金等。