尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
論文一:
論文標題: DeLS-3D: Deep Localization and Segmentation with a 3D Semantic Map,
DeLS-3D: 基於三維語義地圖的深度定位和分割
論文摘要:
在類似增強現實和自動駕駛的應用中,自定位/相機姿態可能(self-localization/camera pose Estimation)和場景解析都是關鍵的技術。在本論文中,我們提出了一個統一的框架來同時解決這兩個問題。為了做到系統的穩健性和效率,我們設計了獨特的傳感器融合方案。
該方案融合了錄影機視頻、運動傳感器(GPS/IMU)和三維語義地圖。具體地說,我們首先從消費級的運動傳感器(GPS/IMU)中獲得一個初始的粗略相機姿態,基於此姿態和三維語義地圖可以渲染出標籤圖像。然後,將渲染出的標籤圖像(rendered label map)和RGB圖像共同輸入到姿態卷積神經網路中,從而獲得糾正過相機姿態。
此外,為了融合時間信息,我們進一步採用了多層循環神經網路(RNN)提高了姿態精度。最後,基於循環神經網路的輸出的姿態,我們渲染新的標籤圖像並且聯同RGB圖像一起被輸入到用於分割的卷積神經網路中,該卷積神經網路輸出像素級別的語義標籤。為了驗證我們的方法,我們用配準過的三維點雲和視頻圖像構建了一個數據集。點雲和圖像都具備語義標籤。每個視頻幀都有來自高精度運動傳感器的地面真實姿態。我們發現在實際應用中,單靠圖像的姿態可能網路可能會由於街景的混淆而失敗,因此多傳感器融合是非常重要的。最後,我們進行了各種消融研究,驗證了該系統的有效性。特別地,我們證明了場景解析和姿態可能對於做到一個更加穩定和精確的系統是相互有利的。
論文二:
論文標題: CrowdMove: Autonomous Mapless Navigation in Crowded Scenarios,CrowdMove: 擁擠場景中自動無地圖導航
論文摘要:
導航是移動機器人必不可少的能力。在本文中,我們提出一個通用和有效3M(多機器人、多場景、多階段)訓練框架。
我們使用了魯棒的策略梯度算法(policy gradient algorithm)來優化無地圖導航策略。我們的方法可用於不同類型的移動平台,並且能夠在複雜和高度動態的環境中安全導航,例如擁擠的人群。為了證明我們的方法的優越性,我們在四種移動平台上並在四種場景中測試了我們的方法。
以上兩篇論文均來自於百度機器人與無人駕駛實驗室,並與論文作者團隊經過內容確認。
親愛的數據
出品:譚婧
美編:陳泓宇