若派發布了SSD神經網路訓練工具 讓若派帶你解讀SSD神經網路

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

若派發布了SSD神經網路訓練工具,基於SPR2801S的神經網路計算棒,可以高效的做到目標檢測、分類等視頻結構化應用。

做AI人工智能,不提SSD,那都是不入流。SSD目標檢測算法,在速度上,比之前最快的YOLO還要快;在檢測精度上,可以和Faster RCNN相媲美,是視頻結構化的應用中必不可少的深度學習的目標檢測算法。對SSD的理解:

1、SSD提供了一種用於目標檢測的方法,僅僅使用了一個深度神經網路。

–這是相對於RCNN的訓練來說的,因為對於Faster Rcnn,需要訓練RPN網路以及fast rcnn網路。

2、SSD的特別之處:

–它把最終要輸出的bounding box預先固定在默認設置好的特徵圖上,意思是你給網路輸入一個圖片,它肯定會產生很多特徵圖,而我就在特徵圖上預先聲明好很多box,你最後要得到的bounding box就是從已經聲明好的box里挑出來的,當然不是直接拿來就用,而是把挑到的box進行調整。

–還強調了一點,這些預先設定的box形態各異,因為圖片上的物體有各種形狀,為了使得能更快的更精確的調整box使其能與圖片上的物體的形狀更吻合,所以先設定長寬比例不同的box。

3、SSD的預測:

–在預測階段呢,操刀的地方就是預設的那些box,對這些box覆蓋的區域進行分類,比如21類,分類的話肯定會產生每一類的得分是多少。

–除了預測分類任務,還要調整這些box的大小及形狀,就得到了物體的位置,也就是我們看到的框框。

4、對於大小不一的物體怎麼統一檢測呢?

–SSD說,它採用了從不同「分辨率」的特徵圖上設置預設box的方法,我直覺上感覺它說的道理行得通。

5、SSD的自我總結:

–我跟YOLO一樣簡單都是a single-shot detector formultiple categories,但是我比它快,比它精確,還有,我承認Faster Rcnn很精確,但是我比它快。

–我的核心科技在於我是對那些預設的固定數目的box進行分類評分和預測其新位置的,請注意,這些box分布在不同尺寸的特徵圖上,還有,這些box也是形態各異的。

6、SSD網路的結構:

–分為兩個部分,前面的是標準的高質量圖片分類,但是去掉了分類層,在SSD中叫它base network,但是base network滿足不了SSD, 所以:add auxiliary structure to the network to produce detectionswith the following key features

7、那上面提到的 auxiliary structure都是什麼?

–Multi-scalefeature maps for detection,就是在base net後邊加上卷積特徵層,這些層的尺寸依次減小,這就相當於做到了在multiplescales feature上detection。

–Convolutionalpredictors for detection ,前面提到的base net及multiple scales feature maps fordetection能產生固定數目的detection predictions,而要進行predictors for detection的話用的是3x3xp的small kernel,用於對分類評分及對default box計算應該進行的偏移量。

若派致力於人工智能產業化,推動人工智能產品落地應用。基於人工智能開發方案,若派提供了演示,提供了包括CNN運算加速晶片、神經網路計算棒、AI內置模塊、PCIe等多種形式的開發平台。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!