GitHub項目推薦 | 場景文字圖像增廣工具 Scene Text Image Transformer

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

Scene Text Image Transformer是用於場景文本數據增強的工具。 我們提供的工具可以避免過度擬合併獲得模型的穩健性。

目前我們專注於裁剪場景文本圖像的形狀。 檢測和識別任務的下一個版本將在稍後發布。

項目地址:

https://github.com/Canjie-Luo/Scene-Text-Image-Transformer

環境要求

  • GCC 4.8.*
  • Python 2.7.*
  • Boost 1.67
  • OpenCV 2.4.*

我們推薦使用 Anaconda去管理你的依賴環境。例如:

conda installboost= 1.67.0

安裝

建立目錄:

mkdirbuild

cdbuild

cmake -D CUDA_USE_STATIC_CUDA_RUNTIME=OFF ..

make

Augment.so復制到目標文件夾,然後按照demo.py的樣例使用該工具。

cpAugment. so..

cd..

pythondemo. py

演示

  • Distortion – 變形
  • Stretch – 伸展
  • Perspective – 透視

速度

使用2.0GHz的CPU轉換大小(H:64,W:200)的圖像僅需3ms不到。 可以通過動態調用多進程批處理睬樣器來加速該過程,例如在PyTorch中設置“num_workers”

識別上的改進

我們比較了僅使用相應的小訓練集訓練 CRNN的準確性。

數據集

IIIT5K

IC13

IC15

沒有數據擴充

40.8%

6.8%

8.7%

有數據擴充

53.4%

9.6%

24.9%

引用

@inproceedings{schaefer2006image,

title={Image deformation using moving least squares},

author={Schaefer, Scott andMcPhail, Travis andWarren, Joe},

booktitle={ACM transactions ongraphics (TOG)},

volume={ 25},

number={ 3},

pages={ 533— 540},

year={ 2006},

organization={ACM}

}

致謝

該工具是@cxcxcxcx’simgwarp-opencv@Yati Sagade’sopencv-ndarray-conversion的結合。 謝謝你們的貢獻。

代碼主要提交者:Canjie-Luo,來自SCUT DLVC-Lab(華南理工大學深度學習與視覺計算實驗室)

注意事項

該工具僅用於學術研究目的。

【AI求職百題斬】已經悄咪咪上線啦,還不趕緊來答題?!

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!