尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
Scene Text Image Transformer是用於場景文本數據增強的工具。 我們提供的工具可以避免過度擬合併獲得模型的穩健性。
目前我們專注於裁剪場景文本圖像的形狀。 檢測和識別任務的下一個版本將在稍後發布。
項目地址:
https://github.com/Canjie-Luo/Scene-Text-Image-Transformer
環境要求
- GCC 4.8.*
- Python 2.7.*
- Boost 1.67
- OpenCV 2.4.*
我們推薦使用 Anaconda去管理你的依賴環境。例如:
conda installboost= 1.67.0
安裝
建立目錄:
mkdirbuild
cdbuild
cmake -D CUDA_USE_STATIC_CUDA_RUNTIME=OFF ..
make
將Augment.so復制到目標文件夾,然後按照demo.py的樣例使用該工具。
cpAugment. so..
cd..
pythondemo. py
演示
- Distortion – 變形
- Stretch – 伸展
- Perspective – 透視
速度
使用2.0GHz的CPU轉換大小(H:64,W:200)的圖像僅需3ms不到。 可以通過動態調用多進程批處理睬樣器來加速該過程,例如在PyTorch中設置“num_workers”。
識別上的改進
我們比較了僅使用相應的小訓練集訓練 CRNN的準確性。
數據集
IIIT5K
IC13
IC15
沒有數據擴充
40.8%
6.8%
8.7%
有數據擴充
53.4%
9.6%
24.9%
引用
@inproceedings{schaefer2006image,
title={Image deformation using moving least squares},
author={Schaefer, Scott andMcPhail, Travis andWarren, Joe},
booktitle={ACM transactions ongraphics (TOG)},
volume={ 25},
number={ 3},
pages={ 533— 540},
year={ 2006},
organization={ACM}
}
致謝
該工具是@cxcxcxcx’simgwarp-opencv和 @Yati Sagade’sopencv-ndarray-conversion的結合。 謝謝你們的貢獻。
代碼主要提交者:Canjie-Luo,來自SCUT DLVC-Lab(華南理工大學深度學習與視覺計算實驗室)
注意事項
該工具僅用於學術研究目的。
【AI求職百題斬】已經悄咪咪上線啦,還不趕緊來答題?!