動機:想要用 Caffe 來訓練及測試自己的圖檔(.jpg)資料,要如何實作呢?!
準備環境:
1.OS: Windows 10 x64
2.GPU: GeForce RTX 2070 with Max-Q Design
3.CUDA: 8.0.60
4.Python 2.7.16 (Miniconda 2.7 for Windows 64-bit)
5.Conda: 4.8.1
操作步驟:
1.準備 Dataset資料集: 筆者選了12種藥品以手機拍照並以數字為其分類目錄名稱,如下圖
圖檔分享於此~ https://drive.google.com/file/d/15vah7CRz5h0C34IZ8ar9OL9H9q4dfMWB/view?usp=sharing
2.製作標籤+檔案路徑文字檔:依據 參攷1. 的作法,撰寫 批次檔 來抓取目錄下的檔名,再以 Notepad++的取代(Ctrl+H)工具,以目錄的數字來編輯標籤代號,如下圖
個別目錄標籤文字檔做好後,再將其彙整在一起,如下圖
3.製作 訓練、測試資料集:運用上述第2.項的 all.txt 再以Notepad++的區塊選取功能(Alt+Left Mouse)來加入路徑,如下圖
並依照 70/30 比例,區分 訓練(70) 及 測試(30) 兩個檔案
train.txt 文字檔分享於此~ https://drive.google.com/file/d/1DD9l0D14XEKypP0QtrKjtbS2iYABBJcZ/view?usp=sharing
test.txt 文字檔分享於此~ https://drive.google.com/file/d/1VBC5bPD3jK0jUifRHvi3C9DC0rcCd5ET/view?usp=sharing
4.轉換 mdb 資料: 依照 訓練、測試文字檔來轉換,內容如下
train: https://gist.github.com/dvsseed/76daf834af263cd4c571ca5106bf0469
test: https://gist.github.com/dvsseed/f90ae2d76281856836285ef6affd8aef
5.執行 二進制均值計算: 內容如下
https://gist.github.com/dvsseed/f32c867a537a38395ce42545334cd340
執行結果如下
6.修改 AlexNet 網路模型參數: 內容如下
deploy.prototxt文字檔分享於此~ https://gist.github.com/dvsseed/e8ea9d670c856bfb632b489516f3d8f5
7.執行 AlexNet 網路模型訓練: 內容如下
https://gist.github.com/dvsseed/9762c66f5842d70a859845d8fcd604a7
solver.prototxt文字檔分享於此~ https://gist.github.com/dvsseed/b244b58a0cbba463d113ebc369017ef4
train_val.prototxt文字檔分享於此~ https://gist.github.com/dvsseed/9b957eccd803005c6cdcd6ab73b59f3c
執行結果(max_iter: 30000,即執行 iteration=30,000 時停止)如下
8.執行 分類預測: 內容如下
https://gist.github.com/dvsseed/0dcd0a34c0f7e4d8442a40eefaae638e
執行預測的結果其實不是很好,可能的原因是藥品圖片的背景太雜亂(雜訊太多)...要如何改善就端賴看倌們各憑本事了!!!
心得:或許有人會問筆者,之前不是有成功在 Python3+CUDA10.0+VS2015 上安裝過 Caffe 嗎?!為何不用呢?!哈哈哈,這個大哉問的答案是...在前述的環境中,有部分C++源碼是無法成功在 VS2015 上編譯的,加上筆者以同樣的 DataSet 及 Model 執行訓練+測試 比較,竟然在原始 Caffe + Python2.7 的版本中跑分較準確,因此,當本主題實作時,請問看倌您會選擇那一種呢?!筆者想當然爾是選準確率較高的組合呀!!!
參攷:
1.caffe训练测试(用caffe训练自己的数据), https://blog.csdn.net/qq_36492210/article/details/80430237
2.如何使用 Notepad++ 的區塊選取功能, http://allen0818.pixnet.net/blog/post/114690014-%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8-notepad%2B%2B-%E7%9A%84%E5%8D%80%E5%A1%8A%E9%81%B8%E5%8F%96%E5%8A%9F%E8%83%BD
3.caffe学习系列:训练自己的图片集(超详细教程), https://blog.csdn.net/qq_27923041/article/details/54139887
準備環境:
1.OS: Windows 10 x64
2.GPU: GeForce RTX 2070 with Max-Q Design
3.CUDA: 8.0.60
4.Python 2.7.16 (Miniconda 2.7 for Windows 64-bit)
5.Conda: 4.8.1
操作步驟:
1.準備 Dataset資料集: 筆者選了12種藥品以手機拍照並以數字為其分類目錄名稱,如下圖
圖檔分享於此~ https://drive.google.com/file/d/15vah7CRz5h0C34IZ8ar9OL9H9q4dfMWB/view?usp=sharing
2.製作標籤+檔案路徑文字檔:依據 參攷1. 的作法,撰寫 批次檔 來抓取目錄下的檔名,再以 Notepad++的取代(Ctrl+H)工具,以目錄的數字來編輯標籤代號,如下圖
個別目錄標籤文字檔做好後,再將其彙整在一起,如下圖
3.製作 訓練、測試資料集:運用上述第2.項的 all.txt 再以Notepad++的區塊選取功能(Alt+Left Mouse)來加入路徑,如下圖
並依照 70/30 比例,區分 訓練(70) 及 測試(30) 兩個檔案
train.txt 文字檔分享於此~ https://drive.google.com/file/d/1DD9l0D14XEKypP0QtrKjtbS2iYABBJcZ/view?usp=sharing
test.txt 文字檔分享於此~ https://drive.google.com/file/d/1VBC5bPD3jK0jUifRHvi3C9DC0rcCd5ET/view?usp=sharing
4.轉換 mdb 資料: 依照 訓練、測試文字檔來轉換,內容如下
train: https://gist.github.com/dvsseed/76daf834af263cd4c571ca5106bf0469
test: https://gist.github.com/dvsseed/f90ae2d76281856836285ef6affd8aef
5.執行 二進制均值計算: 內容如下
https://gist.github.com/dvsseed/f32c867a537a38395ce42545334cd340
執行結果如下
6.修改 AlexNet 網路模型參數: 內容如下
deploy.prototxt文字檔分享於此~ https://gist.github.com/dvsseed/e8ea9d670c856bfb632b489516f3d8f5
7.執行 AlexNet 網路模型訓練: 內容如下
https://gist.github.com/dvsseed/9762c66f5842d70a859845d8fcd604a7
solver.prototxt文字檔分享於此~ https://gist.github.com/dvsseed/b244b58a0cbba463d113ebc369017ef4
train_val.prototxt文字檔分享於此~ https://gist.github.com/dvsseed/9b957eccd803005c6cdcd6ab73b59f3c
執行結果(max_iter: 30000,即執行 iteration=30,000 時停止)如下
8.執行 分類預測: 內容如下
https://gist.github.com/dvsseed/0dcd0a34c0f7e4d8442a40eefaae638e
label_12.txt 文字檔分享於此~ https://drive.google.com/file/d/18pB3kIHovOkEzA3M7biXEFlRDZMT2lJN/view?usp=sharing
執行結果如下執行預測的結果其實不是很好,可能的原因是藥品圖片的背景太雜亂(雜訊太多)...要如何改善就端賴看倌們各憑本事了!!!
心得:或許有人會問筆者,之前不是有成功在 Python3+CUDA10.0+VS2015 上安裝過 Caffe 嗎?!為何不用呢?!哈哈哈,這個大哉問的答案是...在前述的環境中,有部分C++源碼是無法成功在 VS2015 上編譯的,加上筆者以同樣的 DataSet 及 Model 執行訓練+測試 比較,竟然在原始 Caffe + Python2.7 的版本中跑分較準確,因此,當本主題實作時,請問看倌您會選擇那一種呢?!筆者想當然爾是選準確率較高的組合呀!!!
參攷:
1.caffe训练测试(用caffe训练自己的数据), https://blog.csdn.net/qq_36492210/article/details/80430237
2.如何使用 Notepad++ 的區塊選取功能, http://allen0818.pixnet.net/blog/post/114690014-%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8-notepad%2B%2B-%E7%9A%84%E5%8D%80%E5%A1%8A%E9%81%B8%E5%8F%96%E5%8A%9F%E8%83%BD
3.caffe学习系列:训练自己的图片集(超详细教程), https://blog.csdn.net/qq_27923041/article/details/54139887
留言