环境:
- pop_os(ubuntu18)
- cuda9
- opencv3.2
- GTX1070
darknet框架
官方网站:https://pjreddie.com/darknet/
编译框架可能要根据自己的需要更改Makefile(我就根据我自己的情况更改了链接路径,因为我的opencv和cuda安装路径有点不一样)
yolov3-voc网络训练
参考博客:https://blog.csdn.net/just_sort/article/details/81389571
关于yolov3-voc.cfg的配置:https://blog.csdn.net/lilai619/article/details/79695109
说明:
- 冲量和学习率就按照0.9 和0.001就好了不需要修改
- Region 82/Region 94/Region106 这3个方向只要不是全部nan就可以,没问题
- 训练信息输出,有一行跟上面不一样的,最开始的是iteration次数,然后是train loss,然后是avg train loss, 然后是学习率, 然后是一batch的处理时间, 然后是已经一共处理了多少张图片。 重点关注 train loss 和avg train loss。
- 前100次迭代可能会有loss增大的现象。当然各个时候都会有loss变大的现象,原因是加了冲量,不要急,最后会降低的。
- 如果训练途中爆显存了,就把random关掉,设置为0。这样显存就一直在4G左右不会往上涨