一,首先我们要考虑的是
1. 明确开发环境(python版本,深度学习框架选择)
2. 设计算法,建立模型
3. 训练模型(数据集参考VOC、COCO、cityscapes-image-pairs及Semantic Segmentation for Self Driving Cars等)
4. 测试(测试视频自备)
5.可视化界面
二,要求
- 分类和定位。针对10分钟1080P视频内容进行移动目标识别(包括人、机动车、非机动车、建筑、植物等5种以上)
- 语义分割。实现对高清视频图像语义分割(对每帧的每个点的类别预测)
- 重点实现对建筑物等固定目标的识别和分割
- 中等要求,实现移动目标10种识别,其中建筑物必须识别