GluonCV是分布式机器学习社区(DMLC)发布的深度学习计算机视觉工具箱,提供了计算机视觉顶级的算法实现与基本运算(另一个是自然语言处理工具箱GluonNLP).
GluonCV简单易用,有很多训练好的模型,通过一行代码就可以下载使用,非常方便.
由于GluonCV是基于MXNet,所以,要先安装MXNet:
pip install mxnet
然后,再安装GluonCV:
pip install gluoncv
GluonCV包含了分类、检测、语义分割等多种计算机视觉应用的模型.下面,以目标检测Faster-RCNN模型为例,说明怎样下载并调用GluonCV的模型.
定义网络:
net = model_zoo.get_model('faster_rcnn_resnet50_v1b_voc', pretrained=True)
其中,'faster_rcnn_resnet50_v1b_voc'为模型名称,pretrained=True表示使用预训练的模型,也就是直接下载GluonCV已经训练好的模型.如果已经下载了,就直接使用,不会再次下载.
定义用到的图片:
im_fname = ['C:\Users\hadoop\.mxnet\models\aa554c60229540cfb4d4999f72134bcb_th.jpg']
对图片进行处理:
x, orig_img = data.transforms.presets.rcnn.load_test(im_fname)
使用网络进行推理:
box_ids, scores, bboxes = net(x)
绘制推理结果:
ax = utils.viz.plot_bbox(orig_img, bboxes[0], scores[0], box_ids[0], class_names=net.classes)
plt.show()
运行结果:
更多资料,可以参考https://gluon-cv.mxnet.io/contents.html.