这里记录在学习SSD源码过程中用到的相关内容
keras.applications.imagenet_utils.preprocess_input():
用来将读入的原始图片张量转换成为需要Imagenet网络识别的形式,源码显示的是进行通道的转换以及减去各个通道均值,这个均值应该是ImageNet上面训练数据集上的均值。
keras.preprocessing.image:
包含了对图像预处理的一些基本操作,也是最常用的操作。
SciPy中的io 和misc是常用的模块,imsave可以将一个数组格式保存成为图片的形式来进行显示。
numpy中可以使用np.set_printoptions(suppress=True)来设置禁止对小数使用科学计数法,同时可以设置相应的精度信息。
tf.ConfigProto
一般用在创建session
的时候。用来对session
进行参数配置,可以设置一些关于session的相关信息。
tf.imgae中提供了若干个图像处理相关的函数,tf.image.non_max_suppression(boxes,scores,max_output_size,iou_threshold,name)