最近在研究人工智能和图像识别技术,涉及到一个车牌号码识别的研究,网上查找到的方案有tensorflow和opencv,opencv也是比较成熟的方案,先从简单的开始,以下是关于使用opencv实现车牌号码提取的部分。
说明
本文是我学习过程的笔记,在某些的场景下的识别率较高,但是不足以在实际的商业环境上使用,因为准确率还没有达到工业水平,还需要通过调整算法,机器学习相关技术才能有较高的准确度。车牌识别不是我的最终目标,我主要是要研究人工智能和图像识别相关的技术,本文只是提供一些图像识别的思路。下面每个步骤都不是必须的,而且还有很多的优化空间,如果你参考本文做实验,可以调整不同的参数,删除部分的步骤查看效果。
整体流程
- 高斯模糊
- 图片灰度化
- Sobel算子
- 图像二值化
- 闭操作
- 膨胀腐蚀
- 中值滤波
- 查找轮廓
- 判断车牌区域
原图
高斯模糊
通过高斯模糊,可以去除部分的干扰,让识别更加准确,做实验可以屏蔽代码,看看这一步对结果的影响。
import cv2 rawImage = cv2.imread("image.jpg") image = cv2.GaussianBlur(rawImage, (3, 3), 0) # 预览效果 cv2.imshow('image', image) cv2.waitKey(0)
图片灰度化
将彩色图像转化成为灰度图像。
image = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY
Sobel算子(X方向)
图像边缘检测。
Sobel_x = cv2.Sobel(image, cv2.CV_16S, 1, 0) # Sobel_y = cv2.Sobel(image, cv2.CV_16S, 0, 1) absX = cv2.convertScaleAbs(Sobel_x) # 转回uint8 # absY = cv2.convertScaleAbs(Sobel_y) # dst = cv2.addWeighted(absX, 0.5, absY, 0.5, 0) image = absX
图像二值化
就是将图像上的像素点的灰度值设置为0或255,图像呈现出明显的只有黑和白。
ret, image = cv2.threshold(image, 0, 255, cv2.THRESH_OTSU)
闭操作
闭操作可以将目标区域连成一个整体,便于后续轮廓的提取。
kernelX = cv2.getStructuringElement(cv2.MORPH_RECT, (17, 5))
image = cv2.morphologyEx(image, cv2.MORPH_CLOSE, kernelX)
膨胀腐蚀
通过膨胀连接相近的图像区域,通过腐蚀去除孤立细小的色块。
kernelX = cv2.getStructuringElement(cv2.MORPH_RECT, (20, 1)) kernelY = cv2.getStructuringElement(cv2.MORPH_RECT, (1, 19)) image = cv2.dilate(image, kernelX) image = cv2.erode(image, kernelX) image = cv2.erode(image, kernelY) image = cv2.dilate(image, kernelY)
中值滤波
去除图像或者其它信号中的噪声。
image = cv2.medianBlur(image, 15)
查找轮廓
tmp, contours, w1 = cv2.findContours(image, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE) # 绘制轮廓 image = cv2.drawContours(rawImage, contours, -1, (0, 0, 255), 3) cv2.imshow('image', image)
判断车牌区域
我这里的判断比较简单是判断,宽高大于2比1的,实际上应该更加复杂一些,仅供学习参考。
for item in contours: rect = cv2.boundingRect(item) x = rect[0] y = rect[1] weight = rect[2] height = rect[3] if weight > (height * 2): image = rawImage[y:y + height, x:x + weight] cv2.imshow('image', image)
完整代码
#!/usr/bin/env python # -*- coding:utf-8 -*- import cv2 # 读取图片 rawImage = cv2.imread("photo.jpg") # 高斯模糊,将图片平滑化,去掉干扰的噪声 image = cv2.GaussianBlur(rawImage, (3, 3), 0) # 图片灰度化 image = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY) # Sobel算子(X方向) Sobel_x = cv2.Sobel(image, cv2.CV_16S, 1, 0) # Sobel_y = cv2.Sobel(image, cv2.CV_16S, 0, 1) absX = cv2.convertScaleAbs(Sobel_x) # 转回uint8 # absY = cv2.convertScaleAbs(Sobel_y) # dst = cv2.addWeighted(absX, 0.5, absY, 0.5, 0) image = absX # 二值化:图像的二值化,就是将图像上的像素点的灰度值设置为0或255,图像呈现出明显的只有黑和白 ret, image = cv2.threshold(image, 0, 255, cv2.THRESH_OTSU) # 闭操作:闭操作可以将目标区域连成一个整体,便于后续轮廓的提取。 kernelX = cv2.getStructuringElement(cv2.MORPH_RECT, (17, 5)) image = cv2.morphologyEx(image, cv2.MORPH_CLOSE, kernelX) # 膨胀腐蚀(形态学处理) kernelX = cv2.getStructuringElement(cv2.MORPH_RECT, (20, 1)) kernelY = cv2.getStructuringElement(cv2.MORPH_RECT, (1, 19)) image = cv2.dilate(image, kernelX) image = cv2.erode(image, kernelX) image = cv2.erode(image, kernelY) image = cv2.dilate(image, kernelY) # 平滑处理,中值滤波 image = cv2.medianBlur(image, 15) # 查找轮廓 tmp, contours, w1 = cv2.findContours(image, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE) for item in contours: rect = cv2.boundingRect(item) x = rect[0] y = rect[1] weight = rect[2] height = rect[3] if weight > (height * 2): # 裁剪区域图片 chepai = rawImage[y:y + height, x:x + weight] cv2.imshow('chepai'+str(x), chepai) # 绘制轮廓 image = cv2.drawContours(rawImage, contours, -1, (0, 0, 255), 3) cv2.imshow('image', image) cv2.waitKey(0) cv2.destroyAllWindows()
作者:ImWiki
链接:https://www.jianshu.com/p/08ddeb0d8878
来源:简书