在本系列文章中,我们将使用深度神经网络(DNN)来执行硬币识别。具体来说,我们将训练一个DNN识别图像中的硬币。
在本文中,我们将描述一个OpenCV应用程序,它将检测图像中的硬币。硬币检测是硬币完整识别之前的一个常见阶段。它包括从给定图像中检测和提取硬币。
本系列附带的代码将使用Keras在C#中实现。在本系列的最后一篇文章中,我们将简要地使用ML.NET。在众多选择中,为什么要使用Keras.NET呢?Keras.NET 非常容易学习,因为它基本上是从Python编写的经典TensorFlow到C#的直接映射。对于不熟悉机器学习的读者来说,这比用其他方法创建示例要容易得多。
硬币检测过程分为三个阶段:
- 转换图像到灰度。颜色增加了检测任务的复杂性,而且在很多情况下,它们不能传递任何可以从图像亮度中获取的相关信息。
- 应用高斯模糊。因为硬币通常包含一个内圆,我们应用这个变换来模糊图像。这确保了任何内圆被下一步中的操作忽略,所以我们的算法不会意外地认为它们是一个单独的硬币。
- 应用霍夫变换。这是为了检测圆形。
首先,让我们在Visual Studio Community 2019中创建一个.net Framework 4.7.2控制台应用程序。我们将把我们的解决方案和项目命名为“CoinRecognitionExample”,并在其中创建一个Detection文件夹,创建一个CoinDetector类。
我们将使用OpenCVSharp,所以我们可以继续在Visual Studio中从Nuget包管理器安装依赖项。要做到这一点,请点击Tools > Nuget Package Manager.
我们可以看到需要安装OpenCVSharp的依赖项。
具体的实现发生在CoinDetector类中:
1 public class CoinDetector 2 { 3 private Mat _image; 4 private Mat _originalImage; 5 private string _pathToFile; 6 7 public CoinDetector(string pathToFile) 8 { 9 _pathToFile = pathToFile; 10 } 11 12 public void ImagePreprocessing() 13 { 14 _image = new Mat(_pathToFile, ImreadModes.Color); 15 _originalImage = _image.Clone(); 16 TransformGrayScale(); 17 TransformGaussianBlur(); 18 HoughSegmentation(); 19 } 20 21 private void TransformGrayScale() 22 { 23 _image = _originalImage.CvtColor(ColorConversionCodes.BGR2GRAY); 24 new Window("Grayed Coins", WindowMode.Normal, _image); 25 Cv2.WaitKey(); 26 } 27 28 private void TransformGaussianBlur() 29 { 30 Cv2.GaussianBlur(_image, _image, new Size(0, 0), 1); 31 new Window("Blurred Coins", WindowMode.Normal, _image); 32 //Cv2.WaitKey(); 33 } 34 35 private void HoughSegmentation() 36 { 37 Mat result = _image.Clone(); 38 39 var circleSegments = Cv2.HoughCircles(_image, HoughMethods.Gradient, 1.6, 40); 40 for (int i = 0; i < circleSegments.Length; i++) 41 { 42 Cv2.Circle(result, (Point) circleSegments[i].Center, (int)circleSegments[i].Radius, new Scalar(255, 255, 0), 2); 43 } 44 45 using (new Window("Circles", result)) 46 { 47 Cv2.WaitKey(); 48 } 49 } 50 }
在类的构造函数中,我们接收到硬币图像的路径。这个方法和ImagePreprocessing方法是CoinDetector类中仅有的两个公共实体。所有其他方法都是私有的,与上面列出的三个阶段相关。在ImageProcessing 方法中,我们保存一个原始的Mat(像素矩阵)对象的图像,并生成即将发生的转换副本。Mat类和所有对Cv2类的调用都来自OpenCVSharp。在每次转换之后,我们调用new Window以可视化地显示转换。Cv2.HoughCircles的参数取决于你所面临的问题,也就是正在处理的图像。
代码中显示的参数符合我们的示例。
要完成硬币检测示例,我们可以在控制台应用程序项目的主方法中添加以下代码行并执行。
1 string filePath = @"C:/Users/arnal/Documents/coins.jpg"; 2 var coinDetector = new CoinDetector(filePath); 3 coinDetector.ImagePreprocessing();
这是我们将用于测试的图像。其中包括塞尔维亚硬币:
最终的结果将是我们之前看到的图像:
正如我们所看到的,在中间使用对应霍夫变换的白色圆圈标识,并被识别出来。
本系列的第一篇文章到此结束。在下一篇文章中,我们将对输入到机器学习模型中的数据集进行预处理。
欢迎关注我的公众号,如果你有喜欢的外文技术文章,可以通过公众号留言推荐给我。