zoukankan      html  css  js  c++  java
  • VintaSoft Imaging .NET使用教程:如何将OCR设置为只识别数字

    VintaSoftImaging.NET SDK是一个为.NET开发人员开发的,强大而易于使用的图像工具包。它可以让你加载、查看、处理、打印和保存数字图像,可将它们转换为不同的图像格式,可用多种TIFF和动态GIF文件提高您的工作效率。

    并且该产品还可以添加多个模块:图片注释模块、PDF模块、JBIG2模块、JPEG2000模块、文档清洁模块、DICOM模块、OCR模块和表单处理模块,结合这些模块开发人员可以开发出现代化的商业应用程序 这篇文章主要介绍VintaSoft Imaging .NET怎么和OCR模块结合,OCR识别模块识别率高,支持多国语言包含中文,并且可以自定义多种功能,下面的代码主要讲述了怎么设置OCR只对图片中的数字进行识别,具体如下:

    using System;
    using Vintasoft.Imaging;
    using Vintasoft.Imaging.Ocr;
    using Vintasoft.Imaging.Ocr.Results;
    using Vintasoft.Imaging.Ocr.Tesseract;
     
    class TesseractOcrSetVariableExample
    {
        // Required assemblies to run this code:
        // Vintasoft.Imaging.dll, Vintasoft.Imaging.Ocr.dll, Vintasoft.Imaging.Ocr.Tesseract.dll
        public static void OcrImageWithDigits(string filename)
        {
            // load image(s)
            ImageCollection images = new ImageCollection();
            images.Add(filename);
     
            Console.WriteLine("Create Tesseract OCR engine...");
            using (TesseractOcr tesseractOcr = new TesseractOcr())
            {
                Console.WriteLine("Initialize OCR engine...");
                tesseractOcr.Init(new OcrEngineSettings(OcrLanguage.English));
     
                // set white list
                tesseractOcr.SetVariable(
                    "tessedit_char_whitelist", "01234567890");
     
                // foreach image
                foreach (VintasoftImage image in images)
                {
                    Console.WriteLine("Recognize the image...");
                    OcrPage page = tesseractOcr.Recognize(image);
     
                    Console.WriteLine("Page Text:");
                    Console.WriteLine(page.GetText());
                    Console.WriteLine();
                }
     
                // shutdown OCR engine
                tesseractOcr.Shutdown();
            }
     
            // free resources
            images.ClearAndDisposeItems();
            images.Dispose();
        }
    }

    本文转自VintaSoft Imaging .NET

    查看产品详情evget.com/product/1750

  • 相关阅读:
    RK3288 GMAC整理
    Linux电源管理-Linux regulator framework概述
    SRAM、DRAM、SDRAM、DDR、DDR2、DDR3
    内核错误值
    module_param和module_param_array用法
    VGA
    如何获取显示器的EDID信息
    进程间通信--共享内存
    Java 中的 CAS 简述及原理解析
    volatile 关键字特性解析及单例模式下的使用
  • 原文地址:https://www.cnblogs.com/jp294936239/p/5029525.html
Copyright © 2011-2022 走看看