zoukankan      html  css  js  c++  java
  • 基于水平投影,垂直投影的字符图像分割思路和代码实现

    首先介绍算法思路:图像对应方向的投影,就是在该方向取一条直线,统计垂直于该直线(轴)的图像上的像素的黑点数量,累加求和作为该轴该位置的值;基于图像投影的切割就是将图像映射成这种特征后,基于这种特征判定图像的切割位置(坐标),用这个坐标来切割原图像,得到目标图像。

    其实,可以用多次的腐蚀后再膨胀进行边界定位处理,但是如果图像(比如打印字体)非常规范,简单的投影就可以了。


    java代码实现:

    java的图像处理,这里大部分是由im.read读取,bufferedimage,然后转为二值bitset做处理(0,1或者说是true和false,一个bitset是整张图片的0,1像素值的一维行向量。bitset.length=width*height)

    /**

    * 图像向x轴做投影后的数组

    * @param imagedata

    * @param w

    *            宽

    * @param h

    *            高

    * @return

    */

    public static int[] xpro(BitSet bitSet, int width, int height) {

    int xpro[] = new int[width];

    for (intj = 0; j < width; j++) {

    for (inti = 0; i < height; i++) {

    if (bitSet.get(i *width + j) ==true)

    xpro[j]++;

    }

    }

    returnxpro;

    }

    /**

    * 图像向y轴做投影后的数组

    * @param imagedata

    * @param w

    * @param h

    * @return

    */

    public static int[] ypro(BitSet bitSet, int width, int height) {

    int ypro[] = new int[height];

    for (inti = 0; i < height; i++) {

    for (intj = 0; j < width; j++) {

    if (bitSet.get(i *width + j) ==true)

    ypro[i]++;

    }

    }

    returnypro;

    }

    public static Rectangle[] yproSegment(int[] ypro, int width,int height) {


    ArrayList<Integer> lline =new ArrayList<Integer>();

    ArrayList<Integer> rline =new ArrayList<Integer>();

    // 两种情况:sku区域起始位置元素为空白区域;起始位置含字符元素

    if (ypro[0] != 0) {

    lline.add(0);

    }

    for (inti = 4; i < height; i++) {

    if (ypro[i] > 0 &&ypro[i - 1] > 0 &&ypro[i - 2] > 0

    && ypro[i - 3] > 0 &&ypro[i - 4] == 0) {

    lline.add(i-4);

    } else if (ypro[i] == 0 &&ypro[i - 1] > 0 &&ypro[i - 2] > 0

    && ypro[i - 3] > 0 &&ypro[i - 4] > 0) {

    rline.add(i);

    }

    }


    if (ypro[ypro.length - 1] != 0) {

    rline.add(height);

    }

    List<Rectangle> c = new ArrayList<Rectangle>();

    for (inti = 0; i < rline.size(); i++) {

    if (rline.get(i) != 0 &&lline.get(i) <rline.get(i)) {

    c.add(new Rectangle(0,lline.get(i),width, rline.get(i)-lline.get(i)));

    } else {

    break;

    }

    }

    return c.toArray(new Rectangle[0]);

    }


    matlab代码实现:


    python代码实现:


  • 相关阅读:
    Start Developing iOS Apps (Swift) 开始开发iOS应用(Swift)
    ansible copy file
    多个sshkey 指定key来clone仓库
    elastic search 日期为string类型导致视图无法展示时间的解决办法
    ubuntu 安装php 报错解决
    ruby hash 默认值的问题
    11.Mysql 之MHA(高可用)
    10. 主从复制-主从复制(基于GTID)--附加半同步复制
    9 .mysql的备份与恢复
    11.Mysql之回表、最左匹配、索引下推
  • 原文地址:https://www.cnblogs.com/zhangdebin/p/5567964.html
Copyright © 2011-2022 走看看