zoukankan      html  css  js  c++  java
  • Python 图像处理 OpenCV (3):图像属性、图像感兴趣 ROI 区域及通道处理

    前文传送门:

    「Python 图像处理 OpenCV (1):入门」

    「Python 图像处理 OpenCV (2):像素处理与 Numpy 操作以及 Matplotlib 显示图像」

    图像属性

    图像属性包括行数,列数和通道数,图像数据类型,像素数等。

    1. 形状:shape

    图像的形状可以通过 shape 关键字进行获取,使用 shape 关键的后,获取的信息包括行数、列数、通道数的元祖。

    需要注意的是,如果是灰度图片,只会返回图像的行数和列数,而彩色图片才会图像的行数、列数和通道数。

    示例如下:

    import cv2 as cv
    
    # 读取彩色图片
    color_img = cv.imread("maliao.jpg", cv.IMREAD_ANYCOLOR)
    
    print(color_img.shape)
    
    # 结果打印
    (310, 560, 3)
    
    # 读取灰度图片
    gray_img = cv.imread("maliao.jpg", cv.IMREAD_GRAYSCALE)
    
    print(gray_img.shape)
    
    # 结果打印
    (310, 560)
    

    2. 像素数量:size

    图像的像素数量可以通过关键字 size 进行获取。

    同样需要注意的是,灰度图片的像素数量是要小于彩色图片的,具体的关系是 1/3 。

    import cv2 as cv
    
    # 读取彩色图片
    color_img = cv.imread("maliao.jpg", cv.IMREAD_ANYCOLOR)
    
    print(color_img.size)
    
    # 结果打印
    520800
    
    # 读取灰度图片
    gray_img = cv.imread("maliao.jpg", cv.IMREAD_GRAYSCALE)
    
    print(gray_img.size)
    
    # 结果打印
    173600
    

    3. 图像类型-dtype

    图像类型是通过关键字 dtype 获取的,通常返回 uint8 ,这个属性在彩色图片和灰度图片中是保持一致的。

    注意 dtype 在调试时非常重要,因为 OpenCV-Python 代码中的大量错误是由无效的数据类型引起的。

    import cv2 as cv
    
    # 读取彩色图片
    color_img = cv.imread("maliao.jpg", cv.IMREAD_ANYCOLOR)
    
    print(color_img.dtype)
    
    # 结果打印
    uint8
    
    # 读取灰度图片
    gray_img = cv.imread("maliao.jpg", cv.IMREAD_GRAYSCALE)
    
    print(gray_img.dtype)
    
    # 结果打印
    uint8
    

    获取图像感兴趣 ROI 区域

    ROI(Region of Interest)表示感兴趣区域。

    它是指从被处理图像以方框、圆形、椭圆、不规则多边形等方式勾勒出需要处理的区域。可以通过各种算子(Operator)和函数求得感兴趣ROI区域,并进行图像的下一步处理,被广泛应用于热点地图、人脸识别、图像分割等领域。

    如果我们要对于图像中的眼睛检测,首先对整个图像进行人脸检测。在获取人脸图像时,我们只选择人脸区域,搜索其中的眼睛,而不是搜索整个图像。它提高了准确性(因为眼睛总是在面部上:D )和性能(因为我们搜索的区域很小)。

    我们通过像素矩阵可以直接得到 ROI 区域,如: img[200:400, 200:400]

    比如下面这个示例我们获取马里奥的脸,然后再把它显示出来:

    import cv2 as cv
    
    img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)
    
    face = img[10:175, 100:260]
    
    # 原始图像显示
    cv.imshow("demo", img)
    
    # 马里奥的脸显示
    cv.imshow("face", face)
    
    #等待显示
    cv.waitKey(0)
    cv.destroyAllWindows()
    

    它的结果如下:

    如果我们要把这两张图像合成一张图像,可以对图像进行区域赋值:

    import cv2 as cv
    
    img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)
    
    # 获取 ROI 区域
    face = img[10:175, 100:260]
    # 图像赋值
    img[0:165, 0:160] = face
    
    # 原始图像显示
    cv.imshow("demo", img)
    
    #等待显示
    cv.waitKey(0)
    cv.destroyAllWindows()
    

    结果如下:

    这里我稍微偷点懒,直接就把 ROI 区域放在了图片的左上角,这个位置可以随意指定,但是指定的区域要和 ROI 的区域一样大,否则会报一个 ValueError 的错误。

    拆分和合并图像通道

    1. 拆分图像通道

    有些时候,我们需要分别处理图像的 B,G,R 通道。的通道,用 PS 抠过图的人应该都清楚抠图的时候可以使用单通道进行抠图操作。

    将图像的通道拆分出来可以使用 split() 函数,如下:

    import cv2 as cv
    
    img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)
    
    #拆分通道
    b, g, r = cv.split(img)
    
    # 分别显示三个通道的图像
    cv.imshow("B", b)
    cv.imshow("G", g)
    cv.imshow("R", r)
    
    # 等待显示
    cv.waitKey(0)
    cv.destroyAllWindows()
    

    结果如下:

    可以看到,三个通道的图像看起来都是灰白色的,这个玩过 PS 的人应该都很熟悉。

    除了使用 split() 函数获取图像通道,还可以通过索引进行获取,代码如下:

    b = img[:, :, 0]
    g = img[:, :, 1]
    r = img[:, :, 2]
    

    如果需要将所有红色像素都设置为零,无需先拆分通道,索引更快:

    img[:, :, 2] = 0
    

    注意: split() 函数是一项耗时的操作(就时间而言)。因此,仅在必要时才这样做。否则请进行Numpy索引。

    2. 合并图像通道

    合并图像通道我们使用函数 merge() ,示例如下:

    import cv2 as cv
    
    img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)
    
    # 拆分通道
    b, g, r = cv.split(img)
    
    # 合并图像通道
    m = cv.merge([r, g, b])
    
    cv.imshow('merge', m)
    
    # 等待显示
    cv.waitKey(0)
    cv.destroyAllWindows()
    

    结果如下:

    这里如果是按照 [r, g, b] 进行图像通道合并,我们的马里奥就会变身成为蓝精灵,因为 OpenCV 是按照 BGR 读取的,如果想要显示会原图,合并的时候也按照 [b, g, r] 合并即可,如下:

    如果我们想要做一个真正的蓝精灵,可以只提取 B 颜色通道,其余两个 G 、 R 通道全部设置为 0 ,这样,我们就获得了一个真正的蓝精灵(整个图像只有蓝色通道),代码如下:

    import cv2 as cv
    import numpy as np
    
    # 读取图片
    img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)
    rows, cols, chn = img.shape
    
    # 拆分通道
    b = img[:, :, 0]
    g = np.zeros((rows,cols), dtype=img.dtype)
    r = np.zeros((rows,cols), dtype=img.dtype)
    
    # 合并图像通道
    m = cv.merge([b, g, r])
    
    cv.imshow('merge', m)
    
    # 等待显示
    cv.waitKey(0)
    cv.destroyAllWindows()
    

    结果如下:

    同理,如果想要绿精灵和红精灵,一样可以做出来。

    示例代码

    如果有需要获取源码的同学可以在公众号回复「OpenCV」进行获取。

    参考

    https://blog.csdn.net/eastmount/article/details/82177300

    http://woshicver.com/

  • 相关阅读:
    制作一个螺旋矩阵
    通过C++修改系统时间代码
    绝对值最小
    compile cmdow
    2017-10-04清北模拟赛
    2017-10-03清北模拟赛
    2017-10-01清北模拟赛
    HTML容易遗忘内容(二)
    SSM框架关于后台返回JSON数据中显示很多不需要的字段为NULL
    关于Unix时间戳转北京时间的问题
  • 原文地址:https://www.cnblogs.com/babycomeon/p/12929181.html
Copyright © 2011-2022 走看看