zoukankan      html  css  js  c++  java
  • python图像处理库PIL的基本概念介绍

      PIL中所涉及的基本概念有如下几个:通道(bands)、模式(mode)、尺寸(size)、坐标系统(coordinate system)、调色板(palette)、信息(info)和滤波器(filters)。趁此机会,复习一下这些图像处理中的基本概念。

      通道:

      每张图片都是由一个或者多个数据通道构成。PIL允许在单张图片中合成相同维数和深度的多个通道。

    以RGB图像为例,每张图片都是由三个数据通道构成,分别为R、G和B通道。而对于灰度图像,则只有一个通道。

    对于一张图片的通道数量和名称,可以通过方法getbands()来获取。方法getbands()是Image模块的方法,它会返回一个字符串元组(tuple)。该元组将包括每一个通道的名称。

      Python的元组与列表类似,不同之处在于元组的元素不能修改,元组使用小括号,列表使用方括号,元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可。

      getbands的使用方法如下:

      

    >>> from PIL import Image
    >>> im = Image.open("girl8.jpg")
    >>> im.getbands()
    ('R', 'G', 'B')
    >>> im_bands = im.getbands()
    >>> len(im_bands)
    3
    >>> print(im_bands[0])
    R
    >>> print(im_bands[1])
    G
    >>> print(im_bands[2])
    B
    >>> 

      模式:

      图像的模式定义了图像的类型和像素的位宽。当前支持如下模式:

    1:1位像素,表示黑和白,但是存储的时候每个像素存储为8bit。

    L:8位像素,表示黑和白。

    P:8位像素,使用调色板映射到其他模式。

    RGB:3x8位像素,为真彩色。

    RGBA:4x8位像素,有透明通道的真彩色。

    CMYK:4x8位像素,颜色分离。

    YCbCr:3x8位像素,彩色视频格式。

    I:32位整型像素。

    F:32位浮点型像素。

    PIL也支持一些特殊的模式,包括RGBX(有padding的真彩色)和RGBa(有自左乘alpha的真彩色)。

    可以通过mode属性读取图像的模式。其返回值是包括上述模式的字符串。

      模式mode的使用如下:

    >>> im = Image.open("girl8.jpg")
    >>> im.mode
    'RGB'
    >>> md = im.mode
    >>> print md
    RGB

      尺寸:

      通过size属性可以获取图片的尺寸。这是一个二元组,包含水平和垂直方向上的像素数。

      使用方法如下:

      

    >>> im = Image.open("girl8.jpg")
    >>> im.size
    (1080, 1920)
    >>> im_size = im.size
    >>> print im_size[0]
    1080
    >>> print im_size[1]
    1920

      坐标系统:

      PIL使用笛卡尔像素坐标系统,坐标(0,0)位于左上角。注意:坐标值表示像素的角;位于坐标(0,0)处的像素的中心实际上位于(0.5,0.5)。

    坐标经常用于二元组(x,y)。长方形则表示为四元组,前面是左上角坐标。例如,一个覆盖800x600的像素图像的长方形表示为(0,0,800,600)。

      调色板:

    调色板模式 ("P")使用一个颜色调色板为每个像素定义具体的颜色值

      信息:

      使用info属性可以为一张图片添加一些辅助信息。这个是字典对象。加载和保存图像文件时,多少信息需要处理取决于文件格式。

    属性info的使用如下:

      

    >>> im = Image.open("girl8.jpg")
    >>> 
    >>> 
    >>> im.info
    {'jfif': 257, 'jfif_unit': 0, 'progressive': 1, 'progression': 1, 'jfif_version': (1, 1), 'jfif_density': (1, 1)}
    >>> im_info = im.info
    >>> 
    >>> 
    >>> print im_info["jfif"]
    257
    >>> print im_info["jfif_unity"]
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    KeyError: 'jfif_unity'
    >>> print im_info["jfif_unit"]
    0

      滤波器:

    对于将多个输入像素映射为一个输出像素的几何操作,PIL提供了4个不同的采样滤波器:

    NEAREST:最近滤波。从输入图像中选取最近的像素作为输出像素。它忽略了所有其他的像素。

    BILINEAR: 双线性滤波。在输入图像的2x2矩阵上进行线性插值。注意:PIL的当前版本,做下采样时该滤波器使用了固定输入模板。

    BICUBIC:双立方滤波。在输入图像的4x4矩阵上进行立方插值。注意:PIL的当前版本,做下采样时该滤波器使用了固定输入模板。

    ANTIALIAS:平滑滤波。这是PIL 1.1.3版本中新的滤波器。对所有可以影响输出像素的输入像素进行高质量的重采样滤波,以计算输出像素值。在当前的PIL版本中,这个滤波器只用于改变尺寸和缩略图方法。

      注意:在当前的PIL版本中,ANTIALIAS滤波器是下采样(例如,将一个大的图像转换为小图)时唯一正确的滤波器。BILIEAR和BICUBIC滤波器使用固定的输入模板,用于固定比例的几何变换和上采样是最好的。

    Image模块中的方法resize()和thumbnail()用到了滤波器。

    方法resize()的使用如下:

    方法resize()的定义为:resize(size, filter=None)=> image

      

    >>> im.size
    (1080, 1920)
    >>> im_resize = im.resize((256,256))
    >>> im_resize.size
    (256, 256)
    >>> im_resize0 = im.resize((256,256),Image.BILINEAR)
    >>> im_resize0.size
    (256, 256)

      总结:

    基本的概念要十分清楚才行,这个是基本功,练武不练功,到老一场空。

      参考文档:

    https://blog.csdn.net/icamera0/article/details/50647465

  • 相关阅读:
    包含min函数的栈
    树的子结构
    合并两个排序的链表
    反转链表
    字符移位
    有趣的数字
    顺时针打印矩阵
    有道云笔记自动签到
    Shell重定向
    Ubuntu 18.04安装Docker
  • 原文地址:https://www.cnblogs.com/dylancao/p/9134362.html
Copyright © 2011-2022 走看看