zoukankan      html  css  js  c++  java
  • Pillow 模块~Python图像处理

    什么是验证码?

    验证码(CAPTCHA)是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写。
    是一种用来区分用户是计算机还是人的公共全自动程序。

    验证码的作用
    认证码是一种人机识别手段,最终目的是区分正常用户和机器的操作。
    可以防止:恶意破解密码、注册、刷票、论坛灌水,防止黑客对用户的密码进行暴力破解。
    一般是提出一个问题,这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答这个的问题,所以回答出问题的用户就可以被认为是人类。
    验证码的类别

    验证码自面世以来就一直在更新,迭代。
    图形验证码:这类验证码大多是计算机随机产生一个字符串,在把字符串增加噪点、干扰线、变形、重叠、不同颜色、扭曲组成一张图片来增加识别难度。
    滑动验证码:也叫行为验证码,比较流行的一种验证码,通过用户的操作行为来完成验证,其中最出名的就是极验。
    滑动验证码的原理就是使用机器学习中的深度学习技术,根据一些特征来区分是否为正常用户。通过记录用户的滑动速度,还有每一小段时间的瞬时速度,用户鼠标点击情况,以及滑动后的匹配程度来识别。而且,不是说滑动到正确位置就是验证通过,而是根据特征识别来区分是否为真用户,滑到正确位置只是一个必要条件。
    点触验证码:点击类验证码都是给出一张包含文字的图片,通过文字提醒用户点击图中相同字的位置进行验证。

    简介

    Python传统的图像处理库PIL(Python Imaging Library),可以说基本上是Python处理图像的便准库,功能强大,使用简单。

    但是由于PIL不支持Python3,而且更新缓慢。所以由志愿者在PIl的基础上创建了一个分支版本,命名为Pillow,Pillow目前最新支持到

    Python3.6,更新活跃,并且增加了许多新的特性。所以在这里讲解一下Pillow库


    安装

    命令行pip安装

    pip install Pillow

    但是需要注意一点,Pillow和PIL是不能共存在一个环境中的,所以如果安装有PIL的话,需要先把PIL卸载掉,也不用担心更能问题,

    Pillow具备PIL绝大多数的方法,卸载命令

    pip uninstall PIL

    由于是继承PIL的分支,所以Pillow的导入是这样的:

    import PIL
    
    #或者是
    
    from PIL import Image

    使用手册

    Image

    Image是Pillow中最为重要的类,实现了Pillow中大部分的功能。要创建这个类的示例主要有三个方法:

      1. 从文件加载图片

      2. 处理其他图像获得

      3. 创建一个新的图像

    读取图像

    一般来说,我们都是通过文件加载图像来实例化这个类,如下所示:

    from PIl import Image
    picture = Image.open('test.png')

    如果没有指定图片格式的话,那么Pillow会自动识别文件内容为文件格式。

    新建图像

    Pillow新建空白图像使用new()方法,第一个参数是mode即颜色空间模式,第二个参数指定了五项的分辨率(宽x高),第三个参数是颜色。

    - 可以直接填入常用的颜色的名称。如‘red'。

    - 也可以填入十六进制表示的颜色,如#F0000表示红色。

    - 还能传入元组,比如(255,0,0,255)或者(255,0,0)表示红色。

    picture = Image.new('RGB', (200, 100), 'red')

     

    保存图片

    保存图片的话需要使用save()方法:

    picture.save('test.png')

     保存的时候,如果没有指定图片格式的话,那么Pillow会根据输入的后缀名决定保存的文件格式。

     图像的坐标表示

    - 在Pillow中,用的是图像左上角的坐标的原点(0,0).所以这意味着,x轴的数值是从左到右增长的,y轴的数值是从上到下增长的。

    - 我们处理图像时,常常需要去表示一个矩形的图像区域。Pillow中很多的方法都需要传入一个表示矩形区域的元组参数。

    - 这个元组参数包含四个值,分别代表矩形四条边的距离X轴或者Y轴的距离。顺序是(左,顶,右,底)。其实就相当于,

    矩形的左上顶点坐标为(左,顶),矩形的右下顶点坐标为(右,底),两个顶点就可以确定一个矩形的位置。

    - 右和底坐标稍微特殊,跟python列表索引规则一样,是左闭右开的。可以理解为[左, 右)[顶, 底)这样左闭右开的区间。

    比如(3, 2, 8, 9)就表示了横坐标范围[3, 7];纵坐标范围[2, 8]的矩形区域。

    常用属性

    • PIL.Image.filename

      打印图像源文件的文件名或者路径,只有使用open()方法创建的对象有这个属性。

      类型:字符串

    • PIL.Image.format

      图像源文件的文件格式。

    • PIL.Image.mode

      图像的模式,一般来说是“1”, “L”, “RGB”, 或者“CMYK” 。

    • PIL.Image.size

      图像的大小

    • PIL.Image.width

      图像的宽度

    • PIL.Image.height

      图像的高度

    • PIL.Image.info

      图像的一些信息,为字典格式

    常用方法

    裁剪图片

    Image使用crop()方法来裁剪图像,此方法需要传入一个矩形元祖参数,返回一个新的Image对象,对原图没有影响。

    croped_im = img.crop((50, 60, 400, 218))

     原图片:

    裁剪以后:

    复制与粘贴图像

    复制图像使用copy()方法:

    copyed_im = im.copy()

    粘贴图像使用paste()方法:

    croped_im = im.crop((50, 60, 400, 218))
    im.paste(croped_im, (0, 0))

    im对象调用了paste()方法,第一个参数是被裁剪下来用来粘贴的图像,第二个参数是一个位置参数元祖,这个位置参数是粘贴的图像的左顶点。

     

    调整图像的大小

    调整图像大小使用resize()方法:

    resized_im = im.resize((width, height))

    resize()方法会返回一个重设了大小的Image对象。

    或者使用thumbnail()方法:

    im = Image.open('test.jpg')
    #获得图像尺寸
    w, h = im.size  
    # 缩放到50%
    im.htumbnail((w//2, h//2))  
    #显示图片
    im.show()  

     thumbnail() 方法可以用来制作缩略图。它接受一个二元数组作为缩略图的尺寸,然后将示例缩小到指定尺寸

    旋转图像和翻转图像

    旋转图像使用rotate()方法,此方法按逆时针旋转并返回一个新的Image对象

    # 逆时针旋转90度
    im.rotate(90)
    im.rotate(180)
    im.rotate(20, expand=True)

     inn = img.rotate(90)

    旋转的时候,会将图片超出边界的边角裁剪掉。如果加入expand=True参数,就可以将图片边角保存住。

    翻转图像使用transpose()

    # 水平翻转
    im.transpose(Image.FLIP_LEFT_RIGHT)
    # 垂直翻转
    im.transpose(Image.FLIP_TOP_BOTTOM)

    获得图片通道名称

    im.getbands()

    通过通道分割图片

    split()

    split()可以将多通道图片按通道分割为单通道图片。返回各个通道的灰度图组成的元组

    R, G, B = im.split()

    split()方法返回的是一个元祖,元祖中的元素则是分割后的单个通道的图片。

    getchannel(channel)

    getchannel()可以获取单个通道的图片:

    R = im.getchannel("R")

    模式转化

    img = im.convert("L")   

    获取单个像素的值

    使用getpixel(xy)方法可以获取单个像素位置的值:

    im.getpixel((100, 100))

    传入的xy需要是一个元祖形式的坐标。

    如果图片是多通道的,那么返回的是一个元祖。

    L模式经常用来处理图像识别,数据方便分析处理

    加载图片全部数据

    我们可以使用load()方法加载图片所有的数据,并比较方便的修改像素的值:

    pixdata = im.load()
    pixdata[100,200] = 255

     

    此方法返回的是一个PIL.PyAccess,可以通过这个类的索引来对指定坐标的像素点进行修改。

    获取全部像素内容

    getdata(band = None) 方法,用来获取 Image 类的对象中的像素内容

    该方法会将图片中的像素内容,逐行逐行地拼接起来,作为一个完整的序列返回。方法的返回类型,是 PIL 库的内部类型。我们可以用 list(im.getdata()) 得到标准的 Python list 对象。

    band 意味「通道」。当 band = None 时,方法返回所有通道的像素内容;当 band = 0时,则返回第一个通道的像素内容。例如,对于 RGB 模式的位图,band = 0 返回 R 通道的内容;band = 2 返回 B 通道的内容。

    from PIL import Image
    ​
    im = Image.open('test.jpg')
    print(im.getdata())  #获取所有通道的值 类似生成器的对象
    print(list(im.getdata(0)))  #获取第一个通道的值, 转化为列表
    

    关闭图片并释放内存

    此方法会删除图片对象并释放内存

    im.close()
    
  • 相关阅读:
    PagerIndicator主题样式修改
    写个Fragment方便的抽象基类 BaseFragment
    slidingMenu有时候需要关闭侧边栏
    通过构造方法传递数据
    三层ViewPager嵌套 的事件处理
    网络缓存的逻辑
    html中offsetTop、clientTop、scrollTop、offsetTop各属性介绍
    AJAX请求
    animation-name
    Sublime Text 2主要快捷键列表
  • 原文地址:https://www.cnblogs.com/pywjh/p/9778912.html
Copyright © 2011-2022 走看看