zoukankan      html  css  js  c++  java
  • Python数据类型(python3)

    Python数据类型(python3)

    基础数据类型


    • 整型 <class 'int'>

      • 带符号的,根据机器字长32位和64位表示的范围不相同,分别是:
      • -2^31 - 2^31-1 和 -2^63 - 2^63 -1
      • Python为了程序运行速度,使用了小整数对象池,避免整数对象的频繁申请和销毁,增加程序运行速度的开销。也就是声明多个小整数赋值给变量,这些变量都是指向的小整数对象池里面的那个小整数对象。相反大整数都会重新实例一个在内存中。

    >>>id(258)
    1971357673680
    >>>id(258)
    1971357675120
    >>>id(258)
    1971357672720
    #以上三次实例的整数都是单独的
    >>>id(256)
    1390248128
    >>>id(256)
    1390248128
    #以上两次实例的小整数都是同一个实例

    • .

      • 所谓小整数是[-5,257)的左闭右开区间。

      • 而对于大整数也会有个对象池,将没有使用的保留在对象池中,不会销毁,有需要的时候直接被使用。

      • 整数对象能进行算数运算,特别的是%取模,和divmod(a,b) -> (整除数,余数) 形式的一个元组tuple

      • 多种表示方式

        • 二进制binary:0b111011
        • 八进制octonary:0o7237
        • 十进制decimalism:10392049
        • 十六进制hexadecimal:0xAB23CF
        • 进制转化间使用bin(),oct(),hex()
    • 浮点<class 'float'>

      • 即分数,有限小数和无限循环小数
      • 之所以叫浮点,是按照科学计数法表示时,小数点位是可变的1.23*109
      • 不精确,默认是17位精度。如果都是用严格的科学计数法表示的话,那么小数点后能表示16位,小数点前只有1位
      • 当需要更高精度,超过16位,那么就得使用decimal模块。1st,先使用getcontext(位数)设置精确位数,然后在使用Decimal(1.232)对象来表示小数并使用其进行算数运算,最后得到的也是Decimal对象
      • 如果用格式化字符串来设定精确位数,会非常的不准确。

    >>> a = "%.30f" % (1.0/3)
    >>> a

    '0.333333333333333314829616256247'

    • 字符串<class 'str'>

      • 字符串也是序列,很多序列的工厂函数都可以使用

      • 字符串是不可变对象,immutable,可以hash,可以做字典key

      • 表示法:

        • 单引号,双引号,三对单/双引号
        • r"dsf" 表示的字符,取消引号中的特殊字符意义
        • u"kdsjf"表示unicode编码的字符串,在python3中等同于普通字符串表示法;但在python2中这就是一种单独类型的数据对象,叫unicode。所以蛋疼的python2和python3在字符编码上让人头晕。好了,这里我们只提python3,那python3多了一个bytes类型,因为是独立的一个类型,但是还是是序列的一种。下面说:
        • b'sdfs' 在python3中这个可不是字符串,是bytes。应该可以认为是可以表示数据流。python2中就是字符串。
        • 在python3中通过str.encode()转换为bytes,通过bytes.decode()转换为str。和两个方法互转。
      • 字符串工厂方法:

        1. string.capitalize() -> str 首字母大写剩下的变小写
        2. string.center(self,width,fillchar=None) -> str 返回一个指定字节宽度,string在中间,其它有填充字符填充
        3. string.count(self,sub,start=None,end=None) -> int
        4. string.encode(self,encoding='utf-8',errors='strict') -> bytes
        5. string.endwith(self,suffix,start=None,end=None) -> bool
        6. string.startwith(self,prefix,start=None,en=None) -> bool
        7. string.expandtab(self,tabsize=8) -> str 将字符串中tab字符转换为指定个数的空格字符
        8. string.find(self,sub,start=None,end=None) -> int 最小的索引值sub在string之一
        9. string.format(self,*args,**kwargs) -> str 将string中{}无论根据名字还是数字使用函数参数进行替换。
        10. string.index(self,sub,start=None,end=None) -> int 不同于find的是,没有不会返回-1而是抛出ValueError异常。
        11. string.isalnum()-> bool 字符串不为空且都是字母和数字
        12. string.isdigit()-> bool
        13. string.isalpha()-> bool
        14. string.isdecimal() -> bool 是否是十进制证书
        15. string.isidentifier() -> bool 是否是关键字字符
        16. 序列的特性都有
      • python3解释器默认utf-8编码,是支持对utf-8的转码为unicode的。python2就需要显示指定编码。同样python3的源码如果是gbk的编码,那么也是需要在文件头添加gbk的编码指定,代码加载到内存中后会转码为unicode

    >>>import sys
    >>>print(sys.getdefaultencoding())
    utf-8

    • .
      • 编码不能说太多了,太多只有看网上大牛的文章了。

      • 字符的编码查看ord('s')返回字符的unicode编码十进制,通过chr(103923)返回十进制编码对应的字符。

      • 对于小于4个字节字符串使用一个类似小整数的字符串对象池。

      • 还有大于4个字节字符串也有想大整数类似的字符串对象缓冲池,而且提供intern()方法手动都指定同一个字符串实例。

    • 布尔<class 'bool'>
      • False True
      • 隐含bool值:[] {} 0 () '' 0 None 0.0 0j 作False, 其它所有非空的数据都可以作True,还有 instances of user-defined classes,if the class defines a __bool()__ or __len__() method,when that method returns the integer zero or bool value False.
    • 空值
      • None 什么都没有

    其它常用类型(进行ing)


    • 列表list
      • mutable可变数据类型,不能hash不能做key,属于序列即有序的,可以嵌套,有深浅copy一说的特性,可迭代。
      • 列表相当于一个容器,存放其它数据类型对象,列表容器也有容器自己的内存地址,列表中的是有序的存放其它数据的内存地址。
      • 通过列表生成式,产生一个列表实例
      • a = [] ; b = list(可迭代对象/单个元素/无参数) 来实例化一个列表对象。
      • 支持通用的可迭代对象遍历方式
      • 支持:
        • 索引访问(正反);
        • 切片(可自定步长第三个表示步长)->返回一个新列表存着切片出来的元素,原列表没变化。隐含有浅copy,虽然是切片部分copy。就是改变子列表元素,原列表也看的见改变的元素。
        • 追加append(从列表尾部压入)-> 改变列表
        • 删除:1) list.remove(元素)根据元素删 2) del list[idx1][idx2]根据索引删... ->改变列表
        • 取出:pop(ele) ->改变列表。和删除针对列表上,都是将元素移除列表。两者不同的是:删除是内存中删除了;取出是从列表移除,在内存中还是存在的,只是可以被其它变量引用。
        • 插入:list.insert(idx,ele)-> 改变列表
        • 列表长度:len(list) -> 不改变列表
        • 判断元素在列表容器中没:'seve' in list -> False or True 应该是判断有没相等的,而不是判断是否同一个对象。
        • 删除多个元素:del list[1:n]
        • list.clear() 清空列表 字典也有这个功能
    • 元组tuple
      • immutable,可hash,有序
      • t = (2,) 一个元素需要在后加上一个逗号,表明是元组,不然等价于没有() ; tt = tuple(可迭代对象/无参数) 来实例化一个元组对象。
      • 上面一条意思是:a = ('str') <=> a = 'str' 两种方式变量都是class 'str'而不是tuple 这点在声明元组时就最好使用tuple(可迭代对象)函数
      • 可以使用元组进行多变量赋值: a, b = (1, 2) # unpack
      • 支持:
        • 索引访问(正反);
        • 切片同list
        • tuple长度:len(tuple)
        • 判断元素是否在tuple中: 'seven' in tuple
    • 字典dict
      • mutable,可变的不能hash,是map映射的一种,好像python唯一映射类型。
      • 通过key->value 就是一种不可变数据对象映射另一个任意数据对象。
      • 实例字典对象:
    实例方式 说明
    d1 = {key1:value1,key2:value2} 直接
    d2 = dict(name='seven', age=20) 间接通过dict()之关键字参数方式
    d3 = dict(mapping) 间接通过dict()之带入一个mapping对象
    d4 = dict(iterable) 间接通过dict()之带入一个可迭代并且每次迭代出一个二元的序列的对象,如 iterable = ('ab','cd','ef') -> dict(iterable) == {'a': 'b', 'c': 'd', 'e': 'f'},这种的反向操作是d4.items()
      • key必须不可变,在字典中唯一;字典是无序的。
      • 方法(python3):
        • dict.keys() -> key的迭代对象,可list()
        • dict.values() -> value的迭代对象,可list()
        • dict.items() -> 返回key,value二元组的可迭代对象
        • len(dict)-> 返回字典键值对个数
        • dict.clear() 清空字典 可变容器都有这个功能
        • dict.setdefault(k,None) 不存在就设置default值,这样添加就不会因为key冲突而报异常
        • dict.pop(key[,defaultvalue]) 和list.pop()类似,取出key对应的值,没有key就返回defaultvalue,没有default值抛异常
        • dict.get(self,k,d=None) 返回key对应的值,没有key返回default值,默认default为None
        • dict.copy() a shallow浅 copy of dict
        • dict.popitem(self) -> 返回键值对元组
        • dict.update(E,**F) 如果给了一个字典参数,那么使用参数字典的key更新dict有相同的key;如果是关键字参数,类似的,参数名作k,值做v,更新dict
    • 集合set
      • 可变,剔重,集合运算,set(),元素没顺序,因为元素必须唯一,所以集合中不能出现可变数据类型,如容器list,容器dict.
      • 强调集合本身也是一个容器,是可变的。可以通过frozenset()实例不可变集合。
      • 用处除了检查成员资格,还可以集合运算,剔重可迭代对象。
      • s1 = {1,2,3} s2 = set(可迭代对象)
      • in not in
      • 集合运算:
        • s1和s2并集: s1 | s3 ; s1.union(s2)
        • s1 s2 交集: s1 & s2 ; s1.intersection(s2)
        • s1 s2 对称差集: s1^s2 ; s1.symmetric_difference(b)
        • s1 差集 s2 : s1-s2 ; s1.difference(s2)
      • 集合包含关系:
        • 集合相等或不等: = ; !=
        • 集合s1 包含 s2: s1>=s2 ; s1.issuperset(s2)
        • 集合s1 包含于s2: s1<=s2 ; s1.issubset(s2)
        • 集合s1 不相交于 s2: s1.isdisjoin(s2)
      • 集合常用操作:
        1. set.add() 添加元素
        2. set.pop() 从集合中取出元素
        3. set.update() 将新元素和原集合并集的新集合
        4. set.clear() 清空集合
        5. set.copy() 浅copy
        6. set.remove() 删除元素,没有报异常
        7. set.discard() 删除元素,没有不报异常
    • collections模块
      *
    • 深浅copy(copy.deepcopy())/enumerate(,索引起点)/rang()/is not is/split join/zip()/
  • 相关阅读:
    iOS 网络优化--页面返回的时候取消网络请求
    iOS 内存管理
    realm数据库使用
    KNN 算法分类电影类型
    sklearn库学习之01
    Python 生成4位验证码图片
    Python——读写Excel文件
    KNN--用于手写数字识别
    Python基础学习-'module' object has no attribute 'urlopen'解决方法
    swift_通知的使用
  • 原文地址:https://www.cnblogs.com/ZJiQi/p/8659031.html
Copyright © 2011-2022 走看看