zoukankan      html  css  js  c++  java
  • Python学习笔记3(数据结构)

    1.元组结构(Tuple)

    元组由不同的元素组成,每个元素可以存储不同类型的数据,如字符串、数字甚至元组。元组创建后不能修改。

    元组通常代表一行数据,而元组中的元素代表不同的数据项。

    1.1元组的创建

    创建时可不指定元素的个数,相当于不定长的数组,但一旦创建就不能修改元组的长度。

    tuple = (元素1, 元素2, ...)
    
    #创建并初始化
    tuple = ("apple", "banana","grape", "orange" )
    
    #创建一个空的元组
    tuple = ()

    创建只包含一个变量的元组时,单元素后面的逗号不能省略。因为Python无法区分变量tuple是元组还是表达式。

    1.2元组的访问

    tuple[n]                             #访问第n+1个元素

    元组访问的特殊用法:

    • 负数索引

            从元组的尾部开始技术,最尾端的元素索引表示“-1”,次尾端表示“-2”,以此类推。

    • 分片索引

            分片是元组的一个子集,分片是从第1个索引到第2个索引(包含第2个索引所指向的元素)所指定的所有元素。分片索引可以为正数或者负数,两个索引之间用冒号分隔。分片的格式如下:

    tuple[m:n]                             # m、n可以是0、正整数或负整数
    #   表示tuple中第m+1个元素到第n个元素,不包括n+1

    python称创建元组的过程为“打包”,相反,元组也可以执行解包的操作。

    #  打包
    tuple = ("apple", "banana","grape", "orange" )
    
    # 解包
    a, b, c, d = tuple
    print (a, b, c, d)                 #结果为 apple banana grape orange

    1.3元组的遍历

    # 二元元组的遍历
    tuple = ( ("apple", "banana"), ("grape", "orange"), ("melon",), ("charry",) )
    
    for i in range( len(tuple) ):
        print ("tuple[%d] : "  % i , " " ,)
        for j in range( len(tuple[i]) ):
            print (tuple[i][j], " ",)
        print()
    
    
    #output
    tuple[0] : apple banana
    tuple[1] : grape orange
    tuple[2] : melon
    tuple[3] : charry
    tuple = ( ("apple", "banana"), ("grape", "orange"), ("melon",), ("charry",) )
    for i in tuple:
        for j in i:
            print(j)            
    
     #output
    apple banana grape orange melon charry

     2.列表结构

    2.1列表基本操作

    通常作为函数的返回类型。和元组类似,也是由一组元素组成的,列表可以实现添加、删除和查找操作,元素的值可以被修改。

    # 列表操作
    
    # 定义列表
    list = [ "apple", "banana", "grape", "orange"]
    print (list)
    print (list[2])
    
    # 在列表末尾添加元素
    list.append("melon")
    # 向列表list[1]处插入元素
    list.insert(1, "charry")
    print (list)
    
    # 从列表中移除grape
    list.remove("grape")
    print (list)
    # 打印列表最后一个元素
    print ( list.pop() )

     2.2列表的使用

    列表与元组相似,同样支持负数索引、分片以及多元列表等特性。

    # 负数索引和分片的使用
    list = [ "apple", "banana", "grape", "orange"]
    print (list[-2])                            # grape
    print (list[1:3])                          # ['banana', 'grape']
    print (list[-3:-1])                       # ['banana', 'grape']
    
    # 二元列表的遍历
    list = [ ["apple", "banana"], ["grape", "orange"], ["melon"], ["charry"] ]
    for i in range( len(list) ):
        print ( "list[%d] :" % i, " ",)
        for j in range( len(list[i]) ):
            print (list[i][j], " ",)
        print()

    列表的连接可以使用extend(),或使用运算符“+”或“+=”。

    list1 = ["apple", "banana"]
    list2 = ["grape", "orange"]
    # 将list2接在list1后
    list1.extend(list2)
    print (list1)
    
    list3 = ["melon"]
    list1 = list1 + list3
    print (list1)
    
    list +=  ["charry"] ]
    print (list1)
    
    list1 = ["apple", "banana"] * 2
    print (list1)

    2.3列表的查找、排序、反转

    list = [ "apple", "banana", "grape", "orange"]
    # 打印grape的索引
    print ( list.index("grape") )
    # 判断orange是否在列表中
    print ( "orange" in list )
    list = ["banana", "apple",  "orange", "grape"]
    # 按字典序排序
    list.sort()
    print ("Sorted list: ", list)
    # 反转
    list.reverse()
    print ("Reversed list: ", list)

    2.4列表实现堆栈和队列

    # 堆栈的实现
    list = ["apple",  "grape", "grape"]
    list.append("orange")
    print (list)
    print ("弹出的元素: ", list.pop())
    print (list)
     # 队列的实现
    
    list = ["apple",  "grape", "grape"]
    list.append("orange")
    print (list)
    print ("弹出的元素: ", list.pop(0))
    print (list)

    3.字典结构
    字典是由“键-值”对组成的集合,字典中的“值”通过“键”来引用。

    3.1字典的创建

    # 字典创建格式
    dictionary = {key1 : value1, key2 : value2, ...}
    
    # 空字典
    dictionary = {}
    
    # 字典的创建和访问
    dict = {"a" : "apple", "b" : "banana", "g" : "grape", "o" : "orange"}
    print (dict)                # {'a' : 'apple', 'b' : 'banana', 'g' : 'grape', 'o' : 'orange'}
    print (dict["a"])         # apple
    
    print ("%s, %(a)s, %(b)s % {"a": "apple", "b": "banana"})
    # 输出:  {'a' : 'apple', 'b' : 'banana'}, apple, banana

    3.2字典的访问

    dict = {"a" : "apple", "b" : "banana", "g" : "grape", "o" : "orange"} 
    #添加
    dict["m"] = "melon"
    # 删除
    del(dict["a"])
    # 修改
    dict["a"] = "almond"
    # 弹出字典中键位b的元素
    print (dict.pop("b")
    print (dict)
    # 清空dict
    dict.clear()              
    print (dict)         
    # 字典的遍历
    dict = {"a" : "apple", "b" : "banana", "g" : "grape", "o" : "orange"}
    for k in dict:
        print ("dict[%s] = " % k, dict[k])
    
    # output
    dict[a] = apple
    dict[b] = banana
    dict[g] = grape
    dict[o] = orange
    # 字典item()的使用
    dict = {"a" : "apple", "b" : "banana", "g" : "grape", "o" : "orange"}
    print (dict.items())
    
    # output
     {('a' , 'apple'), ('b' , 'banana'), ('g' , 'grape'), ('o' , 'orange')}
    
    # 调用item()实现字典的遍历
    dict = {"a" : "apple", "b" : "banana", "g" : "grape", "o" : "orange"}
    for (k,v) in dict.items():
        print ("dict[%s] ="  % k, v)
    
    # output
    dict[a] = apple
    dict[b] = banana dict[g] = grape
    dict[o] = orange

    元组、列表、字典作为字典的value值时,该字典称为混合型字典。

    # 混合型字典的创建格式
    dict = {"key1" : (tuple), "key2" : [list], "key3" : [dictionary], ...}
    
    # 访问方法由外向内叠加

    3.3字典的方法

    dict = {"a" : "apple", "b" : "banana", "g" : "grape", "o" : "orange"}
    # keys()返回字典的key列表
    print (dict.keys() )        #  {'a', 'b', 'g', 'o'}
    
    # values()返回字典的value列表
    print ( dict.values() )     # {'apple', 'banana', 'grape', 'orange'}

    另一个获取value的办法是使用字典的get(),get()声明如下:

    D.get(k[,d])  ->  D[k]      
    # k为键值,d可作为get返回值,默认值为None
    # k在字典D中,返回D[K];若不在,返回参数d
    
    #get等价语句如下
    D = {"key1" : "value1", "key2" : "value2"}
    if "key1" in D:
        print (D["key1"])
    else:
        print ("None")
    
    # 用例
    print (dict.get("o", "apple") )   #输出键值o的值,若不存在输出apple

    若要添加新元素到已存在的字典中,调用update()函数。update把一个字典的key和value全复制到另一个字典中,相当于一个合并函数。

    # updat()等价语句
    D = {"key1" : "value1", "key2" : "value2"}
    E = {"key3" : "value3", "key4" : "value4"}
    for k in E:
        D[k] = E[k]
    print (D)                # {'key3' : 'value3', 'key2' : 'value2', 'key1' : 'value1', 'key4' : 'value4'}
    
    # 字典E中含有字典D中的key
    D = {"key1" : "value1", "key2" : "value2"}
    E = {"key2" : "value3", "key4" : "value4"}
    for k in E:
        D[k] = E[k]
    print (D)                # {'key2' : 'value3', 'key1' : 'value1', 'key4' : 'value4'}
    # 字典的更新
    dict = {"a" : "apple", "b" : "banana"}
    dict2 = {"g" : "grape", "o" : "orange"}
    dict.update(dict2)
    print (dict)             #{'a' : 'apple', 'g' : 'grape', 'b' : 'banana', 'o' : 'orange'}

    字典的setdefault()可以创建新的元素并设置默认值

    # 声明
    D.setdefault(k[,d])  -> D.get(k,d)
    若k在字典中,返回get(k,d)的结果;若不在,添加新元素D[k]并调用get(k,d)返回d的值
    
    # 设置默认值
    dict = {}
    dict.setdefault("a")
    print (dict)                 # {'a': None}
    dict["a"] = "apple"
    dict.setdefault("a","None")
    print (dict)                 # {'a': 'apple'}

     3.4字典的排序、复制

    # 调用sorted()排序
    dict = {"a" : "apple", "o" : "orange", "b" : "grape", "g" : "banana"}
    print (dict)
    
    # 按照key排序
    print ( sorted(dict.item(), key = lambda d: d[0]) )
    # 按照value排序
    print ( sorted(dict.item(), key = lambda d: d[1]) )
    
    # lambda可用于创建匿名函数,用于返回一些计算结果。

    若将字典A的内容复制到B并清除B,可以使用copy()

    #copy()定义
    D.copy() -> a shallow copy of D
    
    # 字典的浅拷贝
    dict = {"a" : "apple", "b" : "banana"}
    dict2 = {"g" : "grape", "o" : "orange"}
    dict2 = dict.copy()
    print (dict2)

    深拷贝能够拷贝对象内部所有的数据和引用,引用相当于C语言中指针的概念,Python并不存在指针,但是变量的内存结构通过引用来维护变量。而浅拷贝只是复制数据,并没有复制数据的引用,新的数据和旧的数据使用同一块内存空间。

    eg.B浅拷贝A的数据,B改变,A也改变。

    deepcopy()用于深拷贝.

    # 字典的深拷贝
    import copy
    dict = {"a" : "apple", "b" :{"g" : "grape", "o" : "orange"}}
    dict2 = copy.deepcopy(dict)
    dict3 = copy(dict)
    dict2["b"]["g"] = "orange"
    print (dict)                                # 不改变
    dict3["b"]["g"] = "orange"
    print (dict)                                # 改变

     3.5全局字典——sys.modules模块

    sys.modules是一个全局函数,这个字典是Python启动后就加载在内存中的。每当程序员导入新的模板,sys.modules都将记录这些模板。字典sys.modules对加载模板起到了缓存的作用。当模板第一次导入,sys.modules自动记录。第二次导入时,Python直接在字典中查找。

    import sys
    print ( sys.modules.keys() )           #  keys()返回当前环境下加载的模块
    print ( sys.modules.values() )        #  values()返回这些模板引用路径
    print ( sys.modules["os"] )            #  返回索引"os"对应的引用
    #  导入模块的过滤
    import sys
    d = sys.modules.copy()              # 把当前导入的模块信息保存到字典d中
    import copy, string                     # 导入模块copy、string,此时sys.modules包含原有模块和新导入的模块     
    print ( zip( set(sys.modules) - set(d) ) )    # 使用zip进行modules过滤
    
    #  set()把字典sys.modules、字典d存入set集合中,set集合实现了减法运算符
    #  set(sys.modules) - set(d)返回字典d中没有、而字典sys.modules中存在的模块
    #  然后用zip()对set集合“解包”,返回一个列表。该列表就是import copy,string语句导入的模块
    #  output:  [('copy',), ('strop',), ('string',)] 

     4.序列

    是具有索引和切片能力的集合。元组、列表和字符串具有通过索引访问某个具体的值,或通过切片返回一段切片的能力,因此元组、列表和字符串都属于序列。

    PS:  Python中的X[:,0]和X[:,0:1]的相关操作

  • 相关阅读:
    Java中的包装类
    Java中的StringBuffer和StringBuilder
    Java中的String类
    分类模型评价指标:混淆矩阵;ROC曲线;AUC面积
    matlab神经网络多分类(模式识别神经网络nprtool)
    matlabKNN多分类
    matlabSVM多分类:fitcecoc函数
    随机森林和GBDT
    matlab数据预处理
    CDN加速地址URL拿不到,显示“无法访问此网站”
  • 原文地址:https://www.cnblogs.com/farewell-farewell/p/5861496.html
Copyright © 2011-2022 走看看