Python中文学习大本营:http://www.pythondoc.com/
一、字符串操作
一、用途:名字,性格,地址
name = 'wzs' #name = str('wzs')
print(id(name),type(name),name)
二、优先掌握的
1 # 优先掌握的 2 切片 顾头不顾尾 3 msg='hello world' 4 ##正向取值 5 print(msg[1:3]) 6 print(msg[1:10:2]) #哪 到哪 步长 7 print(msg[:]) 8 print(msg[::2]) 9 #反向取值 10 print(msg[::-1]) #步长可以为负值 11 print([]) 12 长度len 13 msg1 = 'qna ss' 14 print(len(msg1)) 15 16 成员运算 in和not in 17 msg = 'hello world' 18 print('he' in msg) 19 print('ho' not in msg) 20 21 移除空白(默认去掉字符串两端的空格)strip 22 password = 'alex3714 ' 23 ##可以不做赋值操作 24 print(password.strip()) 25 ##去掉指定的字符 26 msg2 = '*******eg**on*****' 27 print(msg2.strip('*')) 28 msg3 = ' ****wzs ***** ' 29 print(msg3.strip(' |*')) 30 31 #切分split 指定分隔符(默认以空格为分隔符) 32 取出用户名 33 user_info = 'root:x:0:0:root:/root:/bin/bash' 34 # print(user_info[0:4]) 35 print(user_info.split(':')[0]) #两个参数,以什么为分割和最多切割几次,默认有多少分割符,就切多少次 36 print(user_info.split(':',1)[0]) #以什么分割,分割多少次
三、常规操作
# isdigit 用来判断字符中是否是由纯数字组成(bytes 或Unicode组成)
1 msg = '******alex****' 2 print(msg.strip('*')) 3 print(msg.lstrip('*')) 4 print(msg.rstrip('*')) 5 6 msg = 'my name is wzs,my age is 18' 7 print(msg.startswith('my')) #以什么开头 8 print(msg.endswith('18')) #以什么结尾 9 10 print(msg.replace('my','wzs',1)) 11 12 #格式化输出 13 # 方式一 14 print('my name is %s,my age is %s' %('wzs',27)) 15 # 方式二 16 print('my name is {},my age is {}'.format('wzs',27) ) 17 # 方式三:打印指定位置的元素 18 print('{1} {0} {1}'.format('egon',18)) 19 print('my name is {x},my age is {y}'.format(y=27,x='wzs')) 20 21 join连接 22 user_info = 'root:x:0:0:root:/root:/bin/bash' 23 l = user_info.split(':') 24 print(l) #以什么为分隔,以列表显示 25 print(':'.join(l)) #列表元素用什么连接 26 print(' '.join(l)) 27 28 # center,ljust,rjust,zfill 29 print('wzs'.center(15,'=')) #center把前面的放在中间;总字符数量,其他的用‘=’填充 30 print('wzs'.ljust(15,'=')) #ljust 把前面的放在左边;总字符数量,其他的用‘=’填充 31 print('wzs'.rjust(15,'=')) #rjust 把前面的放在右边;总字符数量,其他的用‘=’填充 32 print('wzs'.zfill(15)) #zfill 把前面的放在右边;总字符数量,其他的用‘0’填充
四、了解
1 find,rfind,index,rindex,count 2 # # find 查找 3 # msg = 'hello world' 4 # print(msg.find('ell')) ##从左到右找,若有,则返回第一个字符的索引 5 # print(msg.find('ell33')) ##从左到右找,若没有,则返回-1 6 # #index 索引 7 # print(msg.index('e',0,4)) #从左到右找(可以指定范围),若有,则返回返回第一个字符的索引 8 # # print(msg.index('ell33')) ##从左到右找(可指定范围),若没有,则会报错 所以不要以index找元素 9 # # count 统计在某个范围(默认是整个范围)一个fa某个元素的数量 10 # print(msg.count('l',0,8)) 11 # 12 # 设定tab空格的数量 13 # msg='abc deft' 14 # print(msg.expandtabs(3)) 15 # 16 # 字母数字判断 17 # 字母大小写转换 18 # msg='i am Chinese people' 19 # # msg = 'wzs112' 20 # print(msg.capitalize()) #首字母大写 21 # print(msg.upper()) #字母全转换成大写 22 # print(msg.lower()) #字母全转换成小写 23 # print(msg.title()) #单词首字母大写 24 # print(msg.swapcase()) #变量是否包含空格 25 # 26 # is系列 27 # msg='i am Chinese people' 28 # print(msg.isupper()) #是否全部大写 29 # print(msg.islower()) #是否全部小写 30 # print(msg.istitle()) #是否首字母大写 31 # 32 # 字母和数字 33 # msg='asasdf123' 34 # print(msg.isalnum()) #字符串是否由字母或数字组成 35 # msg = 'asdfasdf' 36 # print(msg.isalpha()) #字符串是否只有字母组成 37 # 38 # msg=' ' 39 # print(msg.isspace()) ##是否只有空格 40 # msg='aaaai fabc' 41 # print(msg.isidentifier()) #标志符 42 # 43 # 判断数字 44 # age = 27 45 # inp = input('age>>: ').strip() #输入内容有空格,去掉 46 # if inp.isdigit(): 47 # inp=int(inp) 48 # if inp > age: 49 # print('ok') 50 # else: 51 # print('必须输入数字') 52 # 53 num1=b'4' #bytes 54 num2=u'4' #unicode,python3中无需加u就是unicode 55 num3='四' #中文数字 56 num4='壹' 57 num5='Ⅳ' #罗马数字 58 59 # bytes,unicode 60 print(num1.isdigit()) 61 print(num2.isdigit()) 62 print(num3.isdigit()) 63 print(num4.isdigit()) 64 print(num5.isdigit()) 65 66 # unicode 67 # print(num2.isdecimal()) 68 # print(num3.isdecimal()) 69 # print(num4.isdecimal()) 70 # print(num5.isdecimal()) 71 72 # unicode,汉字,罗马 73 # print(num2.isnumeric()) 74 # print(num3.isnumeric())
二、列表操作
列表是最常用的数据类型之一,通过列表可以对数据实现方便的存储、修改的等操作
定义列表:fruits = [“’apple”,”orange“,”pear”,”banana”]
列表通过下标,访问数据,下标从0开始
一、常规操作
students = ['wzs','alex','egon',11,['cyy','bjq']]
1、切片
1 print(students[1:5])
2、追加
1 students.append('oldboy')
3、插入
1 students.insert(1,'alex')
4、修改
students[2] = 'xiaoming' print(students)
5、删除
1 del students[4] ##del是一种通用的删除方式 2 students.remove('egon') ##remove按照值去删的,是单纯的删除,不会返回删除的值 3 print(students) 4 students.pop() #pop按照索引去删,默认从末尾(-1)开始删除 5 res = students.pop(1) 6 print(res)
6、取值
1 print(students[2])
7、迭代 extend()方法
学习链接地址:https://www.cnblogs.com/wushuaishuai/p/7729011.html
二、常规操作
1 students = ['wzs','alex','egon',11,['cyy','bjq']] 2 # 插入 指定位置插入值 3 students.insert(1,'alex') 4 #可以以列表的方式追加多个元素到原来列表的末尾 5 students.extend([1,34,5,6]) 6 #统计列表某个元素的个数 7 print(students.count('alex')) 8 print(students)
三、了解
students = ['wzs','alex','egon',11,['cyy','bjq']] # 清除列表 print(students.clear()) # 复制 l = students.copy() print(l)
# 修改原列表,返回Node # 反转 reverse() #单纯的反转,将列表的索引顺序从倒过来 students.reverse() print(students)
print(students.reverse())
# 不改变原列表,返回反转后的新列表(使用列表的切片实现)
l1=l[::-1]
print(l1)
#sort排序,默认是从小到的顺序 l=[2,44,-2,11,18] # l.sort() l.sort(reverse=True) #从大到小的顺序排序元素 print(l)
五、列表合并
1、使用“+”号
运算符的重载
l1=[1,2,3] l2=[1212,"hello"] l3=l1+l2 print(l3)
2、使用extend方法
方法比较简洁,但会覆盖原始list
l1.extend(l2) print(l1)
3、使用切片进行合并
功能比较强大,可以将一个列表插入另一个列表的任意位置
以列表的长度切片合并,结果和前两种方法结果一样。在前面列表尾部插入列表。
l1[len(l1):len(l1)]=l2 print(l1)
在前面的开头插入列表
l1[0:0]=l2 print(l1)
也可以指定任意位置插入
l1[1:1]=l2 print(l1)
六、练习
#队列 先进先出 # 使用apend # l1=[] # l1.append('first') # l1.append('second') # l1.append('third') # print(l1) # print(l1.pop(0)) # print(l1.pop(0)) # print(l1.pop(0)) #堆栈 先进后出 # print(l1.pop(-1)) # print(l1.pop(-1)) # print(l1.pop(-1))
#使用insert和pop l2=[] l2.insert(0,'four') l2.insert(0,'five') l2.insert(0,'six') print(l2) ##堆栈 后进先出原则 # print(l2.pop(0)) # print(l2.pop(0)) # print(l2.pop(0)) ##队列 先进先出原则 print(l2.pop(-1)) print(l2.pop(-1)) print(l2.pop(-1))
三、元组
作用:存多个值,对标列表来说,元组不可变(是可当作字典的key的),主要用来读
元组比列表更节省空间。
元组其实跟列表差不多,只是元组一旦创建,便不能再修改,所以又叫只读列表
定义元组:names = (“wzs”,"alex","egon")
只有两个方法,一个count,一个index
1 salary = (12000,18000,9000,36000)
2 # print(id(salary),type(salary),salary)
一、优先掌握的操作
1 # 按索引取值(正向取+反向取)
2 print(salary[1])
3 # 切片
4 print(salary[:5:2])
5 #长度(元素的数量)
6 print(len(salary))
7 #成员运算 in和not in
8 print(12000 in salary)
二、常规操作
1 # index 取索引所对应的值 索引存在,返回相对应的值;不存在报错
2 print(salary.index(12000))
3 # print(salary.index(120001))
4 #count 统计列表中元素的数量
5 print(salary.count(9000))
三、数据取值操作 for和while循环
1 #列表、字符串和元组通过索引取值,while循环;
2 l1 = [12,45,11,66,112]
3 index = 0
4 while index < len(l1):
5 # print(index) #取索引
6 print(index,l1[index]) #取索引和索引所对应的值
7 index +=1
8
9 # #使用for 循环
10 l = ['a','b','t','s','e']
11 #直接取值
12 for item in l:
13 print(item)
14 # 取索引
15 for item in range(len(l)):
16 print(item)
四、练习
简单购物车,要求如下: 实现打印商品详细信息,用户输入商品名和购买个数,则将商品名,价格,购买个数加入购物列表,如果输入为空或其他非法输入则要求用户重新输入
msg_dic={ 'apple':10, 'tesla':100000, 'mac':3000, 'lenovo':30000, 'chicken':10, }
1 msg_dic={
2 'apple':10,
3 'tesla':100000,
4 'mac':3000,
5 'lenovo':30000,
6 'chicken':10,
7 }
8 goods_l=[] ##定义购物车
9 while True:
10 for key in msg_dic: #循环商品列表
11 print(key,msg_dic[key])
12 choice = input("你想购买什么:").strip() ##输入你自己需要的东西,去掉空字符串
13 if choice not in msg_dic:continue #在若你输入的东西不在字典中,停止这个循环,继续输入
14 count = input("个数>>:").strip()
15 if count.isdigit():#判断输入的必须是数字
16 goods_l.append((choice,msg_dic[choice],int(count))) ##将用户输入信息追加到元组中
17 print(goods_l)
四、字典
作用:存多个值,key-value存取,取值速度快
定义:key必须是不可变类型,value可以是任意类型
语法:
1 info = { 2 'stu001':"小明", 3 'stu002':"小红", 4 'stu003':"小亮", 5 }
一、字典的特性:
1、字典是无序的
2、key必须是唯一的
二、优先的操作:
1 info = {'name':'wzs','age':27,'sex':'male'}
1、增加
1 info['hobbies'] = ['running','reading','music']
2 print(info)
2、修改
1 info['name']='alex' 2 print(info)
3、删除
1 print(info.pop('name')) #删除指定的key
2 print(info.pop('wzs',None)) #删除的key不存在,可自定义返回的内容(默认值是None)
3 print(info.popitem()) #删除的key不存在,可自定义返回的内容(默认值是None)
4 print(info)
4、查找
1 info2 = {'name':'wzs','age':20,'sex':'male'}
2 #取值get
3 # print(info2['name12']) ##直接使用key取值,key不在会报错
4 print(info2.get('name12','inexistent')) #使用get取值,存在会返回相应的值;不存在则返回自定义的值
5 print(info2.popitem()) #随机删除一个键值对
5、多级字典嵌套机操作
1 av_catalog = {
2 "欧美":{
3 "www.youporn.com": ["很多免费的,世界最大的","质量一般"],
4 "www.pornhub.com": ["很多免费的,也很大","质量比yourporn高点"],
5 "letmedothistoyou.com": ["多是自拍,高质量图片很多","资源不多,更新慢"],
6 "x-art.com":["质量很高,真的很高","全部收费,屌比请绕过"]
7 },
8 "日韩":{
9 "tokyo-hot":["质量怎样不清楚,个人已经不喜欢日韩范了","听说是收费的"]
10 },
11 "大陆":{
12 "1024":["全部免费,真好,好人一生平安","服务器在国外,慢"]
13 }
14 }
15
16 av_catalog["大陆"]["1024"][1] += ",可以用爬虫爬下来"
17 print(av_catalog["大陆"]["1024"])
18 #ouput
19 ['全部免费,真好,好人一生平安', '服务器在国外,慢,可以用爬虫爬下来']
6、键值对的数量 len和成员运算
1 print(len(info))
2 # # 成员运算 in 和not in
3 print('name' in info)
7、循环字典
1 for key in info.keys():
2 print(key)
3 for val in info.values():
4 print(val)
5 for item in info.items():
6 print(item)
三、常用的方法
setdefault的功能 1:key存在,则不赋值,key不存在则设置默认值 2:key存在,返回的是key对应的已有的值,key不存在,返回的则是要设置的默认值
1 #设定两个参数,分别传值
2 for k,v in info2.items():
3 print(k,v)
4 #设定空键值对
5 print(info2.setdefault('hobbbies',['reading','runnning'])) ##有则不改,返回已有的值;没有则新增,返回新增的值
6 print(info2)
7 #设定空置的键值对
8 print(info2.setdefault('hobbies',[]))
9 print(info2['hobbies'])
判断key是否在字典中,若不在,先创建空值键值对(值为列表),然后追加值到列表;若在的话,追加新值到列表中
1 info3 = {'name':'wzs','age':20,'sex':'male'}
2 #方式一
3 if 'hobbies' not in info3:
4 info3['hobbies'] = []
5 info3['hobbies'].append('music')
6 else:
7 info3['hobbies'].append('read')
8 #方式二
9 info3.setdefault('hobbies',[]).append('music')
10 info3.setdefault('hobbies',[]).append('read')
11 print(info3)
四、了解的操作
1 ##update 新增字典的键值对:创建新的字典,使用update将新的字典里面的内容增加到原来的字典中
2 info = {'name':'wzs','age':27,'sex':'male'}
3 info_new = {'a':1,'b':16737}
4 info.update(info_new)
5 print(info)
6
7 #创建初始化字典
8 #新字典如下dic={'name':None,'age':None,'sex':None,'hobbies':None}
9 dic_new = {}.fromkeys(['name','age','sex','hobbies'],None)
10 print(dic_new)
五、扩展
1、有序字典类OrderedDict
https://www.cnblogs.com/zhenwei66/p/6596248.html
from collections import OrderedDict
2、Python中字典合并的四种方法
字典是Python语言中唯一的映射类型。字典是Python中最强大的数据类型之一。
映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的的关系,通常被认为是可变的哈希表。
字典对象是可变的,它是一个容器类型,能存储任意个数的Python对象,其中也可包括其他容器类型。
1、字典类型与序列类型的区别:
- 存取和访问数据的方式不同。
- 序列类型只用数字类型的键(从序列的开始按数值顺序索引);
- 映射类型可以用其他对象类型作键(如:数字、字符串、元祖,一般用字符串作键),和序列类型的键不同,映射类型的键直4.接或间接地和存储数据值相关联。
- 映射类型中的数据是无序排列的。这和序列类型是不一样的,序列类型是以数值序排列的。
- 映射类型用键直接“映射”到值。
2、具体的方法如下链接
https://blog.csdn.net/jerry_1126/article/details/73017270
3、其他
1 # 1、链式赋值
2 x=10
3 y=x
4 x=y=z=20
5 print(id(x),id(y),id(z))
6 #交换两个变量的值
7 m = 10
8 n = 20
9 print(m,n)
10 m,n = n,m
11 print(m,n)
12
13 # 从一个数据类型中解压出我们想要的值
14 t=(22,433,42,454,99)
15 a,b,c,d,e=t
16 # print(t)
17 # 支取自己想要的值
18 # a,_,_,_,e=t
19 # print(a,e)
20 a,*_,e=t #等价于上面的
21 print(a,e)
22
23 # 字典 只取出字典中的key
24 x,y,z={'a':1,'b':2,'c':3}
25 print(x,y,z)
六、练习
1、有如下值集合 [11,22,33,44,55,66,77,88,99,90...],将所有大于 66 的值保存至字典的第一个key中,将小于 66 的值保存至第二个key的值中 即: {'k1': 大于66的所有值, 'k2': 小于66的所有值}
1 #1、设定一个空值列表的键值对字典,两个key;使用if判断,符合条件分别放到一个列表中 2 dic_num = {'k1':[],'k2':[]} 3 num = [11,22,33,44,55,66,77,88,99,90] 4 for i in num: 5 if i > 66: 6 dic_num['k1'].append(i) 7 else: 8 dic_num['k2'].append(i) 9 print(dic_num)
2 统计s='hello alex alex say hello sb sb'中每个单词的个数 结果如:{'hello': 2, 'alex': 2, 'say': 1, 'sb': 2}
1 for word in words: 2 if word in dic: 3 dic[word] +=1 4 else: 5 dic[word] =1 6 print(dic)
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 4 s = 'hello alex alex say hello sb sb' 5 dic = {} 6 words = s.split() ##将字符串空格为分隔,转换成列表形式 7 for word in words: 8 dic[word]=s.count(word) 9 print(dic)
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 4 s = 'hello alex alex say hello sb sb' 5 dic = {} 6 words = s.split() ##将字符串空格为分隔,转换成列表形式 7 #使用setdefault设定字典的键值对 8 for word in words: 9 dic.setdefault(word,s.count(word)) 10 print(dic)
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 4 s = 'hello alex alex say hello sb sb' 5 dic = {} 6 words = s.split() ##将字符串空格为分隔,转换成列表形式 7 # print(words) 8 #使用集合去重,减少循环次数 9 words_set = set(words) 10 for word in words_set: 11 dic[word]=s.count(word) 12 print(dic)
五、集合操作
集合是一个无序的,不重复的数据组合,他的主要作用是
- 去重,把一个列表整合,就自动去重了
- 关系测试,测试两组数据之前的交集、差集、并集等等
定义集合:
集合:可以包含多个元素,用逗号隔开
集合的元素遵循的三个原则:
1、每个元素是不可变类型(可hash,可作为字典的key)
2、没有重复的元素
3、无序
一、优先掌握的操作
1、并集:| 交集:& 差集:- 对称差集:^
1 pythons={'alex','egon','yuanhao','wupeiqi','gangdan','biubiu'}
2 linuxs={'wupeiqi','oldboy','gangdan'}
3 #| 并集
4 # print(pythons | linuxs) #并集
5 # print(pythons.union(linuxs))
6 #& 交集
7 # print(pythons & linuxs) #交集
8 # print(pythons.intersection(linuxs))
9 #- 差集
10 # print(pythons - linuxs)#差集
11 # print(pythons.difference(linuxs))
12 # print(linuxs - pythons)
13 #^ 对称差集
14 # print(pythons ^ linuxs) #对称差集
15 # print(pythons.symmetric_difference(linuxs))
2、> , >= , <, <= 父集,子集
1 # s1={1,2,3,4}
2 # s2={3,4,5}
3 # print(len(s1) > len(s2))
4 #
5 s1={1,2,3,4}
6 s2={3,4}
7 # print(s1 > s2)
8 print(s1.issubset(s2)) #子集
9 print(s1.issuperset(s2)) #父集
10 # print(s1 >= s2)
3、去重
有列表l=['a','b',1,'a','a'],列表元素均为可hash类型,去重,得到新列表,且新列表无需保持列表原来的顺序
#列表去重。先转换为集合,去重结束,再转换成列表
方法一:下面的顺序是乱的
1 l=['a','b',1,'a','a'] 2 l_new=list() 3 s=set() 4 for item in l: 5 if item not in s: 6 s.add(item) 7 l_new.append(item) 8 print(s)
方法二:下面的方法是保持原来的顺序
1 l=['a','b',1,'a','a']
2 l_new=list()
3 s=set()
4 res=tuple(l)
5 for item in res:
6 if item not in s:
7 s.add(item)
8 l_new.append(item)
9 print(l_new)
有如下列表,列表元素为不可hash类型,去重,得到新列表,且新列表一定要保持列表原来的顺序
l=[
{'name':'egon','age':18,'sex':'male'},
{'name':'alex','age':73,'sex':'male'},
{'name':'egon','age':20,'sex':'female'},
{'name':'egon','age':18,'sex':'male'},
{'name':'egon','age':18,'sex':'male'},
]
1 l=[ 2 {'name':'egon','age':18,'sex':'male'}, 3 {'name':'alex','age':73,'sex':'male'}, 4 {'name':'egon','age':20,'sex':'female'}, 5 {'name':'egon','age':18,'sex':'male'}, 6 {'name':'egon','age':18,'sex':'male'}, 7 ] 8 l_new = list() 9 s = set() 10 for item in l: 11 res = (item['name'],item['age'],item['sex']) 12 if res not in s: 13 s.add(res) 14 l_new.append(item) 15 print(l_new)
六、数据类型总结
一、数据类型分类
1、按存储空间的占用分(从低到高)
数字 字符串 集合:无序,即无序存索引相关信息 元组:有序,需要存索引相关信息,不可变 列表:有序,需要存索引相关信息,可变,需要处理数据的增删改 字典:无序,需要存key与value映射的相关信息,可变,需要处理数据的增删改
2、按存值个数区分
标量/原子类型 | 数字,字符串 |
容器类型 | 列表,元组,字典 |
3、按可变不可变区分
可变 | 列表,字典 |
不可变 | 数字,字符串,元组 |
4、按访问顺序区分
直接访问 | 数字 |
顺序访问(序列类型) | 字符串,列表,元组 |
key值访问(映射类型) | 字典 |
七、字符编码与转码
字符编码与转码:http://www.cnblogs.com/linhaifeng/articles/5950339.html