基本数据类型
Python基本的数据类型包含数字类型、字符类型、列表、元祖、集合、字典6种。
数字 int/float/True/False
种类
- 整型int(Python3中没有长整型,int长度几乎没有限制)
- 浮点型float
- 布尔型bool
- False: 0,0.0,'',[],(),{}
- True: 除False以外,['']或[[],[]]不是False
- 复数型complex
操作符
+,-,*,/,//(地板除),**(乘方) - Python3中的/是真实除,1/2=0.5
类型转换
1. str(): 其他类型转为字符串, 如```str(12)```
2. int(): 字符串数字转为整型(字符串不是纯整数会报错), 如```int("12")```
3. float(): 字符串转换为浮点数,如```float("1.23")```
字符串 str
- 字符串系统方法
- len(): 计算字符串长度,如
len("abcdefg")
- find()/index(): 查找字符串中某个字符第一次出现的索引(index()方法查找不到会报错), 如
"abcdefg".find("b"); "abcedfgg".index("g")
- lower()/upper(): 将字符串转换为全小写/大写,如
"AbcdeF".lower();"abcedF".upper()
- isdigit()/isalpha()/isalnum(): 判断字符串是否纯数字/纯字母/纯数字字母组合, 如
isdigit("123")
,结果为 True - count(): 查询字符串中某个元素的数量,如
"aabcabc".count("a")
- join(): 将列表元素按字符串连接,如
"".join(["a","b","c"])
会按空字符连接列表元素,得到"abc" - replace(): 替换字符串中的某已部分,如
"hello,java".replace("java", "python")
,将java 替换为 python - split(): 和join相反,将字符串按分隔符分割成列表, 如
"a,b,c,d".split(",")
得到["a", "b", "c", "d"] - strip()/lstrip()/rstrip(): 去掉字符串左右/左边/右边的无意字符(包括空格,换行等非显示字符),如
" this has blanks ".strip()
得到"this has balnks"
- len(): 计算字符串长度,如
- 字符串格式化
- %: 如
"Name: %s, Age: %d" % ("Lily", 12)
或"Name: %(name)s, Age: %(age)d" % {"name": "Lily", "age": 12}
- format: 如
"Name: {}, Age: {}".format("Lily", 12)
或"Name: {name}, Age: {age}".format(name="Lily",age=12)
- substitude(不完全替换会报错)/safe_substitude: 如
"Name: ${name}, Age: ${age}".safe_substitude(name="Lily",age=12)
- %: 如
- 案例: 利用format生成自定义html报告
tpl='''<html>
<head><title>{title}</title></head>
<body>
<h1>{title}</h1>
<table border=1px>
<tr>
<th>序号</th>
<th>用例</th>
<th>结果</th>
</tr>
{trs}
</table>
</body>
</html>
'''
tr='''<tr><td>{sn}</td>
<td>{case_name}</td>
<td>{result}</td>
'''
title="自动化测试报告"
case_results = [("1", "test_add_normal", "PASS"),("2", "test_add_negative", "PASS"), ("3", "test_add_float", "FAIL")]
trs=''
for case_result in case_results:
tr_format = tr.format(sn=case_result[0], case_name=case_result[1], result=case_result[2])
trs += tr_format
html = tpl.format(title=title, trs=trs)
f = open("report.html", "w")
f.write(html)
f.close()
结果预览:
自动化测试报告
序号 | 用例 | 结果 |
---|---|---|
1 | test_add_normal | PASS |
2 | test_add_negative | PASS |
3 | test_add_float | FAIL |
列表 list
列表元素支持各种对象的混合,支持嵌套各种对象,如
["a", 1, {"b": 3}, [1,2,3]]
-
列表操作
- 赋值:
l = [1, "hello", ("a", "b")]
- 获取:
a = l[0] # 通过索引获取
- 增:
l.append("c");l.extend(["d","e"]);l+["f"]
- 删:
l.pop() # 按索引删除,无参数默认删除最后一个;l.remove("c") # 按元素删除
- 改:
l[1]="HELLO" # 通过索引修改
- 查: 遍历
for i in l: print(i)
- 赋值:
-
列表系统方法
- append()/insert()/extend(): 添加/插入/扩展(连接)
- index(): 获取元素索引
- count(): 统计元素个数
- pop()/remove(): 按索引/元素删除
- sort()/reverse(): 排序/反转
- 案例: 字符串反转
s="abcdefg"; r=''.join(reversed(a))
元组 tuple
- 不可改变,常用作函数参数(安全性好)
- 同样支持混合元素以及嵌套
- 只有一个元素时,必须加","号,如
a=("hello",)
- 因为Python中()还有分组的含义,不加","会识别为字符串
字符串/列表/元组统称为序列, 有相似的结构和操作方法
序列相关操作方法
1. 索引- 正反索引: `l[3];l[-1]`
- 索引溢出(IndexError): 当索引大于序列的最大索引时会报错,如[1,2,3,4]最大索引是3,引用l[4]会报IndexError
-
切片
- l[1:3] # 从列表索引1到索引3(不包含索引3)进行截取, 如 l = [1, 2, 3, 4, 5], l[1:3]为[2, 3]
- l[:5:2] # 第一个表示开始索引(留空0), 第二个表示结束索引(留空为最后一个,即-1), 第三个是步长, 即从开头到第5个(不包含第5个),跳一个取一个
- 案例: 字符串反转
s="abcdefg";r=s[::-1]
-
遍历
- 按元素遍历:
for item in l: print(item)
- 按索引遍历:
for index in range(len(l)): print(l[index])
- 按枚举遍历:
for i,v in enumerate(l): print((i,v))
- 按元素遍历:
-
扩展/连接(添加多个元素): extend()/+
"abc"+"123";[1,2,3]+[4,5];[1,2,3].extend([4,5,6,7])
-
类型互转: str()/list()/tuple()
list转str一般用join(), str转list一般用split()
- 系统函数
- len(): 计算长度
- max()/min(): 求最大/最小元素
- sorted()/reversed(): 排序/反转并生成新序列(sort()/reverse()直接操作原序列)
l_new=sorted(l);l_new2=reversed(l)
集合 set
- 集合可以通过序列生成
a = set([1,2,3])
- 集合无序,元素不重复(所有元素为可哈希元素)
- 集合分为可变集合set和不可变集合frozenset
- 操作方法: 联合|,交集&,差集-,对称差分^
- 系统函数: add()/update()/remove()/discard()/pop()/clear()
- 案例1: 列表去重:
l=[1,2,3,1,4,3,2,5,6,2];l=list(set(l))
(由于集合无序,无法保持原有顺序) - 案例2: 100w条数据,用列表和集合哪个性能更好? - 集合性能要远远优于列表, 集合是基于哈希的, 无论有多少元素,查找元素永远只需要一步操作, 而列表长度多次就可能需要操作多少次(比如元素在列表最后一个位置)
字典 dict
- 字典是由若干key-value对组成, Python3.6后字典是有序的, 字典的key不能重复,而且必须是可哈希的,通常是字符串
- 字典操作
- 赋值:
d = {"a":1, "b":2}
- 获取:
a = d['a']
或a = d.get("a") # d中不存在"a"元素时不会报错
- 增:
d["c"] = 3; d.update({"d":5, "e": 6}
- 删:
d.pop("d");d.clear() # 清空
- 查:
d.has_key("c")
- 遍历:
- 遍历key:
for key in d:
或for key in d.keys():
- 遍历value:
for value in d.values():
- 遍历key-value对:
for item in d.items():
- 遍历key:
- 案例: 更新接口参数 api = {"url": "/api/user/login": data: {"username": "张三", "password": "123456"}},将username修改为"李四"
api['data']['username'] = "李四"
或api['data'].update({"username": "李四"})
哈希与可哈希元素
- 哈希是通过计算得到元素的存储地址(映射), 这就要求不同长度的元素都能计算出地址,相同元素每次计算出的地址都一样, 不同元素计算的地址必须唯一, 基于哈希的查找永远只需要一步操作, 计算一下得到元素相应的地址, 不需要向序列那样遍历, 所以性能较好
- 可哈希元素: 为了保证每次计算出的地址相同, 要求元素长度是固定的, 如数字/字符串/只包含数字,字符串的元组, 这些都是可哈希元素
6种类型简单的特点总结
不可变类型:数字/字符串/元祖、frozen set
可变类型:列表、集合、字典
有序类型:序列(字符串/列表/元祖)及字典(Python3.6后默认按键值插入顺序有序)
无需类型:集合