一、Python字符串练习
1.http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html
取得校园新闻的编号.
(这个方法就很多了,一般方法二和方法三用得比较多一点)
# 定义字符串 s = "http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html" # 方法一 直接获取 print(s[-14:-5]) #方法二 利用rstrip ss = s.rstrip(".html")[-9:] print(ss) #方法三 利用rstrip和split sss = s.rstrip(".html").split("_") print(sss[1])
2.https://docs.python.org/3/library/turtle.html
产生python文档的网址。
(这个数组可以通过加法进行结合)
# 数组一 add1 = "https://docs.python.org/3/library/turtle" #数组二 add2 = ".html" s = add1 + add2 print(s)
3.http://news.gzcc.cn/html/xiaoyuanxinwen/4.html
产生校园新闻的一系列新闻页网址。
(一系列的新闻信息,一般仅仅会变化数字,那么这就是我们可以通过for循环进行爬数据出来,format比较常用)
#定义一个变量i i=1 #通过for循环,还有常用的format进行输出 for i in range(6): print("http://news.gzcc.cn/html/xiaoyuanxinwen/{}.html".format(i))
4.练习字符串内建函数:strip,lstrip,rstrip,split,count
" http://news.gzcc.cn/html/xiaoyuanxinwen/4.html"
(先定义一个字符串s)
s = " http://news.gzcc.cn/html/xiaoyuanxinwen/4.html"
A.删去前空格
ss = s.strip(" ")
B.删去http://前缀
ssl = ss.lstrip("http://")
C.删去后缀“.html”并且输出数字
ssr = ss.rstrip(".html")[-1:]
D.显示出这一段有多少个n
sscount = s.count("n")
E.将以“/”分隔成多个单词
ssp = s.split("/")
最后通过print输出就可以看到结果啦!
print(ss) print(ssl) print(ssr) print(ssp) print(sscount)
二、组合数据类型练习
1.分别定义字符串,列表,元组,字典,集合,并进行遍历。
A.定义字符串
s = "Hello World !" print(s)
B.定义列表
s = ["aaa","bbb",[1,2,3]] for i in s :
print(i)
C.定义元祖
#定义一个列表 s = ["aaa","bbb",[1,2,3]] #定义元祖 tup = tuple(s) #遍历元祖 for i in tup : print(i) #由下面可知,元祖里面的儿子如果是列表,则列表里面可以修改,否则元祖是无法修改的 tup[-1][1] = 0 for i in tup : print(i) tup[0][0] = "aaa" for i in tup : print(i)
D.定义字典
#生成字典 dird = {'Micheal':23,'Marry':22,'Jany':43} #获取键“Micheal”值对,应该是23 print(dird["Micheal"])
E.定义集合
s1 = {1,3,5,7,9} s2 = {1,2,3,5} #获取s1、s2的相同部分 s = s1&s2 print(s)
2.总结列表,元组,字典,集合的联系与区别。
A.列表的特点是用方括号,列表内的值可以进行修改,可以用于一些需要经常改变的数值;
B.元祖的特点是用园括号内部的值是无法进行修改的,所以可以用于一些无法进行修改的数值,但是如果元祖内部有列表的子序列,那么列表内就可以 进行修改;
C.字典的特点是用大括号,但是对于列表和元祖的特点是键值对(key—value),但是不同于它们的是,key值是不能够修改的,所以对于一些用户名或者不可更改的值,可以用这个类型,密码可以随时修改,即value值。
D.集合也就是一组key的集合,但是不存储value,统同样和字典一样用大括号进行表示。
那么今天的字符串练习就到此结束了。