思路
如图左侧表头标题,要获得右侧数据。网页数据提取成汉字,表格数据间会有空格,用split()分隔成list。用index()查找某个汉字表头位置,输出list下一个位置既是要得到值
text2 ='网页纯文本,爬虫数据自己转换' # 字符串分割成列表,Python 分割字符串使用 变量.split("分割标示符号"[分割次数]),分割次数表示分割最大次数,为空则分割所有。 list2 = text2.split() #列表根据内容查找某个值的位置,list2为列表的名字,p是查找的值在list的位置 p = list2.index('查找的值,如管理规模区间') # v就是要获取的值,如20-50亿元 v = list2[p + 1]