因为使用python越来越频繁,有一些细节的东西经常用后一段时间没去用就会忘记,做些简单的笔记吧。
1.break和continue和pass
a = 0 while 1: a+=1 if(a%3==0): print("aa") else: print("bb") # continue # 后面的全部不执行了 # pass #似乎没影响,cc也会出来 # break #直接结束循环 print("cc") print("dd") time.sleep(5)
2.带有空格的class如何定位
带有空格的class直接使用find_element_by_class_name是找不到,使用find_element_by_css_selector代替,外加获取href的值:
browser.find_element_by_css_selector("[class='website icon-website ng-scope']").get_attribute('href')
3.多线程和logging日志打印
今天进行一些爬虫时,发现单线程进行还是很慢的,很多时候我们可以考虑用多线程。
import threading
import logging
# 指定时间格式
logging.basicConfig(level=logging.INFO,format='%(asctime)s %(message)s', datefmt='%Y-%m-%d %I:%M:%S %p')
def worker():
for x in range(100):
logging.info('{} is running'.format(threading.current_thread().name))
for x in range(1, 5):
name = 'work{}'.format(x)
t = threading.Thread(name=name, target=worker)
t.start()
python的多线程使用核心就是引入threading,然后使用它的.Thread(name,target)方法,启动多个线程去执行任务。
而logging的打印也差不多,可以通过basicConfig来设置打印配置。