本周利用进行了DataX和kettle的实战,利用dataX和kettle对csv格式的数据源进行了清洗,将其导入到了MySQL数据库中,并对数据进行了查重。利用自己学习了一些Python的爬虫,爬取了新闻网站的标题和地址。