时间过的飞快,转眼间,来公司三月出头了在领导的带领下,在同学们的配合和帮助下,我不断地学习新知识、总结新经验,努力加强着自身的素质和修养,完成了入职至今自己岗位上各项工作任务,简单汇报如下:
初入团队
从2018年8月20日加入公司以来,在平时工作中,我始终努力以工作高标准严格要求自己,严格遵守公司的各项规章制度。负责的工作范围从爬虫到数据清洗再到电脑维修。遇到问题能够做到不等不靠、不推脱责任,以最快的速度去解决问题,适时回报领导进展情况。能够有条不紊地安排完成好各项工作。
工作内容概括
a、B站行业用户信息获取31W,可用博主信息14000
b、小红书用户信息158W,可用博主信息14000
c、网易考拉种草社区用户信息6000,可用博主信息1000
d. 微博用户信息100W,可用博主信息5000
e. 淘宝直播用户信息36000,可用2000+
遇到的问题
a、做人留一线,不要把人家网站搞垮,都是混口饭吃不容易
b、目前对js爬虫这一块不太熟悉,导致很难受爬取一些网站的时候,需要充电。
c、 提升全局观念,沟通意识
思否
- 第一阶段(处于)
- 数据的准备(爬虫,数据仓库)
- 验证数据的准确性
- 数据清理(缺失值、异常值、垃圾信息、重复记录、合并数据集)
- 使用python进行文件读取csv或者txt便于操作数据文件
- 随机抽样查看
- 存储和归档
- 第二阶段(努力)
- 数据分析
- 数据建模
- 数据挖掘
- 撰写分析报告
- 机器学习(不太感兴趣)
- 数据分析
总结
近三个月来能取得这样的工作成绩,与领导的支持和大家的帮助、配合是分不开的,在此向公司的领导及全体同学们表示衷心的感谢!
以上是我近三个月来的思想、工作情况的简单总结,有不全面和不准确甚至错误的地方,请领导批评、指正。以便我在新的一年的工作中,有信心更进一步完善自身。把工作做的更加完善。为公司的大跨步发展添砖加瓦。
作为公司的一员 我非常愿意和公司一起继续努力发展,为共同迎接美好的2019而努力奋斗。