本来不想写,这一年浑浑噩噩,没啥可回顾的;但想了想,还是写个流水账,至少留个念想。
在2016年中,技术上没有什么长进,计划的马拉松也没有完成(跑步这事完全断掉了),机器学习的也没有太好的进展,英语学习也没有坚持下来,数学和统计学的学习同样没有坚持下来,尝试的报名了数据挖掘的比赛,然后我报完名就没有下文了,小说也没有戒掉,很多时间都花在公众号的文章,书读了几本,但读完就都忘了……,公司业务的数据支撑需求是基本都满足了,但其实离自己本身的年初的预想差距很大。总而言之现在回想来看,真的不太满意。
2017年的目标说之前先说一下个人对于大数据发展的一点点想法。
近些年云计算发展迅猛,一二线的云计算公司对于云上的产品线日渐丰富,对于大数据方向,大家仔细观察,我们常用的flume/kafka/etl/spark/storm/hive/oozie/hbase/机器学习/nosql/内存数据库/bi/分析系统在云上几乎都能找到替代产品,而如果一家中小公司要把这些基础架构保证稳定的情况下搭建出来往往比较困难,投入产出比也不值得。同时随着时间推移,基础架构人才和开发人才的成本往往越来越贵,而云计算因为规模效应原因费用会越来越便宜,此起彼伏,显然大数据上云一定是未来的方向。同时企业仅仅需要做将业务做好就足够了。基础架构人才将来慢慢会偏业务,运维人才的需求将越来越少。数据开发的技术门槛越来越底,行业经验越来越重要,个人觉得与数据分析岗越来越贴近(就像运营与分析一样。。。。。)
当然大家会考虑数据的安全性,基于国情来说,从大面上看数据放哪里其实都是不安全的。。。好吧,其实我认为云计算公司这种最基本的安全性和隐私性还是有保证的,我们反过来想,这么大的盘子市场这么多的用户,如果官方自己侵犯隐私,被发现后,谁还敢用?投入产出比真的是不值。如果真的心里没底,那么就多考虑一线的云计算公司吧,例如AWS,Azure,Aliyun等等。
个人觉得,只有一线的大型互联网公司才有必要自建集群;如果重新进我现在的公司,我一定会建议数据业务放在云上。
另外说一句,将来依托于云计算公司的saas企业,数据服务公司会越来越多。。。总而言之自建的事儿个人觉得大家尽量不要再考虑了。
基于此,我在2017年的定的目标如下(不敢说是计划了,改成目标):
继续加强英语的学习和锻炼,通过一年的学习阅读英文文档/文章没有特别大的障碍,可以应付基本的沟通。
继续加强数据分析/machinelaerning的学习,持续参加数据挖掘的比赛,尝试出各种数据分析报告。
跑步捡起来,2017年至少要完全一次正式的半马比赛;不是为了减肥,是为了健康。
平均一个月阅读一本书,无论是技术类,还是非技术类皆可。
学习和熟悉一线云计算公司的各种组件,尝试出基于各种基准测试的测试报告,进行对比分析(我认为这是一件很有价值的事情)。
最重要的,就是坚持,坚持,坚持……