一些关于分享的思考
通过之前写的几篇机器学习相关的blog,能看到偏简单的形式更容易被大家接受,而一些比较有难度的项目,分享的效果就很一般,原因主要有以下几个方面:
- 比较难的项目需要对项目背景、数据形式、竞赛信息等有一定的了解,不然容易一头雾水,连是要干嘛都看不懂;
- 个人的文笔能力有限,包括blog的整体结构也不够合理,没有能够言简意赅的讲明白;
- 对于机器学习的理解不够,因此写成blog后就又打了一个折扣,一来一回大家看不懂也是正常的;
目前在考虑如何将我个人在机器学习的学习过程、竞赛项目等整理成一个系列,即能够帮助自己加深理解,如果还能对小伙伴们起到一丝丝帮助,那就再好不过了;
不过这个系列的分享形式还没有考虑好,既要能够让大家有收获,又能在展示我个人的一些优势的情况下,将我也还没很懂的部分说给大家听,避免误导大家,这还是有点难度的啊。。。。
不过有一点我觉得很好,之前在一篇文章看到的,说是一些国外的kaggle大佬们跟别人讨论分享时有一个习惯很好,就是他不仅仅会分享他最后采用的、效果好的数据处理方式,同时他也会分享之前他尝试的一些效果差强人意的,这种习惯好就好在他分享了自己的一整个思考的过程,而不仅仅是一个结果,这一点在做特征工程时是非常重要的,我们看到一个好的机器学习模型,也很容易copy复现它的效果,但是随便换一个问题又感觉自己做不到,即便是类似的问题,这就是因为模型是结果,但是如何到达这个结果,那个过程更重要,里面包含了很多思考、尝试,没有这个过程就成了知其然不知其所以然,我觉得这一点是可以学习的;
如果有人能看到这篇随笔,希望能给我留言,平时写给别人看的东西也不多,所以对这方面也有些困惑,但是又很希望能够分享一些自己的东西跟大家讨论,一起进步,拜谢;
写于 2020-01-21 23:47,深圳;