数据科学家们不应该做的事情:
1. 在数据分析时,不采用科学的分析方法;
2. 以不合理且难以理解的方式,为客户做证明资料的质量评级;
3. 断言那些坏的、不明确的证明资料为典型的数据证明资料;
4. 错误地将不典型、不明确的证明资料应用于模拟现实中或做出误导;
5. 以不合理且难以理解的方式,为客户做数据的质量评级;
6. 断言那些坏的、不明确的数据为明确的数据;
7. 错误地将坏的、不明确的数据应用于模拟现实中或做出误导;
8. 没有选择一个正确的方式公开部分或全部数据科学分析结果;
9. 没有试图复制数据科学分析结果;
10. 没有公开那些不能被复制的数据科学分析结果;
11. 错误的将数据科学分析结果应用于模拟现实中或做出误导;
12. 没有公开失败的实验或那些被证明不成立的数据论证,而这可能会对客户不利;
13. 明知是错误的结果却仍然提供这样的结果。
ref:
http://www.36dsj.com/archives/4552