与外界进行交互
读写各种各样的文件格式和数据库
准备
对数据进行清理,修正,整合,规范化,重塑,切片切块,变形等处理以便进行分析
转换
对数据集做一些数学和统计运算以产生新的数据集,比如说,根据分组变量对一个大表进行聚合
建模和计算
将数据跟统计模型,机器学习算法或其他计算工具联系起来。
展示
创建交互式的或静态的图片或文字摘要