1、数据挖掘
变量规约、随机森林、生存分析、两阶段建模、序列分析、关联规则、k折交叉验证、自组织映射、支持向量机、层次聚类、情感分析、协同过滤、神经网络、k均值聚类、k近邻、朴素贝叶斯、Boosting、决策树、过拟合、Lift、预测算法、分类算法、训练验证测试集、变量角色、无监督学习、有监督学习、字符变量、数值变量、ML基础
2、可视化
可视化探索、移动可视化、仪表盘、条图饼图线图、散点图面积图、气泡图、直方图、地图、动态交互图形、热力图瓦片图、词云、网络图桑基图、Mashup、时序动画
3、数据库
数据接口规范、数据映射、数据质量、数据变换、数据整合、ABT、SQL、抽样、数据分区、变量选择、标准化、数据模型、3NF、数据冗余、逆规范化、数据压缩、数据安全
4、文本挖掘
中文分词、文本分类、文本聚类、实体解析、特征抽取、概念链接、词频权重、TFIDF、倒排索引、语料库、多语种、副本识别、本体管理、信息检索、短语识别、拼写检查、情感识别、语境分析
5、基础
矩阵计算、线性代数、数据结构、关系代数、数据库原理、表连接、表格数据、数据框、时间序列、数据分片、多维数据、ETL、报表、BI、Jason、XML、NoSQL、正则表达式、主流厂商、环境设置
6、编程
P值、卡方检验、估计、置信区间、MLE、回归、统计分布、偏差、相关系数、最小二乘、欧式距离、Python基础、探索分析、R基础、SAS、向量矩阵、读取数据、抽取子集、数据框处理、函数、安装软件包、数据步、过程步、Web Service、存储过程、宏、参数传递、SQL、绘图、网页爬取
7、大数据
物联网、移动互联网、互联网征信、社交媒体分析、SNA、LBS、网络计算、HBase、高性能分析、ESP、内存分析引擎、Spark、Hive、M/R编程、任务管理、数据节点、主节点、平台搭建、数据复制、HDFS、MapReduce、Hadoop、精准营销、客户DNA、工业4.0、人才罗盘、设备预维护、CAP理论、车联网、传感器、舆情监控
8、统计学
累积分布函数、随机变量、贝叶斯理论、概率论、异常值、What-If分析、分位数、探索分析、描述统计、数据集、假设检验、蒙特卡洛、中心极限定理、概率密度函数、ANOVA、回归、峰度偏度、偏差