zoukankan      html  css  js  c++  java
  • 数据科学家应了解的内容

    1、数据挖掘

    变量规约、随机森林、生存分析、两阶段建模、序列分析、关联规则、k折交叉验证、自组织映射、支持向量机、层次聚类、情感分析、协同过滤、神经网络、k均值聚类、k近邻、朴素贝叶斯、Boosting、决策树、过拟合、Lift、预测算法、分类算法、训练验证测试集、变量角色、无监督学习、有监督学习、字符变量、数值变量、ML基础

    2、可视化

    可视化探索、移动可视化、仪表盘、条图饼图线图、散点图面积图、气泡图、直方图、地图、动态交互图形、热力图瓦片图、词云、网络图桑基图、Mashup、时序动画

    3、数据库

    数据接口规范、数据映射、数据质量、数据变换、数据整合、ABT、SQL、抽样、数据分区、变量选择、标准化、数据模型、3NF、数据冗余、逆规范化、数据压缩、数据安全

    4、文本挖掘

    中文分词、文本分类、文本聚类、实体解析、特征抽取、概念链接、词频权重、TFIDF、倒排索引、语料库、多语种、副本识别、本体管理、信息检索、短语识别、拼写检查、情感识别、语境分析

    5、基础

    矩阵计算、线性代数、数据结构、关系代数、数据库原理、表连接、表格数据、数据框、时间序列、数据分片、多维数据、ETL、报表、BI、Jason、XML、NoSQL、正则表达式、主流厂商、环境设置

    6、编程

    P值、卡方检验、估计、置信区间、MLE、回归、统计分布、偏差、相关系数、最小二乘、欧式距离、Python基础、探索分析、R基础、SAS、向量矩阵、读取数据、抽取子集、数据框处理、函数、安装软件包、数据步、过程步、Web Service、存储过程、宏、参数传递、SQL、绘图、网页爬取

    7、大数据

    物联网、移动互联网、互联网征信、社交媒体分析、SNA、LBS、网络计算、HBase、高性能分析、ESP、内存分析引擎、Spark、Hive、M/R编程、任务管理、数据节点、主节点、平台搭建、数据复制、HDFS、MapReduce、Hadoop、精准营销、客户DNA、工业4.0、人才罗盘、设备预维护、CAP理论、车联网、传感器、舆情监控

    8、统计学

    累积分布函数、随机变量、贝叶斯理论、概率论、异常值、What-If分析、分位数、探索分析、描述统计、数据集、假设检验、蒙特卡洛、中心极限定理、概率密度函数、ANOVA、回归、峰度偏度、偏差

  • 相关阅读:
    C语言指针入门
    c的动态内存管理
    汇编入门基础与helloworld
    汇编1
    汇编2——完整的例子集合
    算法与数据结构——选择,插入,希尔排序
    MySQL
    MySQL 笔记
    CSS样式优先级
    GIT使用笔记
  • 原文地址:https://www.cnblogs.com/dudumiaomiao/p/5940036.html
Copyright © 2011-2022 走看看