zoukankan      html  css  js  c++  java
  • 数据科学家应了解的内容

    1、数据挖掘

    变量规约、随机森林、生存分析、两阶段建模、序列分析、关联规则、k折交叉验证、自组织映射、支持向量机、层次聚类、情感分析、协同过滤、神经网络、k均值聚类、k近邻、朴素贝叶斯、Boosting、决策树、过拟合、Lift、预测算法、分类算法、训练验证测试集、变量角色、无监督学习、有监督学习、字符变量、数值变量、ML基础

    2、可视化

    可视化探索、移动可视化、仪表盘、条图饼图线图、散点图面积图、气泡图、直方图、地图、动态交互图形、热力图瓦片图、词云、网络图桑基图、Mashup、时序动画

    3、数据库

    数据接口规范、数据映射、数据质量、数据变换、数据整合、ABT、SQL、抽样、数据分区、变量选择、标准化、数据模型、3NF、数据冗余、逆规范化、数据压缩、数据安全

    4、文本挖掘

    中文分词、文本分类、文本聚类、实体解析、特征抽取、概念链接、词频权重、TFIDF、倒排索引、语料库、多语种、副本识别、本体管理、信息检索、短语识别、拼写检查、情感识别、语境分析

    5、基础

    矩阵计算、线性代数、数据结构、关系代数、数据库原理、表连接、表格数据、数据框、时间序列、数据分片、多维数据、ETL、报表、BI、Jason、XML、NoSQL、正则表达式、主流厂商、环境设置

    6、编程

    P值、卡方检验、估计、置信区间、MLE、回归、统计分布、偏差、相关系数、最小二乘、欧式距离、Python基础、探索分析、R基础、SAS、向量矩阵、读取数据、抽取子集、数据框处理、函数、安装软件包、数据步、过程步、Web Service、存储过程、宏、参数传递、SQL、绘图、网页爬取

    7、大数据

    物联网、移动互联网、互联网征信、社交媒体分析、SNA、LBS、网络计算、HBase、高性能分析、ESP、内存分析引擎、Spark、Hive、M/R编程、任务管理、数据节点、主节点、平台搭建、数据复制、HDFS、MapReduce、Hadoop、精准营销、客户DNA、工业4.0、人才罗盘、设备预维护、CAP理论、车联网、传感器、舆情监控

    8、统计学

    累积分布函数、随机变量、贝叶斯理论、概率论、异常值、What-If分析、分位数、探索分析、描述统计、数据集、假设检验、蒙特卡洛、中心极限定理、概率密度函数、ANOVA、回归、峰度偏度、偏差

  • 相关阅读:
    Read-Copy Update Implementation For Non-Cache-Coherent Systems
    10 华电内部文档搜索系统 search04
    10 华电内部文档搜索系统 search05
    lucene4
    10 华电内部文档搜索系统 search01
    01 lucene基础 北风网项目培训 Lucene实践课程 索引
    01 lucene基础 北风网项目培训 Lucene实践课程 系统架构
    01 lucene基础 北风网项目培训 Lucene实践课程 Lucene概述
    第五章 大数据平台与技术 第13讲 NoSQL数据库
    第五章 大数据平台与技术 第12讲 大数据处理平台Spark
  • 原文地址:https://www.cnblogs.com/dudumiaomiao/p/5940036.html
Copyright © 2011-2022 走看看