zoukankan      html  css  js  c++  java
  • MapReduce-线性回归

    线性回归有是三个值很重要:
    1. 斜率
    2. 截距:x和y轴的交点值;
    3. 显著性:数据偏离线性的程度,用以判断数据可以用线性表示的程度;拟合度
     
    apache.commons.math3里面有一个simpleRegression专门用于做线性分析;通过add函数来进行添加x值和y值;
     
    基因聚合
    感悟:Map阶段实现的就是数据的查询,筛选以及数据组织(组织成key,value形式)
    算法:
    算法一:单值
    谈不上,Map阶段根据genId+refence对数据进行过滤(value > 1.04),并按照key(genId+refence)聚合,然后reduce统计数量,其实和wordcount一致;
    算法二:均值
    Map阶段获取数据,并按照key(genId+refence)进行聚合(key,List<value>;在reduce阶段对数据List<value>取平均值,取>1.04的数据;
     
  • 相关阅读:
    mysql事务
    mysql查询操作教程
    mysql建表约束
    mysql数据库增删改查
    node服务器响应静态资源
    windows下golang版本的升级
    Linux开机错误
    redis命令
    nginx内置变量
    nginx日志
  • 原文地址:https://www.cnblogs.com/xiashiwendao/p/9357308.html
Copyright © 2011-2022 走看看