zoukankan      html  css  js  c++  java
  • Clementine学习

    3Clementine变量管理Field Ops字段选项卡
    3.1变量说明 Type
    3.2变量值的重新计算Filler
    3.3变量类别值的调整 Reclassify
    3.4生成新变量 Derive
    3.5变量的离散化(分组)Binning
    3.6生成样本集分割变量 Partition

    4Clementine样本的管理Record Ops记录卡
    4.1样本的排序Sort
    4.2样本的条件筛选Select
    4.3样本的随机抽样Sample
    4.4样本的浓缩处理Distinct
    4.5样本的分类汇总Aggregate
    4.6样本的平衡处理 Balance
    4.7样本的其他管理
    数据转置Transpose
    数据的重新组织Restructure

    5Clementine数据的基本分析output graphs
    5.1数据质量的探索Data Audit
    离群点和极端值的修正
    缺失值的替补
    保留高质量的变量
    保留有效样本
    5.2基本描述分析
    计算基本描述统计量(变量间的相关性)output-statistics
    :count mean min max pearson correlations(Pearson相关系
    数)
    绘制散点图Graphs-Plot
    5.3变量分布的探索Output-Transform
    正态分布 z-score z分数
    5.4两分类变量相关性的研究
    5.4.1两分类变量相关性的图形分析
    条形图Graphs-Distribution
    网状图Graphs-Web
    5.4.2两分类变量相关性的数值分析
    计算两分类变量的列联表Output-Matrix
    行列变量的相关性分析
    :卡方检验(Pearson卡放统计量)卡方分布
    5.5两总体的均值比较
    5.5.1两总体均值比较的图形分析Graphs-Histogram柱状图
    5.5.2独立样本的均值检验Output-Means
    compare means:Between groups within a field
    5.5.3配对样本的均值检验Output-Means
    compare means:Between pairs of fields
    5.6变量重要性的分析Modeling-Feature Selection

  • 相关阅读:
    沉淀,再出发:Java基础知识汇总
    在Windows10中破解一些软件
    Linux中脚本的使用方法
    沉淀,再出发:Git的再次思考
    沉淀,再出发:Maven的使用和规范
    设计模式:总结
    设计模式:解释器(Interpreter)模式
    设计模式:命令(Command)模式
    设计模式:代理(Proxy)模式
    设计模式:享元(FlyWeight)模式
  • 原文地址:https://www.cnblogs.com/fanyegong/p/3036642.html
Copyright © 2011-2022 走看看