zoukankan      html  css  js  c++  java
  • Clementine学习

    3Clementine变量管理Field Ops字段选项卡
    3.1变量说明 Type
    3.2变量值的重新计算Filler
    3.3变量类别值的调整 Reclassify
    3.4生成新变量 Derive
    3.5变量的离散化(分组)Binning
    3.6生成样本集分割变量 Partition

    4Clementine样本的管理Record Ops记录卡
    4.1样本的排序Sort
    4.2样本的条件筛选Select
    4.3样本的随机抽样Sample
    4.4样本的浓缩处理Distinct
    4.5样本的分类汇总Aggregate
    4.6样本的平衡处理 Balance
    4.7样本的其他管理
    数据转置Transpose
    数据的重新组织Restructure

    5Clementine数据的基本分析output graphs
    5.1数据质量的探索Data Audit
    离群点和极端值的修正
    缺失值的替补
    保留高质量的变量
    保留有效样本
    5.2基本描述分析
    计算基本描述统计量(变量间的相关性)output-statistics
    :count mean min max pearson correlations(Pearson相关系
    数)
    绘制散点图Graphs-Plot
    5.3变量分布的探索Output-Transform
    正态分布 z-score z分数
    5.4两分类变量相关性的研究
    5.4.1两分类变量相关性的图形分析
    条形图Graphs-Distribution
    网状图Graphs-Web
    5.4.2两分类变量相关性的数值分析
    计算两分类变量的列联表Output-Matrix
    行列变量的相关性分析
    :卡方检验(Pearson卡放统计量)卡方分布
    5.5两总体的均值比较
    5.5.1两总体均值比较的图形分析Graphs-Histogram柱状图
    5.5.2独立样本的均值检验Output-Means
    compare means:Between groups within a field
    5.5.3配对样本的均值检验Output-Means
    compare means:Between pairs of fields
    5.6变量重要性的分析Modeling-Feature Selection

  • 相关阅读:
    ORACLE触发器具体解释
    秒杀多线程第四篇 一个经典的多线程同步问题
    Java中Integer类的方法
    九大排序算法再总结
    删除条目时的确认对话框
    VirtualBox安装及使用说明和虚拟机安装XP系统图文教程
    J2EE之验证码实现
    教你用笔记本破解无线路由器password
    vSphere HA状况:未知配置错误解决的方法
    HDU 2504 又见GCD
  • 原文地址:https://www.cnblogs.com/fanyegong/p/3036642.html
Copyright © 2011-2022 走看看