zoukankan      html  css  js  c++  java
  • spss缺失值填充步骤

    缺失值填充是数据预处理最基本的步骤,一般能想到的是固定值填充(均值等统计学方法)、根据与本列有相关关系的列函数表示来填充。这次我用的是em算法进行填充,具体原理后续补充。

    主要记录一下步骤:

    工具栏:分析 菜单 ---->  缺失值分析------>弹出来的对话框:左边是表格中的变量;中间对应定量变量和分类变量。如果要填充的是

    连续值,则将要填充的列名通过点击向右的箭头将该列名放入‘定量变量’框中,可以同时把所有要填充的列名都放进去;如果要填充的是分类值,则同样的方法,通过箭头放入‘分类变量’中。(所谓连续值:比如 身高;分类值:比如性别)-------->我们要通过EM算法计算填充值,选中最右边的EM复选框-------->点击确定按钮

    这个时候有两种显示填充好结果的效果的方式:

    1.点击确定后,在工具栏 点击 转换 菜单------>替换缺失值------->将要替换的所有列名同时选中-----------》通过向右箭头将他们放入'新变量'列表-----------》点击确定即可看到原来打开的数据表新增了要填充的那些列,并且已经填充好值。我们可以另存。

    2.在刚才的界面,没有点击确定前,我们点击EM按钮(不是复选框),将‘报存完成的数据’、‘创建新数据集’复选框选中,在‘数据集名称’输入框中输入要保存的文件名。---------->点击  继续  按钮--------------》确定 按钮

    这个时候,spss会新生成一个显示数据的新窗口,我们可以看到,只有被填充数据的那些列。也可以另存。

    https://bbs.pinggu.org/forum.php?mod=viewthread&tid=6639036&page=1   这个链接总结的也挺好的

  • 相关阅读:
    关于重载和重写的区别
    UML的关联(Association), 聚合(Aggregation), 组合(Composition)区别
    解析CSS加密技术之“障眼法”
    ASP.NET中MEMCACHED
    新建项目的无法应用已有项目
    C# 判断两张图片是否一致的快速方法
    压力测试中需要掌握的几个基本概念
    软件测试Web数据分析工具HttpWatch安装
    在SQL Server实现最短路径的搜索
    从算法入手讲解如何在SQL Server中实现最优最简
  • 原文地址:https://www.cnblogs.com/kjkj/p/10484996.html
Copyright © 2011-2022 走看看