zoukankan      html  css  js  c++  java
  • PROC SORT

    PROC SORT DATA=输入数据集  <OUT=输出数据集><选项>;
        BY 关键变量;
    RUN;

    PROC SORT 语法如上,其中在尖括号中的可以不出现,也不会报错。

    选项中常用的有两种NODUPKEY和NOUNIQUEKEY。

    功能可以由字面意思帮助记忆,NO-没有,DUP-重复,KEY-关键变量,,,合起来就是数据集中指定的关键变量不重复,

    其功能也一样,,去除重复的关键变量,这里的关键变量就是指跟在关键字BY后面的变量;还有一个对应的DUPOUT=选项用来输出被该(NODUPKEY)剔除的观测数据。

    例如:

    PROC SORT DATA=ABC OUT=ABC1 DUPOUT=ABC2  NODUPKEY;
        BY ID;
    RUN;

    这里的ABC1数据集就是关于源数据集ABC中关于ID不重复的数据集(重复的观测只保留第一条),而ABC2则是存放重复ID的重复部分。

    还有一个常用选项NOUNIQUEKEY,同样可以帮助记忆  NO-没有,UNIQUE-唯一, KEY-关键变量,,,合起来就是数据集中的关键变量不唯一;

    功能呢个就是保留数据集中关于关键变量有多条观测的数据,还有一个对应的选项  UNIQUEOUT=选项用来输出关于关键变量的观测数据唯一的的部分。

    例如;

    PROC SORT DATA=ABC UNIQUEOUT=ABC3 OUT=ABC4 NOUNIQUEKEY;
        BY KEY;
    RUN;

    这里输出的ABC3是关于KEY唯一的观测数据,而ABC4存放的就是关于key不唯一的观测数据.

    本博文由博主原创,不得在非博主允许情况下用作商业用途。 如需转载请注明博客地址:http://www.cnblogs.com/immaculate
  • 相关阅读:
    谷歌三架马车之 The Google File System 中文版
    数据集市 Data Mart
    VMware虚拟机ubuntu下安装VMware Tools步骤
    NOIP普及组 海港 题解
    HXD的DS
    离散化
    哈希表
    状态压缩DP 初探
    《信息学奥赛一本通》大盗阿福 题解
    NOIP 加工零件 题解
  • 原文地址:https://www.cnblogs.com/immaculate/p/6227516.html
Copyright © 2011-2022 走看看