zoukankan      html  css  js  c++  java
  • SAS进阶《深入解析SAS》之开发多语言支持的SAS程序

    SAS进阶《深入解析SAS》之开发多语言支持的SAS程序

    1. 多语言支持的应用程序是指该程序在世界给第使用时,其能够处理的数据,以及处理数据的方式、信息展现的方式都符合当地的语言、文化习惯,这要求应用程序运行时,能够自动进行与地区、语言相关的处理,也就是通常所说的国际化。

    2. SBCS、DBCS、MBCS

    单字节字符集SBCS指在该字符集中的字符最多由2个字节表示。一个字节8位,仅支持2的8次方=256个码点。
    双字节字符集DBCS(Doule-Byte Character Set)指该字符中的字符最多由2个字节表示。
    多字节字符集MBCS(Multiple-Byte Character Set)是指该字符集中的字符以多个字节来表示。如UTF-8.
    

    3. 指定系统选项的LOCALE=

    在启动SAS时,相应的Locale会在启动时加载的SAS配置文件中指定。
    

    4. 编码选项ENCODING=

    SAS提供了系统选项ENCODING=以及一些数据集选项、逻辑库选项和读写文件选项,便于灵活地出各种编码的数据。
    (1)会话编码(2)SAS数据集的编码(3)读写外部文件(4)排序序列(SORT默认的排序是二进制排序)
    

    5. 使用SORTREQ=指定其他排序序列的基本形式如下:

    PROC SORT DATA=数据集 SORTSEQ=转换表|编码|LIGNUISTIC;
    RUN;
    

    6. 语言切换选项

    从SAS9.3开始,引入了语言切换(Language Switching)选项,并且在SAS9.4中得到了增强。
    

    7. SAS提供了NL格式(format)和NL输入格式(informat),这些格式能够根据运行的SAS会话的语言/区域来转换日期、日期时间、货币和数字的格式。

    8. FORMAT自定义格式,还可以通过指定选项LOCALE来定义只能在指定的Locale下可用的格式。

        /*
        根据美国和中国的对身高的不同标准
        运行该代码会在逻辑库sas的物理路径下生产两个文件formats.sas7bcat和formats_zh_cn.sas7bcat
        */
        proc format lib=saslib.formats;
            value size
                low - 56 = 'Short'
                56 - 66 = 'Medium'
                66 - high = 'Tall';
        run;
    
        options locale=zh_CN;
        proc form lib=saslib.formats locale;
            value size
                low - 50 = '偏瘦'
                50 - 60 = '中等'
                60 - high = '偏高'
        run;
    
        /*
        接下来按Locale使用逻辑库saslib中的格式size.,代码如下:
        */
        option fmtsearch=(saslib/locale);
        proc print data=sashelp.class(obs=5);
            format height size.;
        run;

    9. 字符串和字符处理函数

    SAS提供了字符串函数和CALL例程,以使用户能够很容易地处理字符数据。K函数。
    K函数使用以字符为基础的偏移长度,可用于处理SBCS、DBCS、MBCS(UTF-8)数据,使用K函数更加符合语言处理习惯,而且不需要知道每个字符存储为多少个字节。
    

    10. 文本字符串外部化

    为了使同一个SAS程序能支持多种语言,需要将代码中的文本字符串提取出来,并在需要使用该字符串的地方使用其通用的表示方式,该过程称为字符串外部化(String Externalizatin)。
    步骤:
    (1)第一步:抽取字符串并生成.smd文件
    (2)第二步:根据.msd文件创建数据集
    (3)第三步:在SAS代码中获取字符串
    
    /*
    保证所有文本在不同的Locale下以对应的语言显示,包括页眉、页脚、标签等,目前需要支持英文和简体中文。
    */
    
    /*
    第一步创建myapp_zh_CN.smd,使用Unicode转义字符,将utf-8原文件转换成Uncode
    */
    %macro SMD2ASCII(inf=,outf=,inencoding=,lrecl=);
    data _null_;
        attrib tmp length=$ &lrecl;
        infile "&inf" lrecl=&lrecl;
        input;
        file "&outf" lrecl=&lrecl;
        tmp = kpropdata(_infile_,"uesc","&inencoding","ascii");
        put tmp;
    run;
    %mend SMD2ASCII;
    
    %SMD2ASCII(inf = E:SHANGHAIRUIMINsasdatashenrufenxisasch8smdmyapp_han.smd,
        outf = E:SHANGHAIRUIMINsasdatashenrufenxisasch8smdmyapp_zh_CN.smd,
        inencoding = utf-8,
        lrecl = 300);
    /*
    第二步根据.smd文件创建数据集
    */
    %SMD2DS(dir = E:SHANGHAIRUIMINsasdatashenrufenxisasch8smd,
        basename = myapp,
        locale = zh_CN,
        lib = saslib);
    /*
        在使用SASMSG函数从消息数据集中获取文本字符串
        */
    %let ds=saslib.myapp;
    %let user=SBJKUX;
    %let adate=%sysfunc(today(),nldate.);
    
    proc datasets library=saslib nolist;
        modify order_summay;
        label Qountry = %sysfunc(sasmsg(&ds,Country_Label,noquote));
        label Quantity = %sysfunc(sasmsg(&ds,Quantity_Label,noquote));
        label Price = %sysfunc(sasmsg(&ds,Price_Label,noquote));
    run;
    
    title %sysfunc(sasmsg(&ds,Report_Title,noquote));
    footnote %sysfunc(sasmsg(&ds,Report_Fn,noquote,'&adate',&user));
    proc report data=saslib.sales;
    run;
  • 相关阅读:
    HTML5 Canvas 颜色填充学习
    PHP中使用函数array_merge()合并数组
    div border-radius
    php中数组可以不写下标
    ab apache Benchmarking中链接的写法 记得加上/
    div border-radius画圆
    Why should i use url.openStream instead of of url.getContent?
    Using Java SecurityManager to grant/deny access to system functions
    In Java, what is the default location for newly created files?
    三种纯CSS实现三角形的方法
  • 原文地址:https://www.cnblogs.com/lanzhi/p/6467881.html
Copyright © 2011-2022 走看看