zoukankan      html  css  js  c++  java
  • ruby编码说明

    程序编码一般分几种情况:
    1、源码文件编码
    2、接收外部内容的编码
    3、运行环境编码
    4、操作系统编码

    首先源码文件的编码,可以通过在ruby文件的头部添加一行申明即可,这样所有在源码里面出现的字符都保存为指定的编码:

    # -*- coding:utf-8 -*- 
    

      

    接收的内容或读取外部文件时,可能不确定是什么编码,这个时候就可以对外部接收的字符或内容进行转码。

    string.encode('utf-8')   #把字符串转成utf-8模式  
    string.force_encoding('UTF-8') #强制转换
    require "nkf"  
    string= NKF.nkf("-w", string)  ##同样把字符串转成utf-8,其值-w参数代表utf-8 
    

     

    运行环境的编码,通常默认和操作系统的编码是一致的,但是也可以设置为指定的编码,这样保持所有编码一致性。ruby中设定运行环境编码方式如下,即启动ruby时添加encoding参数并指定编码格式。

    ruby --encoding=utf-8  

    操作系统编码,通常中文的都是GBK的;所以如果在程序里用到系统中的取值时用到中文的地方需要注意;比如:中文名字的目录;如果你的运行环境是utf-8的,读取中文目录下的文件时,需要把路径字符串转码成gbk再去读,否则会报错。

    在这里有一个问题:
    ruby x:/path/to/ruby/中文/file.rb #可以成功找到rb文件,此时运行环境编码为gbk
    ruby --encoding=utf-8 x:/path/to/ruby/中文/file.rb #不能找到rb文件,提示编码错误,因为此时运行环境编码为utf-8,而传递过去的路径参数为gbk编码。
    而如果运行环境为gbk时,而源码为utf-8编码,则在有些地方处理中文等字符串时会提示编码不兼容,因为有些时候字符编码处理的默认编码就是运行环境的编码。
    ruby x:/path/to/ruby/english/file.rb  #可以找到,运行环境同源码设置编码

    所以运行环境的编码应该有如下优先级:是否有encoding参数指定==>第一次处理非中文时的字符编码格式     

    rubymine输出窗口显示乱码:

    ctrl shift +a 搜encoding 并设置编码

  • 相关阅读:
    洛谷 P1786 帮贡排序 题解
    Bayes++ Library入门学习之熟悉UKF相关类
    Bayes++ Library入门学习之熟悉class-Bayesian_filter_base(2)
    Bayes++ Library入门学习之熟悉class-Importance_resampler
    Bayes++ Library入门学习之熟悉class-Bayesian_filter_base(1)
    Bayes++ Library入门学习之熟悉namespace
    CMake入门之创建一个基于PCL的最小工程
    CUDA学习之从CPU架构说起
    #pragma 预处理指令详解
    C++中inline函数
  • 原文地址:https://www.cnblogs.com/wf0117/p/7223387.html
Copyright © 2011-2022 走看看