zoukankan      html  css  js  c++  java
  • Linux 字符编码 查看与转换

    Linux 查看文件编码格式

    1. Vim 查看文件编码

      set fileencoding   // 即可显示文件编码格式
      

      若想解决Vim查看文件乱码问题, 可以在 .vimrc 文件添加

      set encoding=utf-8   fileencoding=utf-8, cp936,gb2312 等
      
    2. enca (yum install enca) 查看文件编码

      	enca   filename   // enca对某些GBK编码文件并不识别  Unrecognized encoding
      

    文件编码转化

    1. Vim直接转化文件编码

      set fileencoding=utf-8
      
    2. iconv

      iconv -f encoding -t encoding inputfile
      

      例如: 将一个utf-8 编码转化为GBK编码

      iconv -f utf-8  -t gbk  file -o file2
      
      iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。 
      用法: 
        		iconv [选项...] [文件...]  
      有如下选项可用:  
        输入/输出格式规范:  
      	  -f, --from-code=名称 原始文本编码 
      	  -t, --to-code=名称 输出编码  
        信息: 
      	  -l, --list 列举所有已知的字符集    
        输出控制: 
      	  -c 从输出中忽略无效的字符  
      	  -o, --output=FILE 输出文件  
      	  -s, --silent 关闭警告  
      	  --verbose 打印进度信息  
      	  -?, --help 给出该系统求助列表  
      	  --usage 给出简要的用法信息 
      	  -V, --version 打印程序版本号    
          例子:  
          	iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt  
          这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。
      
    3. enconv
      将一个GBK编码转化为 utf-8编码

      enconv -L zh_CN -x utf-8 filename
      
    4. dos2unix : window 文件 cpoy 到 linux 格式转化

      • DOS下的文本文件是以 作为断行标志的
      • Mac文本是以 作为换行标志
      • Linux文本以 作为换行标志
      dos2unix filename
      
  • 相关阅读:
    Solr 删除数据的几种方式
    velocity 随笔
    LOG4J.PROPERTIES配置详解(转载)
    转 如何使用velocity模板引擎开发网站
    通过pinyin4j将汉字转换为全拼 和 拼音首字母
    去除数组中的重复数据
    java 转义字符
    多重背包(学习笔记)
    Team Queue
    [HAOI2008]糖果传递
  • 原文地址:https://www.cnblogs.com/vagabond/p/6768802.html
Copyright © 2011-2022 走看看