zoukankan      html  css  js  c++  java
  • Java unicode中文编码转换和反转

    参考网址http://www.oschina.net/code/snippet_142385_4297

    http://canofy.iteye.com/blog/718659

    在java的很多配置文件中,尤其是国际化资源中经常遇到类似uf432这样的unicode编码,搜集了下该编码相关的资料,大致处理方法有如下:

    1、Unicode转 汉字字符串。

    这个过程最简单的方式就是直接获取。比如

    String cnStr = "ufeffu4e2du56fdu4eba";

    System.out.println(cnStr); 即可获取对应的汉字字符  “中国人”;

    但是呢,每次从输出读的话也未免过于不方便了,我们使用方法来做转换,直接获取。

    参考如下

    	public static String unicodeToString(String str) {
    
            Pattern pattern = Pattern.compile("(\\u(\p{XDigit}{4}))");    
            Matcher matcher = pattern.matcher(str);
            char ch;
            while (matcher.find()) {
                ch = (char) Integer.parseInt(matcher.group(2), 16);
                str = str.replace(matcher.group(1), ch + "");    
            }
            return str;
        }
    

    2、获取字符串的unicode编码,这个我们可以通过直接获取字符串的unicode二进制,然后将其byte转换成对应的16进制表示即可,函数示例如下

    static String getUnicode(String s) {
    		try {
    			StringBuffer out = new StringBuffer("");
    			byte[] bytes = s.getBytes("unicode");
    			for (int i = 0; i < bytes.length - 1; i += 2) {
    				out.append("\u");
    				String str = Integer.toHexString(bytes[i + 1] & 0xff);
    				for (int j = str.length(); j < 2; j++) {
    					out.append("0");
    				}
    				String str1 = Integer.toHexString(bytes[i] & 0xff);
    				out.append(str1);
    				out.append(str);
    				
    			}
    			return out.toString();
    		} catch (UnsupportedEncodingException e) {
    			e.printStackTrace();
    			return null;
    		}
    	}
    

    通过上面的方式便可完整的使用unicode编码了,大家有其他方式的转换也可以告诉我下,互相学习

  • 相关阅读:
    如何快速开发一个自己的项目脚手架?
    Vue模板语法中数据绑定
    vue组件间通信八种方式
    浏览器渲染页面流程
    双飞翼布局
    单行截断和多行截断问题
    flex 布局实现固定头部和底部,中间滚动布局
    defer 和 async 区别
    数学之美(统计语言模型)
    react 源码之setState
  • 原文地址:https://www.cnblogs.com/xignzou/p/3329438.html
Copyright © 2011-2022 走看看