小结getBytes()默认编码导致的xml字符串中出现乱码

zoukankan html css js c++ java

小结getBytes()默认编码导致的xml字符串中出现乱码
遇到乱码第一印象想到的是如何统一编码,很少注意到这期间穿插的某些过程也是一大隐患..

sae上部署了一个spring写的微信小程序,手机总关注测试号点击菜单得到的文本消息却是乱码..

聚焦发送消息的部分代码:
response.setCharacterEncoding("utf-8"); response.getOutputStream().write(result.getBytes());
编码已经设置为utf-8,spring也加了过滤器进行utf-8的解码...而且控制台也的确打印出没有乱码的发送信息..想当然的认为这头一定没问题..

然后只好写个测试代码从获得数据的那头获取:
entity = new StringEntity(doc.asXML()); post.setEntity(entity); HttpResponse response = client.execute(post); String result = EntityUtils.toString(response.getEntity()); System.out.println("结果:"+result);
结果得到的就是乱码,如果接收方代码如下改则不会乱码:
String result = EntityUtils.toString(response.getEntity(),"gbk");
证明乱码部分发过来的是gbk的..我的确是有点蒙了,下午被sae的坑人环境坑了大半天脑袋早木了..又细想了一下既然发过来是乱码,编码的时候又是正常的,那也只可能是getBytes()这一处能出问题了,也只有这一处动过编码后的字符串..看看api说明吧:
Encodes this String into a sequence of bytes using the platform's default charset, storing the result into a new byte array.
我倒了..这才恍然大悟,我本地是windows系统,默认是gbk,所以此处会将那部分中文按照gbk编码然后传过去,因为我们response.setXX("utf-8")了,所以接收方按照utf-8来解码,直接乱码..

所以我们应该改成:
response.setCharacterEncoding("utf-8");

response.getOutputStream().write(result.getBytes("utf-8"));
则接收方无需做任何处理便可得到没有乱码的中文..
查看全文

相关阅读:
由AbstractQueuedSynchronizer和ReentrantLock来看模版方法模式
 Java并发编程-CAS
Java并发编程-volatile
Java并发编程-synchronized
学习几个协议
 邻接矩阵存储简单路径(1070)
输出利用先序遍历创建的二叉树的层次遍历序列(0980)
中缀表达式转换为后缀表达式(1042)
特定字符序列的判断(1028)
舞伴问题(1027)

原文地址：https://www.cnblogs.com/chyu/p/4276078.html