感谢大佬:https://blog.csdn.net/sessionsong/article/details/38778853
在使用<%@ include page=""%> 指令包含一个html页面(b.html)时中文乱码。 乱码问题 首先想到的就是这两个文件的编码是否统一
在仔细检查了一遍后 发现没问题 都是UTF-8的。 既能编码一致 那为什么还好出现乱码呢。
于是就把html的内容重新放到一个jsp文件(c.jsp)中去 inlude 该jsp文件 没无问题 正常 显示 那是啥问题了 ⊙﹏⊙b汗
也是 仔细比较了b.html 和c.jsp 文件 发现这两个文件 除了meta标签里面的内容不同的话 就是 c.jsp 文件比b.html 多了行代码
<%@ page language=“java” contentType=“text/html; charset=UTF-8” pageEncoding=“UTF-8”%>
是不是和这有关呢 把这复制到b.html 页面中 刷新 中文正常显示了 Ooo
问题是解决了 但是为啥呢 得仔细分析分析 <%@ page language=“java” contentType=“text/html; charset=UTF-8” pageEncoding=“UTF-8”%> 这行代码了
这行代码中有两个指定编码格式的指令 charset 和 pageEncoding 其中 html页面的中已经有了 charset 所以 这行代码可以简写为
<%@ page language="java" pageEncoding="UTF-8"%>
下面我们分析下 pageEncoding和contentType两种属性的区别:
- 1)pageEncoding是jsp文件本身的编码
- 2)contentType的charset是指服务器发送给客户端时的内容编码
jsp 从用户发送请求到相应给用户中间要经历三个阶段
- 一:jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8
JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。 - 二:是由JAVAC的JAVA源码至java
byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
JAVAC用UTF-8的encoding读取java源码,编译成UTF-8
encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。 - 三: Tomcat(或其的application
container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效
而include指令就是在第一阶段之前执行的,注意这个是在第一阶段之前,所以,如果包含文件和被包含文件的文件编码不一致,那么,该指令就会工作不太正常,不能正确的把被包含的文件从原来编码转换为包含文件的编码,就会出现乱码现象.
所以这时候得指定html页面的pageEncoding 属性 虽能html文件不识别这个属性 但是最后include到jsp文件中 他会发挥作用的。
没有设置<%@ page language=“java” pageEncoding=“UTF-8”%>属性的时候
页面源码:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>Insert title here</title>
</head>
<body>
b.html 中文乱码问题 未加 pageEncoding="UTF-8"%
</body>
</html>
include 到jsp页面后运行的效果
生成的java文件部分代码
在html页面加入<%@ page language=“java” pageEncoding=“UTF-8”%>后
源码:
<%@ page language="java" pageEncoding="UTF-8"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>Insert title here</title>
</head>
<body>
b.html 中文乱码问题 未加 pageEncoding="UTF-8"%
</body>
</html>
运行效果
生成的java文件部分代码
都正常显示。
网上还有一种方法 就是修改项目的web.xml 文件 在web-app标签中加入如下内容
<jsp-config>
<jsp-property-group>
<description>html encoding example</description>
<display-name>JSPConfiguration</display-name>
<url-pattern>*.html</url-pattern>
<el-ignored>true</el-ignored>
<page-encoding>UTF-8</page-encoding>
<scripting-invalid>false</scripting-invalid>
<include-prelude></include-prelude>
<include-coda></include-coda>
</jsp-property-group>
</jsp-config>
重新部署下项目就好了
其实仔细观察代码 他也是设置include的html/jsp页面的编码。思路是一样的。
我的理解:
- 解决方法一:在被include的html页面首行添加:
<%@page pageEncoding="utf-8"%>
- 解决方法二:在项目的WebRoot下的WEB-INF夹中打开web.xml配置文件,在配置文件的
<web-app></web-app>
标签之间加入以下配置,可解决include过程中的中文乱码问题。
在 Tomcat 5.0.x 中,Tomcat 支持了 JSP 2.0 的规格,同时也支持了部分 J2EE 1.4 的规格,在 J2EE 1.4 的规格中,有关 JSP 的部份,有一个<jsp-config>
的 XML Tag,这个 XML 区块用来定义与 JSP 相关的特殊属性,包含采用的 taglib 与 以下说明的<jsp-property-group>
,而解决 include 档中文问题的方法就定义在<jsp-roperty-group>
中。
<jsp-config>
<jsp-property-group>
<description>
Special property group for JSP Configuration JSP example.
</description>
<display-name>JSPConfiguration</display-name>
<url-pattern>*.jsp</url-pattern>
<el-ignored>true</el-ignored>
<page-encoding>gb2312</page-encoding>
<scripting-invalid>false</scripting-invalid>
<include-prelude></include-prelude>
<include-coda></include-coda>
</jsp-property-group>
<jsp-property-group>
<description>
Special property group for JSP Configuration JSP example.
</description>
<display-name>JSPConfiguration</display-name>
<url-pattern>*.htm</url-pattern>
<el-ignored>true</el-ignored>
<page-encoding>gb2312</page-encoding>
<scripting-invalid>false</scripting-invalid>
<include-prelude></include-prelude>
<include-coda></include-coda>
</jsp-property-group>
<jsp-property-group>
<description>
Special property group for JSP Configuration JSP example.
</description>
<display-name>JSPConfiguration</display-name>
<url-pattern>*.html</url-pattern>
<el-ignored>true</el-ignored>
<page-encoding>gb2312</page-encoding>
<scripting-invalid>false</scripting-invalid>
<include-prelude></include-prelude>
<include-coda></include-coda>
</jsp-property-group>
<jsp-property-group>
<description>
Special property group for JSP Configuration JSP example.
</description>
<display-name>JSPConfiguration</display-name>
<url-pattern>*.txt</url-pattern>
<el-ignored>true</el-ignored>
<page-encoding>gb2312</page-encoding>
<scripting-invalid>false</scripting-invalid>
<include-prelude></include-prelude>
<include-coda></include-coda>
</jsp-property-group>
</jsp-config>
其中jsp-config一段是用来说明你要将包含的页面默认按照什么编码格式包含。web-app 标签的version必须是2.4的。
附带说明:
<jsp-config> 元素主要用来设定JSP 相关配置
<jsp-config> 包括<taglib> 和<jsp-property-group> 两个子元素。
<taglib>元素在JSP 1.2 时就已经存在;
<jsp-property-group>是JSP 2.0 新增的元素:
<jsp-property-group>元素主要有八个子元素,它们分别为:
<description>:设定的说明;
<display-name>:设定名称;
<url-pattern>:设定值所影响的范围,如: /*.jsp;
<el-ignored>:若为true,表示不支持EL 语法;
<scripting-invalid>:若为true,表示不支持<% scripting %>语法;
<page-encoding>:设定JSP 网页的编码;
<include-prelude>:设置JSP 网页的抬头,扩展名为.jsp
<include-coda>:设置JSP 网页的结尾,扩展名为.jsp
自定义的tag也需要放在<jsp-config>中间
<jsp-config>
<taglib>
<taglib-uri>Taglib</taglib-uri>
<taglib-location>/WEB-INF/tlds/MyTaglib.tld</taglib-location>
</taglib>
</jsp-config>
二者功能相同,区别一个是一次性的,一个是要逐页写的。
补充:Post与Get方式传递参数乱码问题
1. post
request.setChracterEncoding("charset");
注意:这种方式却对Get请求没用,只对Post方式提交的有效!!
原因是,自从Tomcat5.x开始,GET和POST方法提交的信息,Tomcat采用了不同的方式来处理编码,对于POST请求,Tomcat会仍然使用request.setCharacterEncoding方法所设置的编码来处理,如果未设置,则使用默认的iso-8859-1编码。而GET请求则不同,Tomcat对于GET请求并不会考虑使用request.setCharacterEncoding方法设置的编码,而会永远使用iso-8859-1编码。
2. get
方式一:在Tomcat目录conf下修改server.xml,添加URIEcoding=“charset”
<Connector URIEncoding=“UTF-8”
port=“8080” maxHttpHeaderSize=“8192”
maxThreads=“150” minSpareThreads=“25” maxSpareThreads=“75”
enableLookups=“false” redirectPort=“8443” acceptCount=“100”
connectionTimeout=“20000” disableUploadTimeout=“true” />
方式二:new String(fileName.getBytes(“ISO-8859-1”),“utf-8”); //解决get方式中文乱码
注意:方式一与方式二不可以一起使用。