一、JSP页面中文乱码
在JSP页面中,中文显示乱码有两种情况:一种是HTML中的中文乱码,另一种是在JSP中动态输出的中文乱码。
先看一个JSP程序:
- <%@ page language="java" import="java.util.*" %>
- <html>
- <head>
- <title>中文显示示例</title>
- </head>
- <body>
- 这是一个中文显示示例:
- <%
- String str = "中文";
- out.print(str);
- %>
- </body>
- </html>
上面这个JSP程序看起来好像是在页面显示几句中文而且标题也是中文。运行后在浏览器中显示如图所示
原因在于没有在JSP中指定页面显示的编码,消除乱码的解决方案很简单上面代码中page命令修改成如下所示即可
- <%@ page language="java" import="java.util.*" contentType="text/html; charset=UTF-8" %>
- <html>
- <head>
- <title>中文显示示例</title>
- </head>
- <body>
- 这是一个中文显示示例:
- <%
- String str = "中文";
- out.print(str);
- %>
- </body>
- </html>
再次运行乱码消失,原理就是向页面指定编码为UTF-8,那么页面就会按照此编码来显示,于是乱码消失。
二、URL传递参数中文乱码
一般情况下在使用get方法提交表单的时候传递的参数如果是中文的话很可能会出现乱码。
下面是一个示例程序
- <%@ page language="java" import="java.util.*" contentType="text/html;charset=UTF-8"%>
- <html>
- <head>
- <title>URL传递参数中文处理示例</title>
- </head>
- <%
- String param = request.getParameter("param");
- %>
- <body>
- <a href="URLCharset.jsp?param='中文'">请点击这个链接</a><br>
- 你提交的参数为:<%=param%>
- </body>
- </html>
上面这个JSP程序的功能就是通过一个URL链接向自身传递一个参数,这个参数是中文字符串,这个程序的运行效果如下图
对于URL传递中文参数乱码这个问题,其处理方法比较特殊,仅仅转换这个中文字符串或者设置JSP页面显示编码都是不能解决问题的,需要修改Tomcat服务器的配置文件才能解决问题。在这里修改Tomcat的conf目录下的server.xml配置文件,具体改后的代码如下
- <Connector port="8080" protocol="HTTP/1.1" URIEncoding="UTF-8"
- connectionTimeout="20000"
- redirectPort="8443" />
在原来代码中添加URI编码设置URIEncoding=“UTF-8”即可,重启Tomcat服务器可以得到正确的页面。其原理也和上面的情况类似,就是向程序指明编码类型,然后显示就正常了。
三、表单提交中文乱码
对于表单的数据可以使用request.getParameter(“”)的方法获取,但是当表单中出现中文数据的时候就会出现乱码。
示例代码如下
- <%@ page language="java" import="java.util.*" contentType="text/html;charset=UTF-8"%>
- <html>
- <head>
- <title>Form中文处理示例</title>
- </head>
- <body>
- <font size="2">
- 下面是表单内容:
- <form action="AcceptFormCharset.jsp" method="post">
- 用户名:<input type="text" name="userName" size="10"/>
- 密 码:<input type="password" name="password" size="10"/>
- <input type="submit" value="提交">
- </form>
- </font>
- </body>
- </html>
在上面的表单当中想AcceptFormCharset这个页面提价两项数据,下面是AcceptFormCharset.jsp的内容:
- <%@ page language="java" import="java.util.*"
- contentType="text/html;charset=UTF-8"%>
- <html>
- <head>
- <title>Form中文乱码</title>
- </head>
- <body>
- <font size="2"> 下面是表单提交以后用request取到的表单数据:<br>
- <%
- String userName = request.getParameter("userName");
- String password = request.getParameter("password");
- out.println("表单输入userName的值:" + userName + "<br>");
- out.println("表单输入password的值:" + password + "<br>");
- %>
- </font>
- </body>
- </html>
在上面的程序中,如果表单输入没有中文,则可以正常的显示当输入的数据中有中文的时候,得到的结果如图所示。
产生种结果的原因是Tomcat中对于post方法提交的表单采用的默认编码为ISO-8859-1,而这种编码格式不支持中文字符。对于这个问题可以采用转换编码格式的方法来解决,现在对AcceptFromCharset这个页面改动如下:
- <%@ page language="java" import="java.util.*"
- contentType="text/html;charset=gb2312"%>
- <html>
- <head>
- <title>Form中文乱码</title>
- </head>
- <body>
- <font size="2"> 下面是表单提交以后用request取到的表单数据:<br>
- <%
- String userName = request.getParameter("userName");
- String password = request.getParameter("password");
- out.println("表单输入userName的值:" + new String(userName.getBytes("ISO-8859-1"), "UTF-8")+ "<br>");
- out.println("表单输入password的值:" + new String(password.getBytes("ISO-8859-1"), "UTF-8")+ "<br>");
- %>
- </font>
- </body>
- </html>
经过这样的转换编码以后,所有的中文输入都可以用request对象正常取出。在上面这个程序中,第四行和第五行是转换编码格式的关键,先从ISO-8859-1格式的字符串中取出字节内容,然后在用UTF-8的编码格式重新构造一个新的字符串。这样就可以支持中文变淡输入的正常取值和显示。改进以后程序运行结果如下
经过上面的更改编码格式的处理,表单的中文输入乱码问题已经得到解决。但是如果上面的表单中的输入项不止是两个,那么每个输入项都需要进行编码转换,那样就很麻烦了。这是我们就用到过滤器filter了。下面简单介绍一下。
package com.foxmail.xxy668; import java.io.IOException; import javax.servlet.Filter; import javax.servlet.FilterChain; import javax.servlet.FilterConfig; import javax.servlet.ServletException; import javax.servlet.ServletRequest; import javax.servlet.ServletResponse; public class SetCharacterEncodingFilter implements Filter{ protected FilterConfig filterConfig; protected String encodingName; protected boolean enable; @Override public void destroy() { // TODO Auto-generated method stub } public SetCharacterEncodingFilter() { this.encodingName="UTF-8"; this.enable=false; } @Override public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException { if(this.enable){ request.setCharacterEncoding(this.encodingName); } chain.doFilter(request,response); } @Override public void init(FilterConfig filterConfig) throws ServletException { this.filterConfig=filterConfig; loadConfigParams(); } private void loadConfigParams(){ this.encodingName=this.filterConfig.getInitParameter("encoding"); String strIgnoreFlag=this.filterConfig.getInitParameter("enable"); if(strIgnoreFlag.equalsIgnoreCase("true")){ this.enable=true; }else{ this.enable=false; } } }在上面的这个过滤器中,init方法从配置文件中取出字符编码格式的参数,在doFilter方法中使用request对象对所有的请求统一编码格式。
四、Eclipse中JSP文件中文乱码
在Eclipse或者MyEclipse中由于默认的JSP编码格式为ISO-8859-1,所以当打开由其他编辑器编辑的JSP文件时会出现乱码,如图所示
对于这个问题我们只需要更改一下Eclipse或者是MyEclipse中对JSP的默认编码就可以了,修改的地方(我的MyEclipse版本为11)如图所示