另外这个在线的工具不错:http://54caizi.com/tools/encode.asp ,可以进行URLEncode和URLDecode,另外还有HTMLEncode,TrimHTML和UTF-8字符还原等转换功能。
HTML编码规则是:
字符"a"-"z","A"-"Z","0"-"9",".","-","*",和"_" 都不被编码,维持原值,
空格" "被转换为加号"+"。
所有其他的字符都被认为是不安全的,首先都根据指定的编码scheme被转换为1个或者多个字节
然后每个字节都被表示成"%xy"格式的由3个字符组成的字符串,xy是字节的2位16进制的表达,推荐的编码scheme为UTF-8.
所以URL中只要包含有不安全的字符都必须编码,服务端自动解码.
但是有些网站的URL确实又包含中文等不安全字符.一个是浏览器可能会自动编码,还有个就是在服务端处理.
java 提供了URLEncoder,URLDecoder分别用于URL的编码与解码,它们提供的是静态方法:
URLEncoder.encode(url,"utf-8");
URLDecoder.decode(url,"utf-8");
当我们设置Cookie时也可能考虑使用它们来编码与解码cookie的值
特殊特殊字符的含义
————————————————————————————
字符 特殊字符的含义 URL编码
# 用来标志特定的文档位置 %23
% 对特殊字符进行编码 %25
& 分隔不同的变量值对 %26
+ 在变量值中表示空格 %2B
\ 表示目录路径 %2F
= 用来连接键和值 %3D
? 表示查询字符串的开始 %3F