先看下面两个Url,他们传递的参数一样么?
aaa.aspx?tag=.net%bc%bc%ca%f5
aaa.aspx?tag=.net%e6%8a%80%e6%9c%af
看起来好像是不一样,其实他们都是对".net技术"进行了UrlEncode,不过一个是GB2312的编码,一个是Utf-8的编码。
如下代码就可以获得上面的编码后效果:
string tmp1 = System.Web.HttpUtility.UrlEncode(".net技术", System.Text.Encoding.GetEncoding("GB2312"));
string tmp2 = System.Web.HttpUtility.UrlEncode(".net技术", System.Text.Encoding.UTF8);
我们实际的Web页面,可能会被其他程序调用。
比如:简体中文操作系统上的一个ASP页面,需要向一个ASP.net页面传递一个带中文的参数。
默认情况下,简体中文操作系统上, ASP 的 Server.UrlEncode 方法会把中文以GB2312的编码进行编码,
但是默认情况下,ASP.net的页面是采用的UTF-8编码。
这种情况下,你在用 Request.QueryString["Tag"] 接受值的时候会接受不到中文信息,单步调试看到的是乱码。
这时候虽然用Request.QueryString["Tag"] 接受的是乱码,但这时候的Url并不是乱码。
解决方法就是自己分析Url中的参数,然后对参数的值按照 GB2312的编码反解密,而不是用.net 默认的Utf-8的编码反解密。
其实微软类似的提供了相应的函数,我们不必自己用正则表达式去分析url字符串了。
演示代码如下:
string q = Request.Url.Query;
System.Collections.Specialized.NameValueCollection nv =
System.Web.HttpUtility.ParseQueryString(q, System.Text.Encoding.GetEncoding("GB2312"));
Response.Write(nv["Tag"]);
我们用 Lutz Roeder’s .NET Reflector 来看 System.Web.HttpUtility.ParseQueryString 方法的实现:
一直反查进去,我们可以看到最终处理Url参数字符串分析的代码如下:
System.Web.HttpValueCollection 类的如下函数实现了对Url参数的解析
这里我们看到,它是自己一个个字符进行的分析。
internal void FillFromString(string s, bool urlencoded, Encoding encoding)
{
int num1 = (s != null) ? s.Length : 0;
for (int num2 = 0; num2 < num1; num2++)
{
int num3 = num2;
int num4 = -1;
while (num2 < num1)
{
switch (s[num2])
{
case ’=’:
if (num4 < 0)
{
num4 = num2;
}
break;
}
num2++;
}
string text1 = null;
string text2 = null;
if (num4 >= 0)
{
text1 = s.Substring(num3, num4 - num3);
text2 = s.Substring(num4 + 1, (num2 - num4) - 1);
}
else
{
text2 = s.Substring(num3, num2 - num3);
}
if (urlencoded)
{
base.Add(HttpUtility.UrlDecode(text1, encoding), HttpUtility.UrlDecode(text2, encoding));
}
else
{
base.Add(text1, text2);
}
if ((num2 == (num1 - 1)) && (s[num2] == ’&’))
{
base.Add(null, string.Empty);
}
}
}
至于对方传递给自己的是哪种编码方式,最好也一并作为参数传递过来,这样我们就可以根据用户的这个参数进行解密操作。
aaa.aspx?tag=.net%bc%bc%ca%f5
aaa.aspx?tag=.net%e6%8a%80%e6%9c%af
看起来好像是不一样,其实他们都是对".net技术"进行了UrlEncode,不过一个是GB2312的编码,一个是Utf-8的编码。
如下代码就可以获得上面的编码后效果:
string tmp1 = System.Web.HttpUtility.UrlEncode(".net技术", System.Text.Encoding.GetEncoding("GB2312"));
string tmp2 = System.Web.HttpUtility.UrlEncode(".net技术", System.Text.Encoding.UTF8);
我们实际的Web页面,可能会被其他程序调用。
比如:简体中文操作系统上的一个ASP页面,需要向一个ASP.net页面传递一个带中文的参数。
默认情况下,简体中文操作系统上, ASP 的 Server.UrlEncode 方法会把中文以GB2312的编码进行编码,
但是默认情况下,ASP.net的页面是采用的UTF-8编码。
这种情况下,你在用 Request.QueryString["Tag"] 接受值的时候会接受不到中文信息,单步调试看到的是乱码。
这时候虽然用Request.QueryString["Tag"] 接受的是乱码,但这时候的Url并不是乱码。
解决方法就是自己分析Url中的参数,然后对参数的值按照 GB2312的编码反解密,而不是用.net 默认的Utf-8的编码反解密。
其实微软类似的提供了相应的函数,我们不必自己用正则表达式去分析url字符串了。
演示代码如下:
string q = Request.Url.Query;
System.Collections.Specialized.NameValueCollection nv =
System.Web.HttpUtility.ParseQueryString(q, System.Text.Encoding.GetEncoding("GB2312"));
Response.Write(nv["Tag"]);
我们用 Lutz Roeder’s .NET Reflector 来看 System.Web.HttpUtility.ParseQueryString 方法的实现:
一直反查进去,我们可以看到最终处理Url参数字符串分析的代码如下:
System.Web.HttpValueCollection 类的如下函数实现了对Url参数的解析
这里我们看到,它是自己一个个字符进行的分析。
internal void FillFromString(string s, bool urlencoded, Encoding encoding)
{
int num1 = (s != null) ? s.Length : 0;
for (int num2 = 0; num2 < num1; num2++)
{
int num3 = num2;
int num4 = -1;
while (num2 < num1)
{
switch (s[num2])
{
case ’=’:
if (num4 < 0)
{
num4 = num2;
}
break;
}
num2++;
}
string text1 = null;
string text2 = null;
if (num4 >= 0)
{
text1 = s.Substring(num3, num4 - num3);
text2 = s.Substring(num4 + 1, (num2 - num4) - 1);
}
else
{
text2 = s.Substring(num3, num2 - num3);
}
if (urlencoded)
{
base.Add(HttpUtility.UrlDecode(text1, encoding), HttpUtility.UrlDecode(text2, encoding));
}
else
{
base.Add(text1, text2);
}
if ((num2 == (num1 - 1)) && (s[num2] == ’&’))
{
base.Add(null, string.Empty);
}
}
}
至于对方传递给自己的是哪种编码方式,最好也一并作为参数传递过来,这样我们就可以根据用户的这个参数进行解密操作。