在Asp.NET开发过程中经常会将一些列表项目导出为Excel方便用户查看和保存,但是也经常遇到文件名乱码、文件内容乱码等问题。最近我也接到了这样的Bug,现总结了若干个解决办法,供遇到问题的朋友们参考一下。希望以下的某些方法可以解决您的问题。
程序逻辑及问题
前端点击导出Excel之后,从后台数据库中绑定数据到GridView控件,将GridView控件的内容保存到临时文件。最后从临时文件读取数据流并输出到前台。
问题:有些列表导出到Excel之后打开显示乱码。文件名在IE6下显示乱码,在IE8下显示正常。
关注点
除了考虑程序方面的问题之外首先还需要先考虑以下几个方面:
操作系统
这里包括服务器与客户端的操作系统,如果是在中文的环境下建议直接安装中文的操作系统。对于英语或者其它语言的操作系统需要在区域和语言选项里安装东亚字符集,将语言和时区都选择中国。这可以解决英文操作系统下无法显示中文字符的问题。
数据库
跟操作系统一样最好直接安装中文版的数据库,另外对于中文字符的字段类型应该选择运行中文的字段类型。往数据库插入中文字符的时候记得在字符串前面加"N”,如
“有些数据内容显示乱码”是因为在不同数据库下产生的现像,但没有深入去检查数据库的问题,所以就暂时不讨论。
浏览器的支持
不同的浏览器对于文件名的编码也是不一样的,因此在编码时需要注意不同浏览器的支持,或者是否是因为浏览器问题引起乱码。比如常见的浏览器对含有中文字符的文件名称显示乱码。目前这个文件名在IE6乱码的问题还没有解决,即经过UTF-8编码的中文文件名在IE6下直接打开文件名还会显示乱码,而保存而不会有这个问题。在IE8下则都不会有问题。
参考《如何在下载文件名中使用UTF-8编码》中提到的关于不同浏览器对于Content-Description的支持,可以自己试一下。
IE6 | attachment; filename="<URL编码之后的UTF-8文件名>" |
FF3 | attachment; filename="UTF-8文件名" |
attachment; filename*="utf8''<URL编码之后的UTF-8文件名>" | |
O9 | attachment; filename="UTF-8文件名" |
Safari3(Win) | 貌似不支持?上述方法都不行 |
使用统一的编码方式
Excel数据文件导出的整个过程可能前期的数据录入数据库->取数据填充GridView等控件或者生成相应的Table表格->转换成stream并输出等过程。在整个过程中尽量使用统一的常用的编码方式比如UTF-8,以名在字符的转换过程中导致字符乱码。
开发方法
查看了以上的关注点都没有问题之后,检查程序的输出代码也没有发现问题,程序部分代码如下:
response.Clear();
response.ContentType = "application/octet-stream";
//使用UTF-8对文件名进行编码
response.AppendHeader("Content-Disposition", "attachment;filename=\"" + HttpUtility.UrlEncode(disFileName, System.Text.Encoding.UTF8) + "\"");
response.ContentType = "application/ms-excel;";
试着对response对像也设置了charset等属性(其实本来我已经使用了utf-8编码了在转换成stream的时候)。不出所料结果还是不行。
response.ContentEncoding = System.Text.Encoding.UTF8;
response.HeaderEncoding = System.Text.Encoding.UTF8;
终极解决方法
几乎查找了所有的Excel乱码的解决方案。都试了一遍都没有办法。突然在切换网页的时候发现Google的页面可以查看而我用IE打开的更改了后缀名的Excel文件却是不可以看的。突然想到在网页中可以使用<meta>去声明浏览器应该使用哪一种编码去显示页面。因此也想到了可以在导出数据的时候加上一段声明。
因为实际上使用DataGride控件导出的数据实际上就是一个table.跟HTML标签是一样的。因此Excel既然可以识别HTML的Table标签那么也应该可以识别HTML声明。这样Excel就知道该用什么字符集去解析内容了。生成的输出内容如下所示:
<table>
<tr>
<td>cbcye@live.com | http://www.cbcye.com </td> …
</tr>
<table>