smarty中文乱码解决

zoukankan html css js c++ java

smarty中文乱码解决

今天兴冲冲的把所有网页和脚本传到服务器上，看看这2个星期来的成果，结果打开页面傻眼了，全是问号，被乱码了。

整个的排错过程主要分了两部分，第一，是不是服务器的问题。

因为服务器是基于linux的centOS，现在的情况很像虚拟主机，有许多个网站按文件夹分类存放着。上面的其他的文件都是gb2312编码的，唯独我的网页是utf-8的，所以我刚开始想是不是服务器的问题，于是把所有文件上传到我另一个主机上，果然显示没有问题了，顿时觉得“茅塞顿开”，是“服务器的问题”！！！

可是问题终究得解决呀，因为最终还是得上传到这个服务器上的。

于是仔细研究了下乱码页面，发现乱码的很有艺术，有的中文显示了，有的则没有，仔细观察发现，被乱码的都是经过smarty解析后的，第一直觉，问题出在smarty上。

其实我以前的时候对乱码有接触，说道乱码，首先想到的就是编码。

编码不一致的问题是导致乱码的主要原因之一。

比如，我一个网页文件，用记事本打开，然后另存为，然后编码选“UTF-8”，在网页的head头标签里的meta里也要声明才行：

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

至于数据库，那就更要编码一致了，编码不一致也要通过set names utf-8 或者iconv等函数来解决。

首先，在php文件里加上这句：

header(“Content-Type: text/html; charset=gb2312″)，

加哪？这可真是个问题，因为对smarty模板有个display的解析，我分别加了4个地方，不过都宣告无效。

将smarty的所有php文件全部重新另存为了 utf-8 格式。。（是不是很崩溃？！）结果宣布无效。

将 index.php 、index.tpl (对应的模板文件)、config.php (我的对应的配置文件) 分别另存为 utf-8 格式，ANSI 格式，和unicode格式做测试，通通宣告无效。

将meta标签里的charset改为 gb2312 ，这真是下下策了，因为设计的初衷就是为了 utf-8，全球通用，不过可能是哪个地方错了，宣告无效。

一筹莫展的时候，在打开 config.php 之后，另存为 ANSI 做测试，无效，然后又另存为 UTF-8 格式，结果乱码解决了！！

杯具了我。。。

之后我估计，可能是linux系统对文本文件编码识别与windows一些地方的不同导致了上述乱码问题。因为我config文件原来就是 utf-8的，然后保存为 ANSI格式，再保存为 utf-8格式，就好了。。。说明第一次的时候是不是我哪手贱，utf-8没弄彻底呢。。

附录1：我差点就去下UltraEdit32 去保存去DOM的utf-8格式了。。

smarty模板默认UTF-8编码方式，UTF-8的编码分有bom和无bom两种情况，一般情况下保存时默认为有bom，于是导致smarty模板中的乱码问题。FF可以自动过滤bom，但是ie却不行。

目前最好的处理方式是在保存文件的时候自动保存成不带bom的UTF-8格式，比较好用的编辑器如UltraEdit，保存时控制其格式为“utf-8 无bom”即可。

以下为网上转载对BOM的解释：

BOM(Byte Order Mark)，是UTF编码方案里用于标识编码的标准标记，在UTF-16里本来是FF FE，变成UTF-8就成了EF BB BF。这个标记是可选的，因为UTF8字节没有顺序，所以它可以被用来检测一个字节流是否是UTF-8编码的。微软做这种检测，但有些软件不做这种检测，而把它当作正常字符处理。

微软在自己的UTF-8格式的文本文件之前加上了EF BB BF三个字节, windows上面的notepad等程序就是根据这三个字节来确定一个文本文件是ASCII的还是UTF-8的, 然而这个只是微软暗自作的标记, 其它平台上并没有对UTF-8文本文件做个这样的标记。

也就是说一个UTF-8文件可能有BOM，也可能没有BOM，那么怎么区分呢？三种方法。1，用UltraEdit-32打开文件，切换到十六进制编辑模式，察看文件头部是否有EF BB BF。2，用Dreamweaver打开，察看页面属性，看“包括Unicode签名BOM”前面是否有个勾。3，用Windows的记事本打开，选择“另存为”，看文件的默认编码是UTF-8还是ANSI，如果是ANSI则不带BOM。

注意用Convertz把gb2312文件转换成UTF-8文件时，默认设置是不带BOM的。不带BOM可能出现上述乱码问题，但是带BOM，对于php的include文件要小心，会在php字节流前面多出EF BB BF，提前输出到显示器有可能会带来程序错误。一个解决方案是凡是被include的文件都保存为ANSI，主文件可以是UTF-8。要想把一个文件去掉BOM，使用UlterEdit打开, 切换到十六进制编辑模式，把最前面三个字节(就是那该死的 EF BB BF)替换为20，保存（注意关闭保存时自动备份的功能），再切换到默认编辑模式，把最前面的三个空格去掉就可以了。

另外还学到一些编码的小知识：所谓的unicode保存的文件实际上是utf-16，只不过恰好跟unicode的码相同而已,但在概念上unicode与utf是两回事，unicode是内存编码表示方案，而utf是如何保存和传输unicode的方案。utf-16还分高位在前(LE)和高位在后(BE)两种。官方的utf编码还有utf-32，也分LE和BE。非unicode官方的utf编码还有utf-7，主要用于邮件传输。utf-8的单字节部分是和iso-8859-1兼容的，这主要是一些旧的系统和库函数不能正确处理utf-16而被迫出来的，而且对英语字符来说，也节省保存的文件空间（以非英语字符浪费空间为代价）。在iso-8859-1的时候，utf8和iso-8859-1都是用一个字节表示的，当表示其它字符的时候，utf-8会使用两个或三个字节。

附录2：流行的比较全面的解决方法

PHP中文乱码是PHP开发中的常见问题之一。PHP中文乱码有时发生在网页本身，有些产生在于MySQL交互的过程中，有时与操作系统有关。下面进行一番总结。

一.首先是PHP网页的编码

1. php文件本身的编码与网页的编码应匹配

a. 如果欲使用gb2312编码，那么php要输出头：header(“Content-Type: text/html; charset=gb2312″)，静态页面添加，所有文件的编码格式为ANSI，可用记事本打开，另存为选择编码为ANSI，覆盖源文件。

b. 如果欲使用utf-8编码，那么php要输出头：header(“Content-Type: text/html; charset=utf-8″)，静态页面添加，所有文件的编码格式为utf-8。保存为utf-8可能会有点麻烦，一般utf-8文件开头会有BOM，如果使用 session就会出问题，可用editplus来保存，在editplus中，工具->参数选择->文件->UTF-8签名，选择总是删除，再保存就可以去掉BOM信息了。

2. php本身不是Unicode的，所有substr之类的函数得改成mb_substr(需要装mbstring扩展);或者用iconv转码。

二.PHP与Mysql的数据交互

PHP与数据库的编码应一致

1. 修改mysql配置文件my.ini或my.cnf，mysql最好用utf8编码

[mysql]

default-character-set=utf8

[mysqld]

default-character-set=utf8

default-storage-engine=MyISAM

在[mysqld]下加入:

default-collation=utf8_bin

init_connect=’SET NAMES utf8′

2. 在需要做数据库操作的php程序前加mysql_query(“set names ‘编码’”);，编码和php编码一致，如果php编码是gb2312那mysql编码就是gb2312，如果是utf-8那mysql编码就是 utf8，这样插入或检索数据时就不会出现乱码了

三.PHP与操作系统相关

Windows和Linux的编码是不一样的，在Windows环境下，调用PHP的函数时参数如果是utf-8编码会出现错误，比如 move_uploaded_file()、filesize()、readfile()等，这些函数在处理上传、下载时经常会用到，调用时可能会出现下面的错误:

Warning: move_uploaded_file()[function.move-uploaded-file]:failed to open stream: Invalid argument in …

Warning: move_uploaded_file()[function.move-uploaded-file]:Unable to move ” to ” in …

Warning: filesize() [function.filesize]: stat failed for … in …

Warning: readfile() [function.readfile]: failed to open stream: Invalid argument in ..

在Linux环境下用gb2312编码虽然不会出现这些错误，但保存后的文件名出现乱码导致无法读取文件，这时可先将参数转换成操作系统识别的编码，编码转换可用mb_convert_encoding(字符串,新编码,原编码)或iconv(原编码,新编码,字符串)，这样处理后保存的文件名就不会出现乱码，也可以正常读取文件，实现中文名称文件的上传、下载。

其实还有更好的解决方法，彻底与系统脱离，也就不用考虑系统是何编码。可以生成一个只有字母和数字的序列作为文件名，而将原来带有中文的名字保存在数据库中，这样调用move_uploaded_file()就不会出现问题，下载的时候只需将文件名改为原来带有中文的名字。实现下载的代码如下

header(“Pragma: public”);

header(“Expires: 0″);

header(“Cache-Component: must-revalidate, post-check=0, pre-check=0″);

header(“Content-type: $file_type”);

header(“Content-Length: $file_size”);

header(“Content-Disposition: attachment; filename=/”$file_name/”");

header(“Content-Transfer-Encoding: binary”);

readfile($file_path);

$file_type是文件的类型，$file_name是原来的名字，$file_path是保存在服务上文件的地址。

四.再来总结一下为什么会乱码

一般来说，乱码的出现有2种原因，首先是由于编码(charset) 设置错误，导致浏览器以错误的编码来解析，从而出现了满屏乱七八糟的“天书”，其次是文件被以错误的编码打开，然后保存，比如一个文本文件原先是 GB2312 编码的，却以UTF-8 编码打开再保存。要解决上述乱码问题，首先需要知道开发中哪些环节涉及到了编码：

1、文件编码：指的是页面文件(.html,.php等)本身是以何种编码来保存的。记事本和Dreamweaver 在打开页面时候会自动识别文件编码因而不太会出问题。而ZendStudio却不会自动识别编码，它只会根据首选项的配置固定以某种编码打开文件，如果工作时候一不注意，用错误编码打开文件，做了修改之后一保存，乱码就出现了(我深有体会)。

2、页面申明编码：在HTML代码HEAD里面，可以用来告诉浏览器网页采用了什么编码，目前中文网站开发中XXX主要用的是GB2312和UTF-8 两种编码。

3、数据库连接编码：指的是进行数据库操作时候以哪种编码与数据库传输数据，这里需要注意的是不要与数据库本身的编码混淆，比如MySQL内部默认是latin1编码，也就是说Mysql是以latin1编码来存储数据，以其他编码传输给Mysql的数据会被转换成latin1编码。

知道了WEB开发中哪些地方涉及到了编码，也就知道了乱码产生的原因：上述3项编码设置不一致，由于各种编码绝大部分是兼容ASCII的，所以英文符号不会出现，中文就倒霉了。

五.决战一些常见的错误情况与解决：

1、数据库采用UTF8 编码，而页面申明编码是GB2312 ，这是最常见的产生乱码的原因。这时候在PHP脚本里面直接SELECT数据出来的就是乱码，需要在查询前先使用： mysql_query(“SET NAMES GBK”); 来设定MYSQL连接编码，保证页面申明编码与这里设定的连接编码一致(GBK是GB2312的扩展 )。如果页面是UTF-8 编码的话，可以用： mysql_query(“SET NAMES UTF8″);

注意是UTF8而不是一般用的UTF-8。假如页面申明的编码与数据库内部编码一致可以不设定连接编码。

注：事实上MYSQL的数据输入输出比上面讲的更复杂一些，MYSQL配置文件my.ini中定义了2个默认编码，分别是[client]里的 default -character-set和[mysqld] 里的default-character-set 来分别设定默认时候客户端连接和数据库内部所采用的编码。我们上面指定的编码其实是MYSQL客户端连接服务器时候的命令行参数 character_set_client，来告诉MYSQL服务器接受到的客户端数据是什么编码的，而不是采用默认编码。

2、页面申明编码与文件本身编码不一致，这种情况很少发生，因为如果编码不一致美工做页面时候在浏览器看到的就是乱码了。更多时候是发布以后修改一些小BUG，以错误编码打开页面然后保存导致的。或者是用某些FTP软件直接在线修改文件，比如CuteFTP，由于软件编码配置错误而导致转换错了编码。

3、一些租用虚拟主机的朋友，明明上述3项编码都设置正确了还是有乱码。比方说网页是GB2312 编码的，IE等浏览器打开却总是识别成UTF-8 ，网页HEAD里面已经申明是GB2312 了，手动修改浏览器编码为GB2312 后页面显示正常。产生原因是服务器Apache设定了服务器全局的默认编码，在httpd.conf里面加了AddDefaultCharset UTF-8 。这时候服务器会首先发送HTTP头给浏览器，其优先级比页面里申明编码高，自然浏览器就识别错了。解决办法有2个，请管理员在配置文件自己的虚机里加上一条AddDefaultCharset GB2312 来覆盖全局配置，或者在自己目录的.htaccess里配置。

总结:总之一句话,要解决PHP中文乱码最好最快的解决办法就是,页面申明的编码与数据库内部编码一致,如果页面申请的页码与数据库内部编码不一致时,就设定连接编码 ,mysql_query(“SET NAMES XXX “); XXX为连接编码.一定可以解决乱码的问题.

查看全文

相关阅读:
Java基础知识强化之集合框架笔记15：List集合的特点
 Java基础知识强化之集合框架笔记14：List集合存储字符串并遍历
 Java基础知识强化之集合框架笔记13：Collection集合存储学生对象并遍历
 Java基础知识强化之集合框架笔记12：Collection集合存储字符串并遍历
 Java基础知识强化之集合框架笔记11：Collection集合之迭代器的原理及源码解析
 Java基础知识强化之集合框架笔记10：Collection集合使用的步骤
 rsync 远程数据同步工具详解
 FastDFS配置说明
 redis监控状态
 zabbix监控phpfpm

原文地址：https://www.cnblogs.com/lechie/p/2383220.html