1 $str2 = '<div id="content">我很好 </div>'; 2 $dom = new DOMDocument(); 3 //load之前强转字符编码 4 $str2 = mb_convert_encoding($str2 ,'HTML-ENTITIES',"UTF-8"); 5 $dom->loadHTML($str2); 6 $xpath = new DOMXPath($dom); 7 $element = $xpath->query("//div[@id='content']")->item(0)->nodeValue; 8 var_dump($element);
在处理html时,除了可以用正则外,可以考虑使用dom来解析。解决中文乱码就是在load文件之前,转换编码。