编码、乱码一直算是一大问题,是几乎不能精确识别的。在这里有一开源项目,可用来检测编码,识别率还算可观。http://code.google.com/p/nuniversalchardet/
有编码识别方面需求的朋友可以试试。如果code.google.com 不可以访问,这里也有源码。https://files.cnblogs.com/08shiyan/UniversalCharDet.rar