Unicode可以用不同的字符集来实现,最常用的编码是UTF-8 和UTF-16。
(html4支持UTF-8,HTML5同时支持UTF-8 和UTF-16)
Unicode标准涵盖了(几乎)世界上的所有的字符,标点和符号。
html5中的默认字符编码是UTF-8(UTF-8向后兼容ASCII,UTF-8石电子邮件和网页的首选编码),如果html5网页使用UTF-8不同的字符集,则应该在<meta>标记中指定他:
eg,<meta charset = "UFT-16">