为了便于操作基本类型值,ECMAScript 提供了3 个特殊的引用类型:Boolean、Number 和String。
实际上,每当读取一个基本类型值的时候,后台就会创建一个对应的基本包装类型的对象,从而让我们能够调用一些方法来操作这些数据。来看下面的例子。
var s1 = "some text"; var s2 = s1.substring(2);
当第二行代码访问s1 时,访问过程处于一种读取模式,也就是要从内存中读取这个字符串的值。而在读取模式中访问字符串时,后台都会自动完成下列处理。
(1) 创建String 类型的一个实例;
(2) 在实例上调用指定的方法;
(3) 销毁这个实例。
可以将以上三个步骤想象成是执行了下列ECMAScript 代码。
var s1 = new String("some text"); var s2 = s1.substring(2); s1 = null;
经过此番处理,基本的字符串值就变得跟对象一样了。而且,上面这三个步骤也分别适用于Boolean和Number 类型对应的布尔值和数字值。
引用类型与基本包装类型的主要区别就是对象的生存期。使用new 操作符创建的引用类型的实例,在执行流离开当前作用域之前都一直保存在内存中。而自动创建的基本包装类型的对象,则只存在于一行代码的执行瞬间,然后立即被销毁。这意味着我们不能在运行时为基本类型值添加属性和方法。来看下面的例子:
var s1 = "some text"; s1.color = "red"; alert(s1.color); //undefined
在此,第二行代码试图为字符串s1 添加一个color 属性。但是,当第三行代码再次访问s1 时,其color 属性不见了。问题的原因就是第二行创建的String 对象在执行第三行代码时已经被销毁了。第三行代码又创建自己的String 对象,而该对象没有color 属性。
对基本包装类型的实例调用typeof 会返回"object",而且所有基本包装类型的对象都会被转换为布尔值true。
Object 构造函数也会像工厂方法一样,根据传入值的类型返回相应基本包装类型的实例。例如:
var obj = new Object("some text"); alert(obj instanceof String); //true
把字符串传给Object 构造函数,就会创建String 的实例;而传入数值参数会得到Number 的实例,传入布尔值参数就会得到Boolean 的实例。
注意的是,使用new 调用基本包装类型的构造函数,与直接调用同名的转型函数是不一样的。例如:
var value = "25"; var number = Number(value); //转型函数 alert(typeof number); //"number" var obj = new Number(value); //构造函数 alert(typeof obj); //"object"
在这个例子中,变量number 中保存的是基本类型的值25,而变量obj 中保存的是Number 的实例。
尽管我们不建议显式地创建基本包装类型的对象,但它们操作基本类型值的能力还是相当重要的。而每个基本包装类型都提供了操作相应值的便捷方法。
6.1 Boolean类型
Boolean 类型是与布尔值对应的引用类型。要创建Boolean 对象,可以像下面这样调用Boolean构造函数并传入true 或false 值。
var booleanObject = new Boolean(true);
Boolean 类型的实例重写了valueOf()方法,返回基本类型值true 或false;重写了toString()方法,返回字符串"true"和"false"。可是,Boolean 对象在ECMAScript 中的用处不大,因为它经常会造成人们的误解。其中最常见的问题就是在布尔表达式中使用Boolean 对象,例如:
var falseObject = new Boolean(false); var result = falseObject && true; alert(result); //true var falseValue = false; result = falseValue && true; alert(result); //false
在这个例子中,我们使用false 值创建了一个Boolean 对象。然后,将这个对象与基本类型值true构成了逻辑与表达式。在布尔运算中,false && true 等于false。可是,示例中的这行代码是对falseObject 而不是对它的值(false)进行求值。前面讨论过,布尔表达式中的所有对象都会被转换为true,因此falseObject 对象在布尔表达式中代表的是true。结果,true && true 当然就等于true 了。
基本类型与引用类型的布尔值还有两个区别。首先,typeof 操作符对基本类型返回"boolean",而对引用类型返回"object"。其次,由于Boolean 对象是Boolean 类型的实例,所以使用instanceof操作符测试Boolean 对象会返回true,而测试基本类型的布尔值则返回false。例如:
alert(typeof falseObject); //object alert(typeof falseValue); //boolean alert(falseObject instanceof Boolean); //true alert(falseValue instanceof Boolean); //false
理解基本类型的布尔值与Boolean 对象之间的区别非常重要——当然,我们的建议是永远不要使用Boolean 对象。
6.2 Number类型
Number 是与数字值对应的引用类型。要创建Number 对象,可以在调用Number 构造函数时向其中传递相应的数值。下面是一个例子。
var numberObject = new Number(10);
与Boolean 类型一样,Number 类型也重写了valueOf()、toLocaleString()和toString()方法。重写后的valueOf()方法返回对象表示的基本类型的数值,另外两个方法则返回字符串形式的数值。可以为toString()方法传递一个表示基数的参数,告诉它返回几进制数值的字符串形式,如下面的例子所示。
var num = 10; alert(num.toString()); //"10" alert(num.toString(2)); //"1010" alert(num.toString(8)); //"12" alert(num.toString(10)); //"10" alert(num.toString(16)); //"a"
除了继承的方法之外,Number 类型还提供了一些用于将数值格式化为字符串的方法。
其中,toFixed()方法会按照指定的小数位返回数值的字符串表示,例如:
var num = 10; alert(num.toFixed(2)); //"10.00"
这里给toFixed()方法传入了数值2,意思是显示几位小数。于是,这个方法返回了"10.00",即以0 填补了必要的小数位。如果数值本身包含的小数位比指定的还多,那么接近指定的最大小数位的值就会舍入,如下面的例子所示。
var num = 10.005; alert(num.toFixed(2)); //"10.01"
能够自动舍入的特性,使得toFixed()方法很适合处理货币值。但需要注意的是,不同浏览器给这个方法设定的舍入规则可能会有所不同。在给toFixed()传入0 的情况下,IE8 及之前版本不能正确舍入范围在{(-0.94,-0.5],[0.5,0.94)}之间的值。对于这个范围内的值,IE 会返回0,而不是1 或1;其他浏览器都能返回正确的值。IE9 修复了这个问题。
另外可用于格式化数值的方法是toExponential(),该方法返回以指数表示法(也称e 表示法)表示的数值的字符串形式。与toFixed()一样,toExponential()也接收一个参数,而且该参数同样也是指定输出结果中的小数位数。看下面的例子。
var num = 10; alert(num.toExponential(1)); //"1.0e+1"
对于一个数值来说,toPrecision()方法可能会返回固定大小(fixed)格式,也可能返回指数(exponential)格式;具体规则是看哪种格式最合适。这个方法接收一个参数,即表示数值的所有数字的位数(不包括指数部分)。请看下面的例子。
var num = 99; alert(num.toPrecision(1)); //"1e+2" alert(num.toPrecision(2)); //"99" aler t(num.toPrecision(3)); //"99.0"
实际上,toPrecision()会根据要处理的数值决定到底是调用toFixed()还是调用toExponential()。
而这三个方法都可以通过向上或向下舍入,做到以最准确的形式来表示带有正确小数位的值。
我们不建议直接实例化Number 类型,而原因与显式创建Boolean 对象一样。具体来讲,就是在使用typeof 和instanceof 操作符测试基本类型数值与引用类型数值时,得到的结果完全不同,如下面的例子所示。
var numberObject = new Number(10); var numberValue = 10; alert(typeof numberObject); //"object" alert(typeof numberValue); //"number" alert(numberObject instanceof Number); //true aler t(numberValue instanceof Number); //false
在使用typeof 操作符测试基本类型数值时,始终会返回"number",而在测试Number 对象时,则会返回"object"。类似地,Number 对象是Number 类型的实例,而基本类型的数值则不是。
6.3 String类型
String 类型是字符串的对象包装类型,可以像下面这样使用String 构造函数来创建。
var stringObject = new String("hello world");
String 对象的方法也可以在所有基本的字符串值中访问到。其中,继承的valueOf()、toLocaleString()和toString()方法,都返回对象所表示的基本字符串值。
String 类型的每个实例都有一个length 属性,表示字符串中包含多个字符。来看下面的例子。
var stringValue = "hello world"; alert(stringValue.length); //"11"
这个例子输出了字符串"hello world"中的字符数量,即"11"。应该注意的是,即使字符串中包含双字节字符(不是占一个字节的ASCII 字符),每个字符也仍然算一个字符。
String 类型提供了很多方法,用于辅助完成对ECMAScript 中字符串的解析和操作。
1、字符方法
两个用于访问字符串中特定字符的方法是:charAt()和charCodeAt()。这两个方法都接收一个参数,即基于0 的字符位置。其中,charAt()方法以单字符字符串的形式返回给定位置的那个字符(ECMAScript 中没有字符类型)。例如:
var stringValue = "hello world"; alert(stringValue.charAt(1)); //"e"
字符串"hello world"位置1 处的字符是"e",因此调用charAt(1)就返回了"e"。
如果想得到的不是字符而是字符编码,那么就要像下面这样使用charCodeAt()了。
var stringValue = "hello world"; alert(stringValue.charCodeAt(1)); //输出"101"
这个例子输出的是"101",也就是小写字母"e"的字符编码。
ECMAScript 5 还定义了另一个访问个别字符的方法。在支持此方法的浏览器中,可以使用方括号加数字索引来访问字符串中的特定字符,如下面的例子所示。
var stringValue = "hello world"; alert(stringValue[1]); //"e"
使用方括号表示法访问个别字符的语法得到了IE8 及Firefox、Safari、Chrome 和Opera 所有版本的支持。如果是在IE7 及更早版本中使用这种语法,会返回undefined 值(尽管根本不是特殊的undefined 值)。
2、字符串操作方法
(1)concat() 方法
concat()用于将一或多个字符串拼接起来,返回拼接得到的新字符串,原字符串保持不变。
var stringValue = "hello "; var result = stringValue.concat("world"); alert(result); //"hello world" alert(stringValue); //"hello"
实际上,concat()方法可以接受任意多个参数,也就是说可以通过它拼接任意多个字符串。
var stringValue = "hello "; var result = stringValue.concat("world", "!"); alert(result); //"hello world!" alert(stringValue); //"hello"
虽然concat()是专门用来拼接字符串的方法,但实践中使用更多的还是加号操作符(+)。而且,使用加号操作符在大多数情况下都比使用concat()方法要简便易行(特别是在拼接多个字符串的情况下)。
ECMAScript 还提供了三个基于子字符串创建新字符串的方法:slice()、substr()和substring()。这三个方法都会返回被操作字符串的一个子字符串,而且也都接受一或两个参数。第一个参数指定子字符串的开始位置,第二个参数(在指定的情况下)表示子字符串到哪里结束。具体来说,slice()和substring()的第二个参数指定的是子字符串最后一个字符后面的位置。而substr()的第二个参数指定的则是返回的字符个数。如果没有给这些方法传递第二个参数,则将字符串的长度作为结束位置。与concat()方法一样,slice()、substr()和substring()也不会修改字符串本身的值——它们只是返回一个基本类型的字符串值,对原始字符串没有任何影响。
(2)slice()
返回被操作字符串的一个子字符串,而且也都接受一或两个参数。
第一个参数指定子字符串的开始位置,
第二个参数(在指定的情况下)表示子字符串到哪里结束。第二个参数指定的是子字符串最后一个字符后面的位置。如果没有给这些方法传递第二个参数,则将字符串的长度作为结束位置。
此方法不会修改字符串本身的值。
在传递的参数是负值的情况下,slice()方法会将传入的负值与字符串的长度相加。
(3)substring()
返回被操作字符串的一个子字符串,而且也都接受一或两个参数。
第一个参数指定子字符串的开始位置,
第二个参数(在指定的情况下)表示子字符串到哪里结束。第二个参数指定的是子字符串最后一个字符后面的位置。如果没有给这些方法传递第二个参数,则将字符串的长度作为结束位置。
此方法不会修改字符串本身的值。
在传递的参数是负值的情况下,substring()方法会把所有负值参数都转换为0。
(4)substr()
返回被操作字符串的一个子字符串,而且也都接受一或两个参数。
第一个参数指定子字符串的开始位置,
第二个参数指定的则是返回的字符个数。如果没有给这些方法传递第二个参数,则将字符串的长度作为结束位置。
此方法不会修改字符串本身的值。
在传递的参数是负值的情况下,substr()方法将负的第一个参数加上字符串的长度,而将负的第二个参数转换为0。
传入参数为正数的情况:
var stringValue = "hello world"; alert(stringValue.slice(3)); //"lo world" alert(stringValue.substring(3)); //"lo world" alert(stringValue.substr(3)); //"lo world" alert(stringValue.slice(3, 7)); //"lo w" alert(stringValue.substring(3,7)); //"lo w" alert(stringValue.substr(3, 7)); //"lo worl"
传入参数为负数的情况:
var stringValue = "hello world"; alert(stringValue.slice(-3)); //"rld" alert(stringValue.substring(-3)); //"hello world" alert(stringValue.substr(-3)); //"rld" alert(stringValue.slice(3, -4)); //"lo w" alert(stringValue.substring(3, -4)); //"hel" alert(stringValue.substr(3, -4)); //""(空字符串)
3、字符串位置方法
有两个可以从字符串中查找子字符串的方法:indexOf()和lastIndexOf()。这两个方法都是从一个字符串中搜索给定的子字符串,然后返子字符串的位置(如果没有找到该子字符串,则返回-1)。
这两个方法的区别在于:indexOf()方法从字符串的开头向后搜索子字符串,而lastIndexOf()方法是从字符串的末尾向前搜索子字符串。
var stringValue = "hello world"; alert(stringValue.indexOf("o")); //4 alert(stringValue.lastIndexOf("o")); //7
这两个方法都可以接收可选的第二个参数,表示从字符串中的哪个位置开始搜索。换句话说,indexOf()会从该参数指定的位置向后搜索,忽略该位置之前的所有字符;而lastIndexOf()则会从指定的位置向前搜索,忽略该位置之后的所有字符。
var stringValue = "hello world"; alert(stringValue.indexOf("o", 6)); //7 alert(stringValue.lastIndexOf("o", 6)); //4
可以通过循环调用indexOf()或lastIndexOf()来找到所有匹配的子字符串
var stringValue = "Lorem ipsum dolor sit amet, consectetur adipisicing elit"; var positions = new Array(); var pos = stringValue.indexOf("e"); while(pos > -1){ positions.push(pos); pos = stringValue.indexOf("e", pos + 1); } alert(positions); //"3,24,32,35,52"
4、trim()方法
ECMAScript 5 为所有字符串定义了trim()方法。这个方法会创建一个字符串的副本,删除前置及后缀的所有空格,然后返回结果。例如
var stringValue = " hello world "; var trimmedStringValue = stringValue.trim(); alert(stringValue); //" hello world " alert(trimmedStringValue); //"hello world"
由于trim()返回的是字符串的副本,所以原始字符串中的前置及后缀空格会保持不变。
支持这个方法的浏览器有IE9+、Firefox 3.5+、Safari 5+、Opera 10.5+和Chrome。
5、字符串大小写转换方法
ECMAScript 中涉及字符串大小写转换的方法有4 个:toLowerCase()、toLocaleLowerCase()、toUpperCase()和toLocaleUpperCase()。
其中,toLowerCase()和toUpperCase()是两个经典的方法,而toLocaleLowerCase()和toLocaleUpperCase()方法则是针对特定地区的实现。对有些地区来说,针对地区的方法与其通用方法得到的结果相同,但少数语言(如土耳其语)会为Unicode 大小写转换应用特殊的规则,这时候就必须使用针对地区的方法来保证实现正确的转换。以下是几个例子。
var stringValue = "hello world"; alert(stringValue.toLocaleUpperCase()); //"HELLO WORLD" alert(stringValue.toUpperCase()); //"HELLO WORLD" alert(stringValue.toLocaleLowerCase()); //"hello world" alert(stringValue.toLowerCase()); //"hello world"
6、字符串的模式匹配方法
String 类型定义了几个用于在字符串中匹配模式的方法。第一个方法就是match(),在字符串上调用这个方法,本质上与调用RegExp 的exec()方法相同。match()方法只接受一个参数,要么是一个正则表达式,要么是一个RegExp 对象。
var text = "cat, bat, sat, fat"; var pattern = /.at/; //与pattern.exec(text)相同 var matches = text.match(pattern); alert(matches.index); //0 alert(matches[0]); //"cat" alert(pattern.lastIndex); //0
另一个用于查找模式的方法是search()。这个方法的唯一参数与match()方法的参数相同:由字符串或RegExp 对象指定的一个正则表达式。search()方法返回字符串中第一个匹配项的索引;如果没有找到匹配项,则返回-1。而且,search()方法始终是从字符串开头向后查找模式。
var text = "cat, bat, sat, fat"; var pos = text.search(/at/); alert(pos); //1
为了简化替换子字符串的操作,ECMAScript 提供了replace()方法。这个方法接受两个参数:第一个参数可以是一个RegExp 对象或者一个字符串(这个字符串不会被转换成正则表达式),第二个参数可以是一个字符串或者一个函数。如果第一个参数是字符串,那么只会替换第一个子字符串。要想替换所有子字符串,唯一的办法就是提供一个正则表达式,而且要指定全局(g)标志,如下所示。
var text = "cat, bat, sat, fat"; var result = text.replace("at", "ond"); alert(result); //"cond, bat, sat, fat" result = text.replace(/at/g, "ond"); alert(result); //"cond, bond, sond, fond"
如果第二个参数是字符串,那么还可以使用一些特殊的字符序列,将正则表达式操作得到的值插入到结果字符串中。下表列出了ECMAScript 提供的这些特殊的字符序列。
字符序列 | 替换文本 |
$$ | $ |
$& | 匹配整个模式的子字符串。与RegExp.lastMatch的值相同 |
$' | 匹配的子字符串之前的子字符串。与RegExp.leftContext的值相同 |
$` | 匹配的子字符串之后的子字符串。与RegExp.rightContext的值相同 |
$n |
匹配第n个捕获组的子字符串,其中n等于0~9。例如,$1是匹配第一个捕获组的子字符串,$2是匹配第二个捕获组的子字符串, 以此类推。如果正则表达式中没有定义捕获组,则使用空字符串 |
$nn |
匹配第nn个捕获组的子字符串,其中nn等于01~99。例如,$01是匹配第一个捕获组的子字符串,$02是匹配第二个捕获组的子字符串, 以此类推。如果正则表达式中没有定义捕获组,则使用空字符串 |
通过这些特殊的字符序列,可以使用最近一次匹配结果中的内容,如下面的例子所示。
var text = "cat, bat, sat, fat"; result = text.replace(/(.at)/g, "word ($1)"); alert(result); //word (cat), word (bat), word (sat), word (fat)
在此,每个以"at"结尾的单词都被替换了,替换结果是"word"后跟一对圆括号,而圆括号中是被字符序列$1 所替换的单词。
replace()方法的第二个参数也可以是一个函数。在只有一个匹配项(即与模式匹配的字符串)的情况下,会向这个函数传递3 个参数:模式的匹配项、模式匹配项在字符串中的位置和原始字符串。在正则表达式中定义了多个捕获组的情况下,传递给函数的参数依次是模式的匹配项、第一个捕获组的匹配项、第二个捕获组的匹配项……,但最后两个参数仍然分别是模式的匹配项在字符串中的位置和原始字符串。这个函数应该返回一个字符串,表示应该被替换的匹配项使用函数作为replace()方法的第二个参数可以实现更加精细的替换操作,请看下面这个例子。
function htmlEscape(text){ return text.replace(/[<>"&]/g, function(match, pos, originalText){ switch(match){ case "<": return "<"; case ">": return ">"; case "&": return "&"; case """: return """; } }); } alert(htmlEscape("<p class="greeting">Hello world!</p>")); //<p class="greeting">Hello world!</p>
我们为插入HTML 代码定义了函数htmlEscape(),这个函数能够转义4 个字符:小于号、大于号、和号以及双引号。
最后一个与模式匹配有关的方法是split(),这个方法可以基于指定的分隔符将一个字符串分割成多个子字符串,并将结果放在一个数组中。分隔符可以是字符串,也可以是一个RegExp 对象(这个方法不会将字符串看成正则表达式)。split()方法可以接受可选的第二个参数,用于指定数组的大小,以便确保返回的数组不会超过既定大小。请看下面的例子。
var colorText = "red,blue,green,yellow"; var colors1 = colorText.split(","); //["red", "blue", "green", "yellow"] var colors2 = colorText.split(",", 2); //["red", "blue"] var colors3 = colorText.split(/[^\,]+/); //["", ",", ",", ",", ""]
在这个例子中,colorText 是逗号分隔的颜色名字符串。基于该字符串调用split(",")会得到一个包含其中颜色名的数组,用于分割字符串的分隔符是逗号。为了将数组截短,让它只包含两项,可以为split()方法传递第二个参数2。最后,通过使用正则表达式,还可以取得包含逗号字符的数组。
7、localeCompare()方法
localeCompare() 这个方法比较两个字符串,并返回下列值中的一个:
如果字符串在字母表中应该排在字符串参数之前,则返回一个负数(大多数情况下是-1,具体的值要视实现而定);
如果字符串等于字符串参数,则返回0;
如果字符串在字母表中应该排在字符串参数之后,则返回一个正数(大多数情况下是1,具体的值同样要视实现而定)。
var stringValue = "yellow"; alert(stringValue.localeCompare("brick")); //1 alert(stringValue.localeCompare("yellow")); //0 alert(stringValue.localeCompare("zoo")); //-1
这个例子比较了字符串"yellow"和另外几个值:"brick"、"yellow"和"zoo"。因为"brick"在字母表中排在"yellow"之前,所以localeCompare()返回了1;而"yellow"等于"yellow",所以
localeCompare()返回了0;最后,"zoo"在字母表中排在"yellow"后面,所以localeCompare()返回了-1。再强调一次,因为localeCompare()返回的数值取决于实现,所以最好是像下面例子所示的这样使用这个方法。
function determineOrder(value) { var result = stringValue.localeCompare(value); if (result < 0){ alert("The string 'yellow' comes before the string '" + value + "'."); } else if (result > 0) { alert("The string 'yellow' comes after the string '" + value + "'."); } else { alert("The string 'yellow' is equal to the string '" + value + "'."); } } determineOrder("brick"); determineOrder("yellow"); determineOrder("zoo");
8、fromCharCode()方法
String 构造函数本身还有一个静态方法:fromCharCode()。这个方法的任务是接收一或多个字符编码,然后将它们转换成一个字符串。从本质上来看,这个方法与实例方法charCodeAt()执行的是相反的操作。来看一个例子:
alert(String.fromCharCode(104, 101, 108, 108, 111)); //"hello"
在这里,我们给fromCharCode()传递的是字符串"hello"中每个字母的字符编码。
9、HTML
早期的Web 浏览器提供商觉察到了使用JavaScript 动态格式化HTML 的需求。于是,这些提供商就扩展了标准,实现了一些专门用于简化常见HTML 格式化任务的方法。下表列出了这些HTML 方法。不过,需要请读者注意的是,应该尽量不使用这些方法,因为它们创建的标记通常无法表达语义。
方 法 | 输出结果 |
anchor(name) | <a name= "name">string</a> |
big() | <big>string</big> |
bold() | <b>string</b> |
fixed() | <tt>string</tt> |
fontcolor(color) | <font color="color">string</font> |
fontsize(size) | <font size="size">string</font> |
italics() | <i>string</i> |
link(url) | <a href="url">string</a> |
small() | <small>string</small> |
strike() | <strike>string</strike> |
sub() | <sub>string</sub> |
sup() | <sup>string</sup> |