normalize,字面意思就是正规化 加入space 大概意思就是空格的处理了
官方解释是这样的:
通过去掉前导和尾随空白并使用单个空格替换一系列空白字符,使空白标准化。如果省略了该参数,上下文节点的字符串值将标准化并返回。
刚好在实际项目中碰到了这样的一个问题,
定位一个下来的时候,最开始的时候是这样写的:
li.xpath("./td[2]/text()").extract_first()
但是,每次点击后 class的值便会增加一个空格,这样class=' '这个就无法定位了,后来在同事的指导下,引入了normalize-space这个关键字
修改后的写法就是
li.xpath("normalize-space(./td[2]/text())").extract_first()
这样就搞定了 对于我目前的项目来说很实用