该系列的之前两篇文章已经把几乎所有SEO的思想都涵盖了,如一开始说的那样,SEO无非是去对搜索引擎友好、或是对搜索引擎的用户友好,不可能有再多的 了。接下来就会陆陆续续提一些更细节的东西。因为在群博的公开环境下能够分享的内容有限,所以会偏向一些和SEO效果未必有直接关系,但也应该被SEO所 注重的技术层面方面的内容。
对于SEO而言,良好的URL结构是什么样的?和前面的文章一样,让我们来看下SEO顶尖网站Amazon的做法,这是它的一个产品页:
http://www.amazon.com/Zune-Video-MP3-Player-Platinum/dp/B002JPITY8
1.
URL
的第一段是产品名,以中划线分隔——Google在其网站站长工具帮助中推荐过的符号(略有类似的,百度搜索引擎友好指南中提出网页标题与网站名称间的分
隔最好是下划线。当然这些和搜索引擎的识别机制无关,它们无论如何都不可能认不出这些是分隔符,但对于用户而言会是相对更友好的。)
2.
dp,或许指的是Detail Product,是产品页面的特殊标识。只要有这一段URL在,无论是在流量统计工具或是日志分析中,都可以非常方便的把产品类型页面的流量等情况给细分出来。
3.
B002JPITY8此类的是商品的ASIN码,对于每个产品这都是独一无二的,这样能保证商品绝对不会重复发布。是每一个产品的唯一标识。
但
这样的URL也存在着一些问题,比如访问:http://www.amazon.com/abcdefg/dp/B002JPITY8这样的URL,也会
出现和前面相同的页面。万一这些页面被搜索引擎收录的话,至少是对SEO绝无好处的。(不排除少数情况下竞争对手会以此陷害自己网站SEO的可能性)
那么技术上的解决方案是什么呢?如果去问程序人员,他们或许给出的方案是:当页面被请求时,读取URL第一段,并将其与产品的名字对比。如果吻合即返回正常页面,不然抛出404异常。
但
SEO上面有更好些的方案,直接输出一个canonical属性来指定规范的网址就好了,Amazon正是这么做的。这是一个用来处理网址规范化的标签,
在Google网站站长工具帮助里面有说明:http://support.google.com/webmasters/bin
/answer.py?hl=zh-Hans&answer=139394(而百度是否支持canonical标签我也不确定)
但Amazon做的还不止是这些,对于URL第三段的ASIN码,还有其它玄机在。这是Amazon官网上对ASIN码的说明中的一小段:
You
will find an item’s ASIN on the product detail page alongside further
details relating to the item, which may include information such as
size, number of pages (if it’s a book) or number of discs (if it’s a
CD)。
大意是很多对于产品而言很多关键的参数信息,都被记录在了这短短一小段ASIN码中,这样数据分析的时候就能以它来判断哪类产品卖得好等等。且加密过的ASIN码也可以使得竞争对手无法轻易的获知自己的信息。
综合已经提到的一些,和另一些限于篇幅还没提到的因素,这边将URL结构在SEO里面额外需要注意的地方按大致重要性列出:
1. 唯一性(保证页面不能重复)
2. 易分析性(最多用一个简单的正则即可将一类页面细分出来,能够不用正则的话最好)
3. 语义化(如example.com/blog/1.html, example.com/gallery/2.html,让用户只通过看URL就知道自己将访问的是什么样的页面)
4. 程序实现起来的效率
没法说那一种URL结构绝对是完美的。依网站类型、规模等等因素的不同,也得看网站技术架构上如何更便捷,可能还要参照其它各个部门的需求,最终的URL形式自然是需要权衡各方面的利弊来得出的,这边也就不妄论了。