zoukankan      html  css  js  c++  java
  • 搜索引擎优化

    爬虫是一种按照一定的规则自动地抓取万维网信息的程序或者脚本。

    一:seo:Search Engine Optimization分成白帽seo以及黑帽seo。白帽seo才是正规军,黑帽seo放大搜索引擎缺陷,进行欺骗。

    白帽seo:1网站标题关键字,描述,2.网站内容优化,3.Robot.txt文件,4.网站地图,5.增加外链接引用,6.网站结构布局优化,7.网站代码优化

    二:nofollow(不进行相关检索)的两种用法:

    1.<meta name = "robot" content = "nofollow"/>告诉爬虫该页面上的所有链接都无需追踪。

    2.<a href = "login.aspx" rel = "nofollow">登录</a>告诉爬虫该页面无需追踪。

    三:常见的优化小规则:

    1.使用扁平化布局,超过三层以上的标签爬虫爬起来较为吃力,布局简单为好.

    2.连接数量控制在一定范围,不能太多也不宜过少,多使用内部链接,减少外部链接,单个页面内容最好不要超过100K.

    3.采用面包屑导航,方便用户了解所在位置以及网站的组织形式.

    4.采用语义化标签strong  em比b i 的语义更强一些

    5.重要内容不要使用js输出

    6.尽量不使用iframe,爬虫取不到iframe内的内容

    7.慎用display:none,尽管隐藏还是存在

    8.重要内容的html放到前面(先放主要内容再放广告栏)

    9.img标签应全部使用alt标签

    10.才用下拉式分页导航

  • 相关阅读:
    746. 使用最小花费爬楼梯
    1283. 使结果不超过阈值的最小除数
    307. 区域和检索
    303. 区域和检索
    474. 一和零
    600. 不含连续1的非负整数
    命名规范【转】
    .NET中RabbitMq的使用
    C#中json字符串的序列化和反序列化
    c#发送post请求(带参数)
  • 原文地址:https://www.cnblogs.com/yuanyuan0809/p/5442769.html
Copyright © 2011-2022 走看看