zoukankan      html  css  js  c++  java
  • 百度搜索结果页url参数详解

          在百度首页输入任意关键词搜索之后,我们跳转到搜索结果页面,在浏览器的网址栏我们可以看到很长的一串url地址。那么,你真的了解这一串url的含义吗?

    s?:搜索

    百度搜索结果页使用了重定向,因此我们看到的不是search.php?这样的url格式

    wd:当前搜索的关键词

    即输入的关键词的urlencode字符串,编码格式为gbk或者utf-8,默认编码格式为utf-8。用于作为搜索原料,百度还会经过分词、判类等操作,不是直接检索数据库,这个会在后面的破译百度系列当中详细讲解。

    bs:上一次搜索的关键词

    内容格式与当前搜索的关键词一致。用于记录用户的搜索行为,记录该值被用于相关关键词统计、同义词分析等操作。

    rsv_spt:用户浏览器类型

    值为1或者3(暂时只统计到这两个值)。用于标记用户当前使用的浏览器,IE内核浏览器为1,非IE内核为1,不过现在这个参数恒为3,还没有了解到时停用了还是改作他用。

    rsv_bp:判断是第几次搜索

    值为0或者1。当用户第一次搜索时,该参数值为0;当用户在第一次搜索的结果页进行第二次搜索或者更多次数搜索时,该参数值为1。用于记录用户的搜索行为,记录该值被用于校验搜索结果质量以及相关搜索词相关数据分析。

    tn:搜索来源

    该值为网站标记。例如从hao123的百度输入框搜索内容,将出现tn=sitehao123。记录该值被用百度统计搜索来源,该来源数据可能被作为决策数据。

    inputT:键入时间

    从打开百度页面开始到点击搜索按钮的时长。该参数被用于记录用户搜索行为。

    oq:相关搜索的主词

    例如搜索seo是什么,在底部的相关关键词当中有淘宝seo是什么意思,当点击后oq的值就是seo是什么。该参数主要用于相关词统计以及用户搜索行为记录。

    rsp=第n+1次相关搜索

    统计相关搜索的次数,例如是第4次相关搜索,那么rsp的值为3。该参数主要用于相关词统计以及用户搜索行为记录。

    f:搜索行为判断

    8为用户自主搜索,3为下拉框推荐,1为相关搜索。该参数主要用于用户搜索行为记录以及关键词统计。

    pn:页码

    值为公差为10的等差数列。用于页码判断,同时也用于校验搜索结果质量。

    cl:搜索类型

    值为3时是网页搜索,其他的值所对应的类型暂时还没有统计到。该值会影响搜索结果排序。

    lm:指定时间内百度收录情况查询

    值为1时是最近24小时;值为7时是最近7天;值为30时是最近1个月;值为360时是最近1年。

    rn:搜索结果显示条数(Record Number)

    取值范围在10~100条之间,缺省值为10。

    ie:查询输入文字的编码

    此项设置会影响搜索参数wd的编码类型。

    si:在限定的域名中搜索

    主要用于检索某个站点的百度索引数据,例如想要只得到百度的搜索结果,那么参数的值为baidu.com。使这个参数有效必须结合ct参数一起使用。

    ct:此参数的值一般是一串数字

    估计应该是搜索请求的验证码,目的暂时还没有分析出来。

  • 相关阅读:
    标准Gitlab命令行操作指导
    ssh登录巨慢加速验证
    ssh远程主机执行命令或脚本
    ssh创建与添加密钥开启免密登陆 免确认机器指纹参数
    linux免密传输文件 nc
    Linux 查看实时网卡流量的方法 网速 nload sar iftop dstat
    Mysql 常用命令
    Redis 常用命令整理
    shell sed -i 指定内容追加.
    java 复制指定目录中的所有文件和文件夹到另一个指定文件夹中
  • 原文地址:https://www.cnblogs.com/dyllove98/p/3192258.html
Copyright © 2011-2022 走看看