zoukankan      html  css  js  c++  java
  • 搜索引擎搜索

    模拟搜索引擎的关键是知道该搜索引擎的关键词接口

      百度的关键词接口是:http://www.baidu.com/s?wd=KEYWORD

      360搜索的关键词接口是:http://www.so.com/s?q=KEYWORD

    百度搜索Python:

    import requests
    keyword = "Python"
    url = 'http://www.baidu.com/s'
    try:
      kv = {'wd':'keyword'}
      r = requests.get(url,params=kv)
      print(r.request.url)
      r.raise_for_status()
      r.encoding = r.apparent_encoding
      print(len(r.rext))
      print(r.text[:1000])
    except:
      print("爬取失败")

    360搜索Python:

    import requests
    keyword = "Python"
    url = 'http://www.so.com/s'
    try:
      kv = {'q':'keyword'}
      r = requests.get(url,params=kv)
      print(r.request.url)
      r.raise_for_status()
      r.encoding = r.apparent_encoding
      print(len(r.rext))
      print(r.text[:1000])
    except:
      print("爬取失败")

    任意给一个搜索引擎,获取它的搜索接口的方法为:

    以百度为例,在百度搜索框内输入Python,直接搜索,然后在地址框内找到&wd=Python字样的,则百度的搜索接口就是百度的搜索网址加上wd

  • 相关阅读:
    apache、php隐藏http头部版本信息的实现方法
    CentOs 设置静态IP 方法
    PHP如何判断远程图片文件是否存在
    linux删除乱码文件
    Linux基础学习1
    C#——继承
    解决简体输出乱码问题
    简单的Tuple声明和输出
    懒汉式与饿汉式的区别
    Java 反射
  • 原文地址:https://www.cnblogs.com/tianxxl/p/7655623.html
Copyright © 2011-2022 走看看