zoukankan      html  css  js  c++  java
  • 第一个爬虫和测试

    Python测试函数的方法之一是用:try……except

    复制代码
    def gameover(a,b):
        if a>=10 and b>=10 and abs(a-b)==2:
            return True
        if (a>=11 and b<11) or (a<11 and b>=11):
            return True
        return False
    try:
        a=gameover(10,11)
        print(a)
    except:
        print("Error")
    复制代码

    gameover测试的函数,没传参数的a,b,函数结果是True or False

    try:试着执行gameover()函数,正常就执行函数

    except:否则 打印'Error'

    这里用10,11这一对来测试,结果为:

    runfile('D:/新建文件夹/chesi.py', wdir='D:/新建文件夹')
    True

    程序运行正常且结果正确

    若不输入参数,结果应为Error,结果为:

    打开360搜索20次

    用requests()打开360搜索

    代码如下:

    from requests import *
    try:
        for i in range(20):
            r=get("https://www.so.com/")
            r.raise_for_status()
            r.encoding='utf-8'
            print(r)
        print(len(r.text))
        print(len(r.content))
    except:
        print("Error")

    结果成功显示200 

    成功

    下面有一段html代码;

    <!DOCTYPE html>

    <html>

    <head>

    <meta charset='utf-8'>

    <title>菜鸟教程(runoob.com)</title>

    </head> <body>

    <h1>我的第一标题</h1>

    <p  id='frist'>我的第一段落。</p>

    </body>

    </table>

    </html>

    我们需要做以下要求:

     

    我们有以下代码解决:

    复制代码
    from bs4 import BeautifulSoup
    import re
    html = BeautifulSoup("<!DOCTYPE html>
    <html>
    <head>
    <meta charset='utf-8'>
    <title>菜鸟教程(runoob.com)</title>
    </head>
    <body>
    <h1>我的第一标题</h1>
    <p  id='frist'>我的第一段落。</p>
    </body>
    </table>
    </html>","html.parser")
    print(html.head,"20") 
    print(html.body)
    print(html.find_all(id="first")) 
    r=html.text
    pattern = re.findall(u'[u1100-uFFFDh]+?',r)
    print(pattern)
  • 相关阅读:
    weak_ptr解决shared_ptr环状引用所引起的内存泄漏[转]
    如何限制对象只能建立在堆上或者栈上(转载)
    为了异常安全(swap,share_ptr)——Effecive C++
    注意类型转换——Effective C++
    http协议
    【java.math.BigInteger】常用函数
    【java.math.BigInteger】【转】常见问题
    【思路,dp,BigInteger】ZOJ
    【Warshall_Floyd】
    【Dijkstra】
  • 原文地址:https://www.cnblogs.com/zhoukun520/p/10908683.html
Copyright © 2011-2022 走看看