zoukankan      html  css  js  c++  java
  • 第一个爬虫和测试

    一、第一个测试

    测试球赛的GameOver函数

    def GameOver(N, scoreA, scoreB):

    '''

    function: 定义一局比赛的结束条件

    N: 代表当前局次(第五局为决胜局)

    return: 若比赛结束的条件成立返回真,否则为假

    '''

    if N <= 4:

    return (scoreA>=25 and abs(scoreA-scoreB)>=2 or scoreB>=25 and abs(scoreA-scoreB)>=2)

    else:

    return (scoreA>=15 and abs(scoreA-scoreB)>=2) or (scoreB>=15 and abs(scoreA-scoreB)>=2)

     

    try:

    for i in range(10):

    a,b,c=map(int,input().split(','))

    print(GameOver(a,b,c))

    except:

    print("error")

     

     

    三、这是一个简单的HTML页面

    <html>

    <head>

    <title>Simpke</title>

    </head>

    <body><p id='china'>你好,中国</p>

    </body>

    </html>

    要求如下:
    (1)打印head标签的内容

    (2)获取body的内容

    (3)获取id为china的标签对象

    (4)获取并打印html页面的中文字符

    代码如下:

    from bs4 import BeautifulSoup

    import re

    soup=BeautifulSoup("<html><head><title>Simpke</title></head><body><p id='china'>你好,中国</p></body></html>","html.parser")

    print(soup.head,"05") #打印head的内容和我的学号后两位

    print(soup.body) #打印body的内容

    print(soup.find_all(id="china")) #打印id为china的文本

    r=soup.text

    pattern = re.findall(u'[u1100-uFFFDh]+?',r)

    print(pattern)

    结果如下:

     

    二、第一个爬虫

    我是爬虫谷歌网页的

    代码如下:

    import requests

    def one(url):

    try:

    r=requests.get(url)

    r.raise_for_status()

    r.encoding='utf-8'

    return r.text()

    except:

    return("爬虫失败")

    url="https://www.google.com.hk/"

    print(one(url))

     

    结果为:

  • 相关阅读:
    mongoDB
    昆仑会员此打印方式只针对用会员卡结账的消费,放开限制解决方案
    用jdk1.6的pack200和unpack200,对jar文件进行压缩和解压 .pack.gz
    ffmpeg
    关于golang-mod的使用方法
    组件&Props
    元素渲染
    JSX 简介
    React-HelloWorld
    Vue与REACT两个框架的区别和优势对比
  • 原文地址:https://www.cnblogs.com/panqiaoyan/p/10893660.html
Copyright © 2011-2022 走看看