zoukankan      html  css  js  c++  java
  • Python——urllib函数网络文件获取

    */
     * Copyright (c) 2016,烟台大学计算机与控制工程学院
     * All rights reserved.
     * 文件名:text.cpp
     * 作者:常轩
     * 微信公众号:Worldhello
     * 完成日期:2016年10月13日
     * 版本号:V1.0
     * 程序输入:无
     * 程序输出:见运行结果
     */
    
    问题描述:
    抓取百度贴吧(注意你所评价的程序是用Python 2还是Python 3书写的,分别使用print语句和print()函数)
    “http://tieba.baidu.com/p/1000000000”至“http://tieba.baidu.com/p/1000000009”这10个页面并以1000000000.html~1000000009.html
    这样的文件名保存到本地硬盘上(提示:文件写入使用wb模式)。

    >>>f=open('g:Python9.txt','wb')
    >>>for u in ['http://tieba.baidu.com/p/1000000000','http://tieba.baidu.com/p/1000000001','http://tieba.baidu.com/p/1000000002','http://tieba.baidu.com/p/1000000003','http://tieba.baidu.com/p/1000000004','http://tieba.baidu.com/p/1000000005','http://tieba.baidu.com/p/1000000006','http://tieba.baidu.com/p/1000000007','http://tieba.baidu.com/p/1000000008','http://tieba.baidu.com/p/1000000009']:
    	r=urllib.urlopen(u)
    	html=r.read()
    	f=open('g:Python9.txt','a')
    	f.write(html)
    	f.close


  • 相关阅读:
    最小生成树
    线段树
    编程快捷键
    线段树的动态开点
    常用库
    线性求逆元
    文件读入
    树上倍增(LCA)
    set容器
    快读与快写
  • 原文地址:https://www.cnblogs.com/chxuan/p/8232136.html
Copyright © 2011-2022 走看看