BeautifulSoup

from bs4 import BeautifulSoup
import urllib2

html = urllib2.urlopen('http://tieba.baidu.com/p/5058456989')
bsobj = BeautifulSoup(html.read(), "html.parser")  # 不加"html.parser"会有警告。。。。
print bsobj.title

underline = '-'*100

def get_title(url):
    try:
        html = urllib2.urlopen(url)
    except HTTPError, e:
        raise e
        return None
    try:
        bsobj = BeautifulSoup(html.read(), "html.parser")
        title = bsobj
    except AttributeError, e:
        raise e
        return None
    return title

url = 'http://tieba.baidu.com/p/4420237089?see_lz=1'
title = get_title(url)
if title is None:
    print 'title is none'
else:
    print underline
    # print title
tmp = title.findAll("div", {"class": "d_post_content j_d_post_content "})
vmp = title.findAll("span", {"class": "tail-info"})
# for v in vmp.tr.next_siblings:
#     print v
for val, f in zip(tmp, vmp[1:-1:3]):
    print val.get_text()
    print f.get_text(), underline

查看全文

相关阅读:
String 总结
 android 调试源码
 Java 随机数总结
 Android中如何控制调节屏幕亮度
 Activity中通过Bundle传递自定义数据类型
 Android AsyncTask简单用法
 WCF 第五章可信赖会话
 WCF 第五章会话级别的实例
 WCF 第五章行为在WCF一个服务内部的事务操作
 WCF 第五章导出并发布元数据(服务行为)

原文地址：https://www.cnblogs.com/cmm2016/p/6709199.html