zoukankan      html  css  js  c++  java
  • html邮件解析

    #-*- encoding: gb18030 -*-

    import email

    fp = open("a.eml", "r")

    msg = email.message_from_file(fp)

    # 循环信件中的每一个mime的数据块

    for par in msg.walk():

        if not par.is_multipart(): # 这里要判断是否是multipart,是的话,

                                   #里面的数据是一个message 列表

            name = par.get_param("name") #如果是附件,这里就会取出附件的文件名

            if name:

                #有附件

                # 下面的三行代码只是为了解码象=?gbk?Q?=CF=E0=C6=AC.rar?=这样的文件名

                h = email.Header.Header(name)

                dh = email.Header.decode_header(h)

                fname = dh[0][0]

                print '附件名:', fname

                data = par.get_payload(decode=True) # 解码出附件数据,然后存储到文件中

                try:

                    f = open(fname, 'wb') #注意一定要用wb来打开文件,因为附件一般都是二进制文件

                except:

                    print '附件名有非法字符,自动换一个'

                    f = open('aaaa', 'wb')

                f.write(data)

                f.close()

            else:

                #不是附件,是文本内容

                aa=par.get_payload(decode=True) # 解码出文本内容,直接输出来就可以了。

                new=open("./tuan_email.html","w")

                new.write(aa)

                new.close()

                print aa

                print "dddddddddffffffffff"

            print '+'*60 # 用来区别各个部分的输出

    MIME定义两种编码方式:Base64与QP(Quote-Printable)。

    http://www.pythonclub.org/python-network-application/email-format

     

  • 相关阅读:
    每日日报24
    每日日报23
    每日日报22
    链路层:MAC 地址
    应用层:电子邮件
    应用层:HTTP 协议
    应用层:DNS 域名系统
    运输层:TCP 拥塞控制
    运输层:拥塞控制原理
    JAVA学习日记26-0731
  • 原文地址:https://www.cnblogs.com/lexus/p/1906083.html
Copyright © 2011-2022 走看看