zoukankan      html  css  js  c++  java
  • Python 电子邮件

      从一台计算机编写邮件到对方收到邮件。假设我们自己的电子邮件地址是me@163.com,对方的电子邮件地址是friend@sina.com

      我们在本地的软件上写好邮件,点击发送,邮件就发送出去了,这些电子邮件被称为MUA(mail user agent)邮件用户代理

      邮件从本地被发送出去后,并不会被直接送到用户的电脑上,而是被发送到MTA:Mail Transfer Agent 浏览器传输代理,就是那些Email服务提供商,比如网易、新浪等等,由于我们自己的电子邮件是163.com,所以邮件回被最先送到网易提供的MTA,再由网易的MTA发送到对方的MTA,即新浪的MTA,这中间可能还会经过其他服务商的MTA

      当邮件被送到对方邮箱的服务提供商的MTA,因此新浪的MTA会把邮件投递到邮件的最终目的地:MDA :Mail Delivery Agent 邮件投递代理。Email到达MDA后,就静静地躺在新浪的某个服务器上,存放在某个文件或特殊的数据库里,我们将这个长期保存邮件的地方称之为电子邮箱。

      Email不会直接到达对方的电脑,因为对方电脑不一定开机,开机也不一定联网。对方要取到邮件,必须通过MUA从MDA上把邮件取到自己的电脑上。

      所以,一封电子邮件的旅程就是:

     发件人 -> MUA -> MTA -> MTA -> 若干个MTA -> MDA <- MUA <- 收件人

      所以要编写程序来发送和接受邮件,最基本的两件事

      编写MUA将邮件送到MTA,编写MUA从MDA上取邮件

      协议

      发邮件时,MUA和MTA使用的协议就是SMTP:Simple Mail Transfer Protocol,后面的MTA到另一个MTA也是用SMTP协议。

      收邮件时,MUA和MDA使用的协议有两种:POP:Post Office Protocol,目前版本是3,俗称POP3;IMAP:Internet Message Access Protocol,目前版本是4,优点是不但能取邮件,还可以直接操作MDA上存储的邮件,比如从收件箱移到垃圾箱,等等。

      

      邮件客户端软件在发邮件时,会让你先配置SMTP服务器,也就是你要发到哪个MTA上。假设你正在使用163的邮箱,你就不能直接发到新浪的MTA上,因为它只服务新浪的用户,所以,你得填163提供的SMTP服务器地址:smtp.163.com,为了证明你是163的用户,SMTP服务器还要求你填写邮箱地址和邮箱口令,这样,MUA才能正常地把Email通过SMTP协议发送到MTA。

      类似的,从MDA收邮件时,MDA服务器也要求验证你的邮箱口令,确保不会有人冒充你收取你的邮件,所以,Outlook之类的邮件客户端会要求你填写POP3或IMAP服务器地址、邮箱地址和口令,这样,MUA才能顺利地通过POP或IMAP协议从MDA取到邮件。

      最后特别注意,目前大多数邮件服务商都需要手动打开SMTP发信和POP收信的功能,否则只允许在网页登录。否则我们就不能在自己的程序上登陆

    使用SMTP发送邮件

      参考链接:https://www.liaoxuefeng.com/wiki/1016959663602400/1017790702398272#0

      SMTP是发送邮件的协议,可以发送纯文本邮件、HTML邮件以及带附件的邮件。Python对SMTP的支持有两个模块:smtplib和email。email负责构造邮件,smtplib负责发送邮件。构造和发送是一起的

      

      构造一个邮件对象就是一个Messag对象,如果构造一个MIMEText对象,就表示一个文本邮件对象,如果构造一个MIMEImage对象,就表示一个作为附件的图片,要把多个对象组合起来,就用MIMEMultipart对象,而MIMEBase可以表示任何对象。它们的继承关系如下:

    Message
    +- MIMEBase
       +- MIMEMultipart
       +- MIMENonMultipart
          +- MIMEMessage
          +- MIMEText
          +- MIMEImage
    

      

      发送文本

    #构造
    from email.mime.text import MIMEText
    msg = MIMEText('hello, send by Python...', 'plain', 'utf-8')
    #发送
    from_addr='gao__king@163.com'
    smtp_server='smtp.163.com'
    to_addr='1903843477@qq.com'
    password=input('enter password:')
    #这是因为邮件主题、如何显示发件人、收件人等信息并不是通过SMTP协议发给MTA,而是包含在发给MTA的文本中的,所以,我们必须把FromToSubject添加到MIMEText中
    msg['Subject']='hello world'#编辑邮件主题
    msg['From']=from_addr#发信人
    msg['To']=to_addr#收信人
    server=smtplib.SMTP(smtp_server,25)
    server.set_debuglevel(1)
    server.login(from_addr,password)login()方法用来登录SMTP服务器,为了验证身份,不向所有人提供服务,所以必须提供用户名和口令
    server.sendmail(from_addr,[to_addr],msg.as_string())
    server.quit()
    

      注意到构造MIMEText对象时,第一个参数就是邮件正文,第二个参数是MIME的subtype,传入'plain'表示纯文本,最终的MIME就是'text/plain',最后一定要用utf-8编码保证多语言兼容性。

      我们用set_debuglevel(1)就可以打印出和SMTP服务器交互的所有信息

      sendmail()方法就是发邮件,由于可以一次发给多个人,所以传入一个list,邮件正文是一个stras_string()MIMEText对象变成str

      作者还介绍了通过header对象来编码邮件头

      遇到的问题:

    smtplib.SMTPAuthenticationError: (535, b’Error: authentication failed’):将发送邮箱开启POP3/SMTP服务,这时163会让我们设置客户端授权码,把登录的密码改成邮箱所设置的授权码即可。

    smtplib.SMTPDataError: (554, b’DT:SPM 163 smtp12…):分两种情况 a、发送的邮件内容存在test或测试,删掉即可;b、代码中缺少msg[‘From’]和msg[‘To’],加上即可。

    脚本运行未报错,但是在接收者邮箱内(一般在垃圾站中)未收到邮件,这时需要查看发送邮箱服务器的端口号有没有写上。

      发送HTML

      在构造MIMEText对象时,=第二个参数是MIME的subtype,传入'plain'表示纯文本,‘html’表示HTML

    html=r'''
        <h1>hello</h1>
        <img src='cid:0'>
        '''
    msg_main_html=MIMEText(html,'html','utf-8')
    

      发送附件

      带附件的邮件可以看做包含若干部分的邮件:文本和各个附件本身,所以,可以构造一个MIMEMultipart对象代表邮件本身,然后往里面加上一个MIMEText作为邮件正文,再继续往里面加上表示附件的MIMEBase对象即可:

    # 邮件对象:
    msg = MIMEMultipart()
    msg['From'] = _format_addr('Python爱好者 <%s>' % from_addr)
    msg['To'] = _format_addr('管理员 <%s>' % to_addr)
    msg['Subject'] = Header('来自SMTP的问候……', 'utf-8').encode()
    
    # 邮件正文是MIMEText:
    msg.attach(MIMEText('send with file...', 'plain', 'utf-8'))
    
    # 添加附件就是加上一个MIMEBase,从本地读取一个图片:
    with open('/Users/michael/Downloads/test.png', 'rb') as f:
        # 设置附件的MIME和文件名,这里是png类型:
        mime = MIMEBase('image', 'png', filename='test.png')
        # 加上必要的头信息:
        mime.add_header('Content-Disposition', 'attachment', filename='test.png')
        mime.add_header('Content-ID', '<0>')
        mime.add_header('X-Attachment-Id', '0')
        # 把附件的内容读进来:
        mime.set_payload(f.read())
        # 用Base64编码:
        encoders.encode_base64(mime)
        # 添加到MIMEMultipart:
        msg.attach(mime)
    

     

      发送图片

      如果要把一个图片嵌入到邮件正文中怎么做?直接在HTML邮件中链接图片地址行不行?答案是,大部分邮件服务商都会自动屏蔽带有外链的图片,因为不知道这些链接是否指向恶意网站。

      要把图片嵌入到邮件正文中,我们只需按照发送附件的方式,先把邮件作为附件添加进去,然后,在HTML中通过引用src="cid:0"就可以把附件作为图片嵌入了。如果有多个图片,给它们依次编号,然后引用不同的cid:x即可。

    msg.attach(MIMEText('<html><body><h1>Hello</h1>' +
        '<p><img src="cid:0"></p>' +
        '</body></html>', 'html', 'utf-8'))
    

      

      

      同时支持HTML和Plain格式

      并不是说,只能发送文本和只能发送网页,如果收件人使用的设备太古老,查看不了HTML邮件怎么办?

      办法是在发送HTML的同时再附加一个纯文本,如果收件人无法查看HTML格式的邮件,就可以自动降级查看纯文本邮件。

      利用MIMEMultipart就可以组合一个HTML和Plain,要注意指定subtype是alternative

    text=r'''hello,good'''
    html=r'''
        <h1>hello</h1>
        <img src='cid:0'>
        '''
    msg=MIMEMultipart()
    msg_main=MIMEText(text,'plain','utf-8')
    msg_main_html=MIMEText(html,'html','utf-8')
    msg.attach(msg_main)
    msg.attach(msg_main_html)
    

      

      加密SMTP

      使用标准的25端口连接SMTP服务器时,使用的是明文传输,发送邮件的整个过程可能会被窃听。要更安全地发送邮件,可以加密SMTP会话,实际上就是先创建SSL安全连接,然后再使用SMTP协议发送邮件。

      

    收取邮件

      收取邮件就是编写一个MUA作为客户端,从MDA把邮件获取到用户的手机或者电脑上。

      收取邮件最常用的协议是POP目前的版本是3,俗称pop3

      Python内置了一个实现了pop3协议的模块poplib,可以用来收取邮件

      但直接使用pop协议收取的邮件并不是一个直接阅读的文本,这点和SMTP发送邮件类似,通过SMTP发送的协议也是一个经过编码的文本,所以经过pop协议收取的邮件,还需要通过Python的email模块提供的各种类来解析原始文本,变成可阅读的文本邮件。

      所以,收取邮件分为两步,第一步是通过POP协议把邮件下载到本地,第二部是通过email模块把原始文本解析为邮件对象

     

      下载邮件

    import poplib
    
    # 输入邮件地址, 口令和POP3服务器地址:
    email = input('Email: ')
    password = input('Password: ')
    pop3_server = input('POP3 server: ')
    
    # 连接到POP3服务器:
    server = poplib.POP3(pop3_server)
    # 可以打开或关闭调试信息:
    server.set_debuglevel(1)
    # 可选:打印POP3服务器的欢迎文字:
    print(server.getwelcome().decode('utf-8'))
    
    # 身份认证:
    server.user(email)
    server.pass_(password)
    
    # stat()返回邮件数量和占用空间:
    print('Messages: %s. Size: %s' % server.stat())
    # list()返回所有邮件的编号:
    resp, mails, octets = server.list()
    # 可以查看返回的列表类似[b'1 82923', b'2 2184', ...]
    print(mails)
    
    # 获取最新一封邮件, 注意索引号从1开始:
    index = len(mails)
    resp, lines, octets = server.retr(index)
    
    # lines存储了邮件的原始文本的每一行,
    # 可以获得整个邮件的原始文本:
    msg_content = b'
    '.join(lines).decode('utf-8')
    # 稍后解析出邮件:
    msg = Parser().parsestr(msg_content)
    
    # 可以根据邮件索引号直接从服务器删除邮件:
    # server.dele(index)
    # 关闭连接:
    server.quit()
    

      解析邮件

      还原邮件的过程和构造邮件对象的过程刚好相反,先导入模块

    from email.parser import Parser
    from email.header import decode_header
    from email.utils import parseaddr
    

      先把邮件解析为Message对象

    msg=Parser().parserstr(msg_content)
    

      但是这个Message对象本身可能是一个MIMEMultipart对象,即包含嵌套的其他MIMEBase对象,嵌套可能还不止一层。

      我们要打印出他的层次结构,让人能看的明白

      

    # indent用于缩进显示:
    def print_info(msg, indent=0):
        if indent == 0:
            for header in ['From', 'To', 'Subject']:
                value = msg.get(header, '')
                if value:
                    if header=='Subject':
                        value = decode_str(value)
                    else:
                        hdr, addr = parseaddr(value)
                        name = decode_str(hdr)
                        value = u'%s <%s>' % (name, addr)
                print('%s%s: %s' % ('  ' * indent, header, value))
        if (msg.is_multipart()):
            parts = msg.get_payload()
            for n, part in enumerate(parts):
                print('%spart %s' % ('  ' * indent, n))
                print('%s--------------------' % ('  ' * indent))
                print_info(part, indent + 1)
        else:
            content_type = msg.get_content_type()
            if content_type=='text/plain' or content_type=='text/html':
                content = msg.get_payload(decode=True)
                charset = guess_charset(msg)
                if charset:
                    content = content.decode(charset)
                print('%sText: %s' % ('  ' * indent, content + '...'))
            else:
                print('%sAttachment: %s' % ('  ' * indent, content_type))
    

      邮件中的Subject、from等都是通过编码后的str,所以要把他们decode

    def decode_str(s):
        value, charset = decode_header(s)[0]
        if charset:
            value = value.decode(charset)
        return value
    

      decode_header()返回一个list,因为像CcBcc这样的字段可能包含多个邮件地址,所以解析出来的会有多个元素。上面的代码我们偷了个懒,只取了第一个元素。

      文本邮件的内容也是str,还需要检测编码,否则,非UTF-8编码的邮件都无法正常显示:

    def guess_charset(msg):
        charset = msg.get_charset()
        if charset is None:
            content_type = msg.get('Content-Type', '').lower()
            pos = content_type.find('charset=')
            if pos >= 0:
                charset = content_type[pos + 8:].strip()
        return charset
    

      

  • 相关阅读:
    【从小白到专家】收官!Istio技术实践之九:路由控制与灰度发布
    Kube-OVN 1.2.0发布,携手社区成员打造高性能容器网络
    Kubernetes最佳实践之腾讯云TKE 集群组建
    5大最新云原生镜像构建工具全解析,3个来自Google,你了解几个?
    【从小白到专家】 Istio专题之七:30分钟讲透Istio访问与控制
    后疫情时期传统企业的云原生之路将走向何方?第二期(2019-2020)云原生实践调研报告发布!
    使用Spring Security控制会话
    Spring Security – security none, filters none, access permitAll
    No bean named 'springSecurityFilterChain' is defined
    Unable to locate Spring NamespaceHandler for XML schema namespace
  • 原文地址:https://www.cnblogs.com/Gaoqiking/p/11626053.html
Copyright © 2011-2022 走看看