上一节内容中,我们通过Python进行了电子邮件发送功能的处理
本节内容内容主要讲解接收邮件功能的处理
通过SMTP协议发送邮件,我们通过POP3协议接收邮件
回顾一下邮件发送的过程
电子邮件 -> MUA -> MTA -> ...MTA -> MDA <- MUA <- 电子邮件
我们发送邮件主要实现的是MUA->MTA的过程
使用的模块如下
smtplib
email.header.Header
email.utils.parseaddr/formataddr
email.mime.mutipart.MIMEMultipart
email.mime.base.MMEBase
email.mime.text.MIMEText
本节内容
- POP3协议简介
- 收取邮件
1. POP3协议简介
1.1简介
POP3协议,全名为Post Office Protocol - Vesion 3,邮局协议 版本3
POP3协议是TCP/IP协议族中的一种,由RFC1939定义
协议主要用于支持使用客户端远程管理在服务器上的电子邮件
提供了SSL加密的POP3协议被称为POP3S
POP协议主持离线有限处理,通常情况下邮件发送到服务器上,电子邮件客户端将邮件从邮件服务器获取到个人终PC上,邮件服务器上的邮件会被删除;目前POP3邮件服务器大部分可以获取邮件的同时不删除服务器上的邮件
1.2特性
默认端口:110
默认传输协议:TCP
使用的软件结构:C/S
访问模式:离线访问
1.3 POP3常见命令码
1.4 python中使用POP3
python中提供了poplib模块用于进行POP3协议的支持
核心的处理过程主要是如下两个步骤
- 使用poplib模块接收邮件
- 使用email模块解析邮件
2. POP3读取邮箱信息
常规操作步骤:
- 定义连接pop3服务器的信息
- 连接pop3服务器
- 登录pop3服务器
- 获取邮件服务器中邮件的信息【数量、大小、列表等等】
import poplib
# 服务器连接信息
pop_user = "xxxxxxxxx@qq.com"
pop_pass = "这里请使用您的授权码"
pop_server = "pop.qq.com"
# 连接到pop3服务器
print("开始连接pop3服务器")
server = poplib.POP3_SSL(pop_server)
print("连接服务器成功")
# 设置打印调试信息
server.set_debuglevel(1)
# 设置打印pop3服务欢迎文字
print(server.getwelcome().decode("utf-8"))
# 登录服务器
print("准备登录POP服务器")
server.user(pop_user)
server.pass_(pop_pass)
print("登录身份验证成功,准备获取邮件信息")
# stat()返回邮件数量和占用空间
print("邮件数量:%s, 大小:%s" % server.stat())
print("~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~")
# 返回邮件详细列表信息mails
resp, mails, octets = server.list()
print(resp)
print(mails)
print(octets)
# 退出服务器
server.quit()
上述代码执行完成后,会出现如下结果:
注意:下面出现*cmd*字样的是调试信息,其中出现的类似USER/PASS等都是POP3的命令码,可以参考前面的命令码部分了解一下
开始连接pop3服务器
连接服务器成功
+OK QQMail POP3 Server v1.0 Service Ready(QQMail v2.0)
准备登录POP服务器
cmd 'USER 1007821300@qq.com'
cmd 'PASS kyecgawxkkupbegh'
登录身份验证成功,准备获取邮件信息
cmd 'STAT'
stat [b'+OK', b'105', b'3796095']
邮件数量:105, 大小:3796095
~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
cmd 'LIST'
b'+OK'
[b'1 36817', b'2 27060', b'3 1860', b'4 63794', b'5 73282', b'6 5360', b'7 35188', b'8 19933', b'82 7118',·······b'100 2329', b'101 36325', b'102 28107', b'103 28090', b'104 29170', b'105 28088']
984
cmd 'QUIT'
3. POP3读取最新的一封普通文本邮件
我们使用上一节中的发送邮件的代码发送一份纯文本的或者带了HTML标签的邮件,然后在下面的代码中接收一下这份邮件
# 引入需要的模块
import email, poplib
from email.parser import Parser
from email.utils import parseaddr
from email.header import decode_header
# 服务器连接信息
pop_server = "pop.qq.com"
pop_user = "xxxxxxxx@qq.com"
pop_pass = "此处请使用授权码"
# 连接pop服务器
server = pop.POP3_SSL(pop_server)
# 登录pop服务器,进行身份验证
server.user(pop_user)
server.pass_(pop_pass)
# 获取邮件服务器上的邮件的信息
email_msg = server.stat()
# 获取最新的一份邮件
# 注意:接收的邮件是按照索引进行排序的,这里的索引是1开始的
resp, lines, octets = server.retr(email_msg[0])
# 拼接完整邮件
email_content = b"\r\n".join(lines).decode("UTF-8")
# 解析邮件标题
title = email_content.get("Subject")
if title :
value, charset = decode_header(title)[0]
if charset:
title = value.decode(charset)
# 解析发件人信息
sender = email_content.get("From")
if sender:
value, addr = parseaddr(sender)
name, charset = decode_header(value)
if charset:
name = ame.decode(charset)
sender = u"%s <%s>" % (name, addr)
# 解析收件人信息
receiver = email_content.get("To")
if receiver:
value, addr = parseaddr(receiver)
name, charset = decode_header(value)
if charset:
name = name.decode(charset)
receiver = u"%s <%s>" % (name, addr)
# 解析邮件内容
content = email_content.get_payload(decode=True)
content = content.decode("UTF-8")
# 打印邮件内容
print("邮件标题:%s" % title)
print("发件人:%s" % sender)
print("收件人:%s" % receiver)
print("邮件内容:%s" % content)
# 退出邮件服务器
server.quit()
执行上述代码,运行结果如下:
邮件标题:来自大牧莫邪的问候
发件人: 大牧莫邪 xxxxxxxx@qq.com
收件人:木木 xxxxxxxxx@qq.com
邮件内容:Hello 你好,这是一封自动发送的测试邮件
我们针对上面的代码最一下简单的了解
邮件的标题、发件人、收件人,对应的是邮件内容中的Subject,From,To,这三个数据我们在学习完发送邮件部分之后已经了解到,是通过编码进行处理过的,所以我们要对这样的编码进行解码,解码的过程比较简单,通过如下的代码就可以进行解码的处理:
# 引入解码需要的模块
>from email.header import decode_header
from email.utils import parseaddr
> # 定义一个函数,用于解析邮件内容
>def decode_msg(msg)
# 解析邮件标题、发件人、收件人
> for info in ["Subject", "From", "To"]:
value = msg.get(info)
# 解析邮件标题
if info == "Subject":
# 标题不含特殊格式,直接解码
name, charset = decode_header(value)[0]
value = name.decode(charset)
else:
# 发件人、收件人格式特殊,使用parseaddr解析之后再进行解码
value, addr = parseaddr(msg)
name, charset = decode_header(value)[0]
value = name.decode_header(charset)
>```
> 接下来就是内容的解析了,关于邮件内容的处理,我们从前面的发送邮件就知道,邮件内容主要是普通文本邮件包装的服务类MIMEText或者是带了附件的混合服务类MIMEMultipart,针对邮件的处理,只需要将邮件内容解析为Message对象,在后续处理过程中就可以方便的进行格式化,解析非常简单
引入解析需要的模块
from email.parser import Parser
解析邮件内容
content = Parse().parsestr(email_content)
### 4. POP3读取最新的带附件的邮件
某些情况下,我们的邮件内容是带附件的,是通过MIMEMultipart对象包含的邮件内容和附件,我们通常情况下,需要对MIMEMultipart对象进行遍历,对其中的MIMEText对象表示的邮件内容和MIMEBase对象表示的附件内容进行分别解析。
废话不多说,上干货:
第一步:分清楚什么是邮件标题、发件人、收件人;什么是邮件内容;什么是邮件附件
通过`is_multipart()`函数来区分邮件是否是混合邮件
通过`get_content_type()`函数来区分邮件是否是内容/附件
引入需要的模块
import email, poplib
from email.parser import Parser
from email.utils import parseaddr
from email.header import decode_header
定义解析邮件内容的函数
def decode_mail(msg):
# 解析邮件标题、发件人、收件人信息
for info in ["Subject", "From", "To"]:
value = msg.get(info)
if info == "Subject":# 解析邮件标题
title = decode_info(value)
else:# 解析发件人、收件人信息
name, addr = parseaddr(value)
sender = decode_info(name)
sender = "%s <%s>" % (name, addr)
# 如果邮件是MIMEMultipart混合内容,执行递归处理
if(msg.is_multipart()):
parts = msg.get_payload()
for n, part in enumerate(parts):
print(n, part)
# 递归解析邮件
decode_mail(part)
else:
# 获取邮件编码格式
content_type = msg.get_content_type();
# 判断编码并解码
if content_type == "text/plain" or content_type == "text/html":
content = "这是邮件内容"
else:
content = "这是邮件附件"
decode_header解码操作函数
def decode_info(info):
name, charset = decode_header(info)
if charset:
name = name.decode(charset)
return name
> 上面的代码中,我们定义了函数`decode_mail(msg)`来进行邮件内容的解析处理
主要包含三部分内容
> 1.首先解析邮件标题、发件人、收件人这样的特殊的信息
> 2.根据`is_multipart()`函数区分是否混合邮件
> 3.根据`msg.get_content_type()`函数进行邮件内容和附件的区分处理
---
未完待续,敬请期待~~
![大牧莫邪.png](http://upload-images.jianshu.io/upload_images/5988045-cc086acf5134c20e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)