1. epoll 边沿触发和水平触发
对于epoll有两种触发模式:水平触发LT和边缘触发ET,其中边缘触发必须需要设置所监听的socket为non_blocking。
边缘触发,顾名思义,不到边缘情况,是死都不会触发的。
EPOLLOUT事件:
EPOLLOUT事件在连接时建立时首先触发触发一次,表示可写,其他时候的触发条件为:
1.某次write,写满了发送缓冲区,返回错误码为EAGAIN。
2.对端读取了一些数据,又重新可写了,此时会触发EPOLLOUT。
简单地说:EPOLLOUT事件只有socket从unwritable变为writable时,才会触发一次。对于EPOLLOUT事件,必须要将该文件描述符缓冲区一直写满,让 errno 返回 EAGAIN 为止,或者发送完所有数据为止。
EPOLLIN事件:
EPOLLIN事件则只有当对端有数据写入时才会触发,所以触发一次后需要不断读取所有数据直到读完EAGAIN为止,否则剩下的数据只有在下次对端有写入时才能一起取出来了。
设想这样一个场景:接收端接收完整的数据后会向对端发送应答报文,对端才会继续向接收端发送数据,从而触发下一次的EPOLLIN,而这时没有读完socket缓冲区中的所有数据,导致接收端无法向对端发送应答报文,而对端没有收到应答报文,也就不会再发送数据触发下一次的EPOLLIN,而没有下一次的EPOLLIN事件,接收端也就永远不知道此socket缓冲区中还有未读出的数据。(一个完美的死循环)
简单的说:EPOLLIN事件只有对端新数据写入时,才会触发一次。对于EPOLLIN事件,必须要将该文件描述符一直读到空,让 errno 返回 EAGAIN 为止。
总结:现在明白为什么说epoll要求异步socket了吧?
如果你的文件描述符如果不是非阻塞的.
- 对于读:由于需要一直读直到把数据读完,所以大家在编写程序的时候一般会用一个循环一直读取socket,那这个循环势必会在最后一次阻塞,即没有数据可读的情况下,阻塞式socket会在数据读完之后一直阻塞下去,而非阻塞式的socket则返回<0,并让errno 返回 EAGAIN 。
- 对于写,当使用阻塞式socket时,socket的unwritable/writable状态变化没有任何意义!!因为此时无论发送多大的数据write总是会阻塞直到所有数据都发送出去。(也就是说,边缘触发的epoll如果不和非阻塞的socket搭配,使用起来会产生问题)
2. 使用epoll是否需要将socket设置为nonblocking?
取决于你使用的触发方式, 如果你使用水平触发(Level-triggered) 那么此时的epoll相当于高级的select, 你的论述是对的, 是不需要一定将socket设置为非阻塞的; 然而, 当你使用边缘触发(Edge-triggered) 那么此时从业务的完整性考虑, 是建议将socket设置为nonbocking模式, 并且在读写触发EAGAIN之后再进行epoll_wait.
水平触发和边缘触发, 类似于数字电路当中的电位水平, 从低电平到高电平的瞬间触发动作叫边缘触发, 而处于高电平触发动作叫做水平触发。想象这样一个场景:有一个pipe描述符 fd 按顺序发生了如下的动作:
- 读端的 fd 被注册到一个epoll的描述符当中, 监听读信号, 此时pipe中没有消息, 无论是边缘触发还是水平触发此刻都不会被触发
- fd 的写端被写入2kb数据
- 读端调用epoll_wait, 返回 fd, 此刻pipe中有2kb数据, 并且从不可读变为可读, 所以边缘触发和水平触发都会返回
- 读端读取1kb的数据
- 读端继续调用epoll_wait在第五步的时候, 边缘触发和水平触发的差异就显现出来了, 此时pipe中仍然有数据,所以水平触发的epoll会立刻返回, 但是边缘触发的epoll_wait 并不会返回, 因为此时pipe一直可读, 并没有从不可读变为可读状态所以这里就会出现一个问题, 如果写端在等读端处理完数据返回, 而读端却在等写端的2kb数据中的另外1kb, 双方就会产生死锁。 因此, 在使用边缘触发的时候, 建议将描述符设置为nonblocking, 并且在read/write产生EAGAIN的错误之后再使用epoll_wait