【C/C++】select、poll、epoll 实战对比:从 fd_set 到就绪事件列表
1. 为什么需要 IO 多路复用
上一篇多线程 TCP 服务端的模型是:每来一个连接,就创建一个线程阻塞在recv()上。这个模型好理解,但连接数一多,线程数、内存、上下文切换都会成为瓶颈。
IO 多路复用解决的是另一个问题:让一个线程同时管理多个 fd。线程不再盯着某一个连接阻塞,而是把一批 fd 交给内核,等内核告诉我们“哪些 fd 有事件”。
本项目分别实现了三个版本:
tcp_server_select.c:用fd_set管理连接。tcp_server_poll.c:用struct pollfd数组管理连接。tcp_server_epoll.c:用epoll_ctl注册事件,用epoll_wait获取就绪事件。
2. select:每一轮都要准备 fd_set
select的核心 API 是:
intactivity=select(maxfd+1,&tempfds,NULL,NULL,NULL);项目中的关键写法是先保存一份总集合readfds,每次调用前复制到临时集合:
fd_set readfds;FD_ZERO(&readfds);FD_SET(serverfd,&readfds);intmaxfd=serverfd;while(1){fd_set tempfds=readfds;intactivity=select(maxfd+1,&tempfds,NULL,NULL,NULL);if(activity<0){perror("select");continue;}为什么要复制?因为select()返回后会修改传进去的 fd 集合,只保留就绪 fd。如果下一轮继续拿同一个集合调用,就会丢失没有就绪的连接。
监听 socket 就绪表示有新连接:
if(FD_ISSET(serverfd,&tempfds)){structsockaddr_inclient_addr;socklen_tclient_len=sizeof(client_addr);intclientfd=accept(serverfd,(structsockaddr*)&client_addr,&client_len);FD_SET(clientfd,&readfds);if(clientfd>maxfd)maxfd=clientfd;}普通客户端 fd 就绪表示可读:
for(inti=serverfd+1;i<=maxfd;i++){if(FD_ISSET(i,&tempfds)){charbuffer[1024];ssize_tn=recv(i,buffer,sizeof(buffer)-1,0);if(n<=0){close(i);FD_CLR(i,&readfds);}else{buffer[n]='\0';send(i,buffer,n,0);}}}select的缺点也在这段代码里体现出来了:应用层需要从小到大扫描 fd,fd 很多时会浪费大量遍历成本。
3. poll:用数组管理 fd,事件更清楚
poll把 fd、关注事件、返回事件放在一个结构体里:
structpollfdfds[1024];fds[0].fd=sockfd;fds[0].events=POLLIN;intnfds=1;调用方式比select更直接:
intret=poll(fds,nfds,-1);if(ret<0){perror("poll");continue;}新连接到来时,把客户端 fd 追加到数组:
if(fds[0].revents&POLLIN){intclientfd=accept(sockfd,(structsockaddr*)&client_addr,&client_len);fds[nfds].fd=clientfd;fds[nfds].events=POLLIN;nfds++;}客户端断开时,项目里用了一个很实用的技巧:用最后一个元素覆盖当前元素,然后nfds--。
if(n<=0){close(fds[i].fd);fds[i]=fds[nfds-1];nfds--;i--;}这样删除数组中间元素时不需要整体搬移。i--是为了重新检查被覆盖过来的新元素。
poll相比select的进步:
- 不依赖
FD_SETSIZE默认大小。 events和revents分开,关注事件和实际事件更清晰。- 不需要每轮重新构造
fd_set。
但它仍然需要把整个数组传给内核,也仍然要扫描数组。
4. epoll:注册一次,等待就绪事件
epoll的使用流程更像“先注册,再等待”:
intepollfd=epoll_create1(0);structepoll_eventev,events[1024];ev.events=EPOLLIN;ev.data.fd=sockfd;epoll_ctl(epollfd,EPOLL_CTL_ADD,sockfd,&ev);事件循环里直接等待就绪事件:
intnfds=epoll_wait(epollfd,events,1024,-1);if(nfds<0){perror("epoll_wait");continue;}for(inti=0;i<nfds;i++){if(events[i].data.fd==sockfd){intclientfd=accept(sockfd,(structsockaddr*)&client_addr,&client_len);ev.events=EPOLLIN;ev.data.fd=clientfd;epoll_ctl(epollfd,EPOLL_CTL_ADD,clientfd,&ev);}else{ssize_tn=recv(events[i].data.fd,buffer,sizeof(buffer)-1,0);if(n<=0){close(events[i].data.fd);epoll_ctl(epollfd,EPOLL_CTL_DEL,events[i].data.fd,NULL);}}}epoll_wait()返回的是就绪事件数组,不需要像select/poll那样扫描完整连接表。这也是它适合大量连接的关键原因。
5. 三者对比表
| 模型 | fd 管理方式 | 每轮是否重建集合 | 是否扫描全部 fd | 适合场景 |
|---|---|---|---|---|
| select | fd_set位图 | 需要 | 需要 | 入门理解、小规模 fd |
| poll | pollfd数组 | 不需要重建,但数组要传入内核 | 需要 | 中小规模连接 |
| epoll | 内核维护兴趣集合 | 不需要 | 不需要扫描全部,只返回就绪项 | 大量长连接 |
6. 编译运行
gcc tcp_server_select.c-oselectgcc tcp_server_poll.c-opoll gcc tcp_server_epoll.c-oepoll分别启动:
./select ./poll ./epoll用nc测试:
nc127.0.0.18080hello需要注意的是,本项目的 select 和 poll 版本会 echo 回客户端;epoll 基础版本主要演示读事件注册和删除,收到数据后打印到服务端终端。如果希望它也 echo,在recv()成功分支中补一行send(events[i].data.fd, buffer, n, 0);即可。
7. 小结
select -> poll -> epoll的演进,本质是 fd 管理方式的演进:
- select:应用每轮准备集合,内核返回后还要应用扫描。
- poll:数组结构更清楚,但仍要传递和扫描整张表。
- epoll:内核保存兴趣集合,应用只处理就绪事件。
理解这三者之后,再看 Reactor 模式就不会突兀。Reactor 其实就是在epoll事件循环上继续抽象:把不同 fd、不同事件分发给对应的回调函数。
学习链接: https://github.com/0voice