【C/C++】select、poll、epoll 实战对比：从 fd_set 到就绪事件列表-尧图网站建设

📅 发布时间：2026/6/26 5:19:27

【C/C++】select、poll、epoll 实战对比：从 fd_set 到就绪事件列表

1. 为什么需要 IO 多路复用

上一篇多线程 TCP 服务端的模型是：每来一个连接，就创建一个线程阻塞在recv()上。这个模型好理解，但连接数一多，线程数、内存、上下文切换都会成为瓶颈。

IO 多路复用解决的是另一个问题：让一个线程同时管理多个 fd。线程不再盯着某一个连接阻塞，而是把一批 fd 交给内核，等内核告诉我们“哪些 fd 有事件”。

本项目分别实现了三个版本：

tcp_server_select.c：用fd_set管理连接。
tcp_server_poll.c：用struct pollfd数组管理连接。
tcp_server_epoll.c：用epoll_ctl注册事件，用epoll_wait获取就绪事件。

2. select：每一轮都要准备 fd_set

select的核心 API 是：

intactivity=select(maxfd+1,&tempfds,NULL,NULL,NULL);

项目中的关键写法是先保存一份总集合readfds，每次调用前复制到临时集合：

fd_set readfds;FD_ZERO(&readfds);FD_SET(serverfd,&readfds);intmaxfd=serverfd;while(1){fd_set tempfds=readfds;intactivity=select(maxfd+1,&tempfds,NULL,NULL,NULL);if(activity<0){perror("select");continue;}

为什么要复制？因为select()返回后会修改传进去的 fd 集合，只保留就绪 fd。如果下一轮继续拿同一个集合调用，就会丢失没有就绪的连接。

监听 socket 就绪表示有新连接：

if(FD_ISSET(serverfd,&tempfds)){structsockaddr_inclient_addr;socklen_tclient_len=sizeof(client_addr);intclientfd=accept(serverfd,(structsockaddr*)&client_addr,&client_len);FD_SET(clientfd,&readfds);if(clientfd>maxfd)maxfd=clientfd;}

普通客户端 fd 就绪表示可读：

for(inti=serverfd+1;i<=maxfd;i++){if(FD_ISSET(i,&tempfds)){charbuffer[1024];ssize_tn=recv(i,buffer,sizeof(buffer)-1,0);if(n<=0){close(i);FD_CLR(i,&readfds);}else{buffer[n]='\0';send(i,buffer,n,0);}}}

select的缺点也在这段代码里体现出来了：应用层需要从小到大扫描 fd，fd 很多时会浪费大量遍历成本。

3. poll：用数组管理 fd，事件更清楚

poll把 fd、关注事件、返回事件放在一个结构体里：

structpollfdfds[1024];fds[0].fd=sockfd;fds[0].events=POLLIN;intnfds=1;

调用方式比select更直接：

intret=poll(fds,nfds,-1);if(ret<0){perror("poll");continue;}

新连接到来时，把客户端 fd 追加到数组：

if(fds[0].revents&POLLIN){intclientfd=accept(sockfd,(structsockaddr*)&client_addr,&client_len);fds[nfds].fd=clientfd;fds[nfds].events=POLLIN;nfds++;}

客户端断开时，项目里用了一个很实用的技巧：用最后一个元素覆盖当前元素，然后nfds--。

if(n<=0){close(fds[i].fd);fds[i]=fds[nfds-1];nfds--;i--;}

这样删除数组中间元素时不需要整体搬移。i--是为了重新检查被覆盖过来的新元素。

poll相比select的进步：

不依赖FD_SETSIZE默认大小。
events和revents分开，关注事件和实际事件更清晰。
不需要每轮重新构造fd_set。

但它仍然需要把整个数组传给内核，也仍然要扫描数组。

4. epoll：注册一次，等待就绪事件

epoll的使用流程更像“先注册，再等待”：

intepollfd=epoll_create1(0);structepoll_eventev,events[1024];ev.events=EPOLLIN;ev.data.fd=sockfd;epoll_ctl(epollfd,EPOLL_CTL_ADD,sockfd,&ev);

事件循环里直接等待就绪事件：

intnfds=epoll_wait(epollfd,events,1024,-1);if(nfds<0){perror("epoll_wait");continue;}for(inti=0;i<nfds;i++){if(events[i].data.fd==sockfd){intclientfd=accept(sockfd,(structsockaddr*)&client_addr,&client_len);ev.events=EPOLLIN;ev.data.fd=clientfd;epoll_ctl(epollfd,EPOLL_CTL_ADD,clientfd,&ev);}else{ssize_tn=recv(events[i].data.fd,buffer,sizeof(buffer)-1,0);if(n<=0){close(events[i].data.fd);epoll_ctl(epollfd,EPOLL_CTL_DEL,events[i].data.fd,NULL);}}}

epoll_wait()返回的是就绪事件数组，不需要像select/poll那样扫描完整连接表。这也是它适合大量连接的关键原因。

5. 三者对比表

模型	fd 管理方式	每轮是否重建集合	是否扫描全部 fd	适合场景
select	`fd_set`位图	需要	需要	入门理解、小规模 fd
poll	`pollfd`数组	不需要重建，但数组要传入内核	需要	中小规模连接
epoll	内核维护兴趣集合	不需要	不需要扫描全部，只返回就绪项	大量长连接

6. 编译运行

gcc tcp_server_select.c-oselectgcc tcp_server_poll.c-opoll gcc tcp_server_epoll.c-oepoll

分别启动：

./select ./poll ./epoll

用nc测试：

nc127.0.0.18080hello

需要注意的是，本项目的 select 和 poll 版本会 echo 回客户端；epoll 基础版本主要演示读事件注册和删除，收到数据后打印到服务端终端。如果希望它也 echo，在recv()成功分支中补一行send(events[i].data.fd, buffer, n, 0);即可。

7. 小结

select -> poll -> epoll的演进，本质是 fd 管理方式的演进：

select：应用每轮准备集合，内核返回后还要应用扫描。
poll：数组结构更清楚，但仍要传递和扫描整张表。
epoll：内核保存兴趣集合，应用只处理就绪事件。

理解这三者之后，再看 Reactor 模式就不会突兀。Reactor 其实就是在epoll事件循环上继续抽象：把不同 fd、不同事件分发给对应的回调函数。

学习链接: https://github.com/0voice