一、前言服务器卡顿、接口超时、服务雪崩本质都是CPU负载过高、内存溢出、磁盘爆满。本篇整理运维每日巡检全套命令一行命令看懂整机资源状态区分负载、CPU使用率、内存占用三者区别彻底排查服务器性能瓶颈。二、系统整体负载查看uptime1. 命令uptime2. 输出解读10:30:00 up 10 days, 2 users, load average: 0.15, 0.20, 0.18依次为1分钟平均负载、5分钟平均负载、15分钟平均负载负载判定标准CPU核心数最佳负载阈值4核CPU负载低于4为健康超过8为严重过载负载≠CPU使用率负载是等待运行的进程总数负载高不一定CPU占用高三、内存资源查看free 重点1. 推荐命令人性化单位free -h2. 字段详解total总内存used已使用内存程序缓存缓冲区free空闲裸内存available真正可用内存看这个数值即可3. 内存清理缓存应急运维# 清理页缓存生产应急使用 echo 1 /proc/sys/vm/drop_caches四、磁盘空间查看df / du1. df查看整机磁盘分区使用率df -h重点关注Use%使用率超过80%必须及时清理日志防止磁盘爆满服务宕机。2. du查看具体目录/文件占用大小# 查看当前目录总大小 du -sh # 查看目录下各个文件大小定位大日志文件 du -sh /*五、CPU核心与硬件信息# 查看CPU核心数、型号 lscpu # 动态监控CPU与进程占用 top六、一键巡检命令运维日常直接复制echo 系统负载 uptime echo 内存信息 free -h echo 磁盘信息 df -h七、性能告警标准生产阈值CPU负载长期超过CPU核心数 → 告警内存可用低于10% → 告警磁盘使用率高于85% → 立即清理