当前位置: 首页 > news >正文

不同场景 Linux 性能调优参数配置模板

以下模板基于云底座节点、AI 算力节点、容器混部集群三大核心场景定制,直接复制到 /etc/sysctl.conf 后执行 sysctl -p 即可永久生效。

一、 云底座核心节点(高并发、低时延)

适用场景:云平台控制节点、API 网关、虚拟化宿主机

conf

<?XML:NAMESPACE PREFIX = "[default] http://www.w3.org/2000/svg" NS = "http://www.w3.org/2000/svg" />

# 内核调度 - 减少进程迁移,提升稳定性
kernel.sched_migration_cost_ns = 1000000
kernel.sched_autogroup_enabled = 1
kernel.sched_rt_runtime_us = 900000# 内存管理 - 优先使用物理内存,关闭透明大页(碎片化访问场景)
vm.swappiness = 10
vm.zone_reclaim_mode = 0
kernel.transparent_hugepage.enabled = never# 网络优化 - 提升高并发连接处理能力
net.core.somaxconn = 65535
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_fin_timeout = 30
net.core.netdev_max_backlog = 32768# IO优化 - 适配分布式存储,SSD盘配置
vm.dirty_ratio = 15
vm.dirty_background_ratio = 5

二、 AI 算力节点(GPU/NPU 大模型推理 / 训练)

适用场景:GPU 服务器、大模型推理节点、异构算力集群

conf

# 内核调度 - 绑定进程CPU核心,提升算力利用率
kernel.sched_migration_cost_ns = 2000000
kernel.sched_autogroup_enabled = 0# 内存管理 - 开启透明大页,优化大模型内存访问
vm.swappiness = 5
vm.zone_reclaim_mode = 1
kernel.transparent_hugepage.enabled = always
kernel.transparent_hugepage.defrag = madvise# 网络优化 - 适配RDMA高速网络,提升数据传输效率
net.core.somaxconn = 32768
net.ipv4.tcp_syncookies = 1
net.core.rmem_max = 134217728
net.core.wmem_max = 134217728# IO优化 - 提升数据加载速度,适配大模型 checkpoint 读写
vm.dirty_ratio = 20
vm.dirty_background_ratio = 10

三、 容器混部集群节点(在线 + 离线业务混跑)

适用场景:K8s 计算节点、在线服务 + 离线任务混部集群

conf

# 内核调度 - 支持CPU突发,保障在线业务SLA
kernel.sched_migration_cost_ns = 800000
kernel.sched_autogroup_enabled = 1
kernel.sched_cfs_bandwidth_slice_us = 5000# 内存管理 - 适度使用swap,平衡资源利用率
vm.swappiness = 20
vm.zone_reclaim_mode = 0
kernel.transparent_hugepage.enabled = always# 网络优化 - 适配容器多网络栈,提升Pod通信效率
net.core.somaxconn = 32768
net.ipv4.tcp_tw_reuse = 1
net.netfilter.nf_conntrack_max = 1048576# IO优化 - 避免离线任务IO抢占在线业务资源
vm.dirty_ratio = 10
vm.dirty_background_ratio = 5
配置注意事项
  1. 执行前备份原 /etc/sysctl.conf 文件,避免配置冲突;
  2. 不同硬件(如机械硬盘 / SSD、单 NUMA / 多 NUMA)需微调参数;
  3. 配置后观察 24 小时系统负载、业务时延,根据实际情况调整。
http://www.rkmt.cn/news/132185.html

相关文章:

  • Scikit-image 实战指南:10 个让 CV 模型更稳健的预处理技巧
  • 常用 Linux 性能调优参数速查表
  • AgentScope深入分析-LLMMCP
  • (100分)- 测试用例执行计划(Java JS Python C)
  • Redis高级特性与生产环境部署
  • [20251218]测试sql语句子光标的执行性能(21c).txt
  • NPM2100 支持的电池类型
  • 数组去重(JS)
  • 大专市场营销专业可考取的实用证书
  • NPM2100 超低功耗模式
  • (100分)- ABR 车路协同场景(Java JS Python)
  • PromQL 核心语法解析
  • Boost电路的右半平面零点
  • NPM2100 LDO
  • 智慧城市与智慧校园之安防暴力检测 校园打架斗殴检测 街边暴力躁动识别 危险物品识别 智能安防 安防领域智能化 数据集第10319期 (1)
  • AI Agent的概念形成:模拟LLM的抽象思维过程
  • 云底座 amp; 性能优化 90 天技术提升落地清单
  • 高中语法练习解析100篇-001 - new
  • 智慧铁路之受电弓接触点识别 铁路输电线路鸟巢识别 铁路异物入侵巡检识别 铁路风筝识别 列车绝缘子检测 轨道交通场景下异物识别 户外线缆及附属部件的智能监测 10325期
  • 链动2+1模式AI智能名片S2B2C商城小程序中电商直播的应用机制与价值创新研究
  • 【全球AI伦理治理】
  • 云底座管理与操作系统性能质量保证技术升华
  • 三折叠手机推荐哪个品牌?三星Galaxy Z TriFold用创新重新定义旗舰体验
  • 三折叠手机有什么使用场景和优势?三星Galaxy Z TriFold给出答案
  • springboot购物推荐网站的设计与实现(11541)
  • TEST_40
  • ret2syscall及mprotect的利用姿势
  • Thinkphp和Laravel水果购物商城vue
  • 当一部手机定价近两万:三星三折叠价格和功能如何匹配?
  • JVM性能调优案例-OOM案例