当前位置: 首页 > news >正文

使用指定的显卡运行模型

使用指定的显卡运行模型

指定使用第0块显卡启动qianwen3-8b模型,运行如下命令:

CUDA_VISIBLE_DEVICES=1 /usr/local/python310/bin/python3 /usr/local/python310/bin/vllm serve /data/llm/qianwen3/8b --max-model-len 16384 --port 81 --api-key 1234 --dtype=half --disable-log-requests --disable-log-stats

指定使用第1和第3块显卡启动qianwen3-8b模型,运行如下命令:

CUDA_VISIBLE_DEVICES=1,3 /usr/local/python310/bin/python3 /usr/local/python310/bin/vllm serve /data/llm/qianwen3/8b --max-model-len 16384 --port 82 --api-key 92322 --dtype=half --disable-log-requests --disable-log-stats

通过脚本方式启动,脚本内容如下:

#use gpu-1
export CUDA_VISIBLE_DEVICES=1
/usr/local/python310/bin/vllm serve /data/llm/baai/bgelargezh/15b  --trust-remote-code  --port 83  > /data/log/vllm_baai-beglargezh.log 2>&1 &

 

http://www.rkmt.cn/news/52744.html

相关文章:

  • 从“单点替代”到“体系化替代”:国产DevOps厂商在信创生态中的“黏合剂”角色
  • 2025年钢板防护罩厂家权威推荐榜单:机床防护罩/风琴防护罩/盔甲防护罩源头厂家精选
  • 2025年新疆租车公司权威推荐榜单:新疆租皮卡车/新疆自驾游租车/新疆越野车租车服务企业精选
  • 2025 最新净化工程厂家推荐排行榜:电子厂 / 药厂 / 手术室 / 车间净化工程优质服务商权威甄选
  • 2025年铜芯电缆厂家权威推荐榜单:控制电缆/特种电缆/铝合金电缆源头厂家精选
  • 四、管道符
  • 2025年11月geo服务商排行榜:十大优质企业综合实力与长期发展指南
  • 24、Linux服务运行级别
  • 22、磁盘分区、挂载
  • 17、cd 切换目录 ,pwd 查询目录路径
  • CIO修炼之道读书笔记- CIO的沟通能力
  • 2025年靠谱的硅橡胶发热电缆厂家选购指南与推荐
  • 19、ps 查询进程
  • 十一、while语句
  • 二十、系统日志管理
  • 如何测试低概率BUG,例如万分之一的概率问题?
  • linux .o 文件
  • 2025年评价高的电伴热带用户口碑最好的厂家榜
  • 万维易网在线调试天气
  • 在前端中调用天气预报接口,并在页面中显示
  • linux .forward
  • linux .epub
  • midwayjs 组件配置静态资源
  • 2025年靠谱的夏令营训练基地附近基地查询
  • 2025年高中学习机推荐:5款提分学习工具,助力孩子学习!
  • 2025年比较好的机器人编程机构附近机构推荐
  • 从「跨模态思维链」到「物理 AI 数据闭环」:下一代多模态技术和落地丨多模态技术专场@RTE2025 回顾
  • 2025年靠谱的远程医疗查房系统品牌精选榜
  • linux .bash profile
  • 2025年热门的连锁餐饮品牌设计综合实力榜