尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

反讽环境安装

反讽环境安装
📅 发布时间:2026/6/19 19:06:18

云平台

租一台新的机子,4b模型跑在5090显卡上,可以选西北的机子,如果不想重新租也可以直接重置之前的机子
ps:不要选重庆的机子,因为之后好像端口映射不了。

这里选镜像的时候选如下就行

虚拟环境激活

开机后用ssh工具连接(只要能来连接ssh就可以,推荐xterminal)

连接到云服务器

在root目录下有个autodl-tmp,把所有重要数据都存在这个目录,避免关机重启被清除

启动后按照如下命令配置uv虚拟环境

pip install uv #先安装uv第三方库 cd /root/autodl-tmp #进入目录 mkdir Qwen #创建名叫Qwen文件夹 uv venv --python 3.12 #创建uv虚拟环境,并且指定python版本 source .venv/bin/activate #激活虚拟环境

激活后最前面有个qwen标识,代表已经进入虚拟环境

模型下载

进入虚拟环境后,先安装modelscope库,用来拉取模型

uv pip install modelscope #在uv环境中安装modelscope
modelscope download --model Qwen/Qwen3.5-4B #使用modelscope库下载模型文件

这里下载可能需要十分钟左右

因为下载路径未指定,所以应该是modelscope的默认路径:/root/.cache/modelscope/hub/models/Qwen/Qwen3.5-4B,下载成功后会在这个路径下存放所有的模型文件,需要把所有模型文件拷贝到/root/autodl-tmp/Qwen目录下,防止丢失

vllm推理器下载

下图是魔搭社区中关于vllm的官方下载方式,但是我试过了,不行,因为它默认下载最新版,和云服务器显卡以及cuda驱动之间可能存在冲突,需要下载指定版本0.18.1

uv pip istall vllm==0.18.1 --index-url https://mirrors.aliyun.com/pypi/simple/ #使用aliyun加速

这边下载也要十分钟左右

启动模型

VLLM_USE_MODELSCOPE=true vllm serve /root/autodl-tmp/Qwen/Qwen35-4B --port 6006 --tensor-parallel-size 1 --max-model-len 262144 --language-model-only #将服务开放在6006端口,/root/autodl-tmp/Qwen/Qwen35-4B这个路径就是存放模型的路径,之后调用代码里面需要和这里保持一致

第一次启动可能慢点,大概需要七八分钟,之后启动会快很多

出现如上界面代表启动成功,此时已经可以调用api服务了

autodl云平台会自动把内网的6006服务映射到公网上,如下图所示,调用代码中只需要将此链接复制就可以批量调用模型服务

关闭模型服务,只需要ctrl+C中断服务即可

脚本

因为是在云服务器上,所以不用的时候需要关机,所以下次启动的时候又需要重新进入虚拟环境,激活,然后再启动模型,比较繁琐

可以写一个bash脚本来一键启动,复制如下命令到start.sh

chmod +x start.sh(赋予脚本可执行的权限)

#!/bin/bash cd /root/autodl-tmp/Qwen source .venv/bin/activate VLLM_USE_MODELSCOPE=true vllm serve /root/autodl-tmp/CoASD \ #这里启动的模型是 --port 6006\ --tensor-parallel-size 1 \ --max-model-len 262144 \ --reasoning-parser qwen3 \ --language-model-only

以后每次启动模型./start.sh即可启动

微调

这部分写期刊论文应该用不到,期刊论文就聚焦多智能体,把多智能体模型讲得高大上一点就行,不需要微调

但之后做其他项目可以尝试微调,所以这边还是写了一下。

安装步骤:

微调采用llamafactory平台,可以再建一个虚拟环境,避免各种库的版本冲突

cd /root/autodl-tmp mkdir llama uv venv source .venv/bin/activate

之后安装都在虚拟环境中实现即可

安装教程参照:

LLaMA-Factory安装教程(详细版)_llamafactory安装-CSDN博客

相关新闻

  • Jetson Orin NX 开发指南(8): EGO-Swarm 与 VINS-Fusion 的深度集成与实战调优
  • 2026石家庄爱彼名表回收店铺TOP3榜单|实地测评对比,高端橡树变现首选禹竞名奢汇 - 名奢变现站
  • 2026无锡黄金回收攻略:本地人常去5家好店,顶价结算更透明 - 奢侈品回收评测

最新新闻

  • Elsevier Tracker:告别投稿焦虑,3分钟实现学术审稿状态实时可视化
  • MC9S08JM60 ADC误差分析与IIC协议精解:提升嵌入式测量与通信稳定性
  • 学习总结9
  • 2026海口名表回收行情解析!哪些款式保值抗跌?避坑指南速看 - 奢品小当家
  • Moteus:当开源精神遇见高性能无刷伺服控制
  • 2026年6月卧式潜水泵厂家推荐 - 多才菠萝

日新闻

  • 5分钟掌握Python进化算法:Geatpy高性能优化工具完全指南
  • Microchip 24AA044 EEPROM选型与应用全指南:从参数解析到实战编程
  • 华为的鸿蒙到底有多牛?为什么称作遥遥领先?

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号