当前位置: 首页 > news >正文

Fara-微软电脑助手模型本地实践

微软推出的 Fara 系列模型,是一个专为电脑操作设计的 AI 智能体。它不同于只能聊天的传统 AI,Fara 能像人一样看屏幕、使用鼠标和键盘,直接在电脑上帮你完成各种网页任务。

Fara-7B 仅有 70亿(7B)参数,设计极其精巧,能直接在个人设备上本地运行,无需依赖云端服务器。这带来了两大优势:极低延迟(处理速度快)和 隐私保护(所有数据留在本地)

虽然体积小巧,但性能毫不妥协。在网页任务基准测试 WebVoyager 中,Fara-7B 取得了 73.5% 的成功率,超越了作为智能体配置时的 GPT-4o(65.1%)。效率也同样出色,平均仅用 16步 完成任务,优于同类模型需要的 41步

模型下载

首先我们需要先下载模型。国内我是去modelscope找和下载。地址如下:

Fara-7B

不过由于本人的电脑显卡内存不够,只有8G。最后选择的是8位的量化版本。相关链接如下:

microsoft_Fara-7B-GGUF

microsoft_Fara-7B-Q8_0.gguf

mmproj-microsoft_Fara-7B-bf16.gguf

CUDA环境安装

本人用的是windows操作系统,需要用到WSL2。安装方式网上挺多的,可自行搜索。

WSL安装好后,在安装个ubantu镜像,找个相对新点的。接着需要安装cuda环境。

查看显卡支持的CUDA版本。输入下述命令:

nvidia-smi

接下来进入ubantu,安装PyTorch。由于PyTorch没有13.1。我选了最解决的13.0。

pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu130#执行下述指令验证python -c "import torchprint('='*20, 'PyTorch 安装验证', '='*20)# 1. 检查导入与版本print(f'[1/4]PyTorch 版本:{torch.__version__}')# 2. 检查 CUDA 支持cuda_available = torch.cuda.is_available()print(f'[2/4]CUDA 是否可用:{cuda_available}')print('='*57)"

接下来安装nvcc

wget https://developer.download.nvidia.com/compute/cuda/13.0.1/local_installers/cuda-repo-ubuntu2404-13-0-local_13.0.1-580.82.07-1_amd64.debsudo dpkg -i cuda-repo-ubuntu2404-13-0-local_13.0.1-580.82.07-1_amd64.debsudo cp /var/cuda-repo-ubuntu2404-13-0-local/cuda-*-keyring.gpg /usr/share/keyrings/sudo apt updatesudo apt install cuda-toolkit-13-0 -y# 永久添加 PATHecho 'export PATH=/usr/local/cuda-13.0/bin:$PATH' >> ~/.bashrcecho 'export LD_LIBRARY_PATH=/usr/local/cuda-13.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrcsource ~/.bashrc# 验证nvcc --version

模型引擎安装

由于我用的模型是GGUF格式的,vllm不行,得用llama.cpp

./build/bin/llama-server命令可以启动一个openAI接口格式的Web服务。

-m参数用于指定使用的文本类大模型,-mmproj 参数用于指定多模态大模型。

git clone https://github.com/ggerganov/llama.cppcdllama.cppmkdir-p build&&cdbuildcmake..-DGGML_CUDA=ONcmake --build.--config Release -j$(nproc)cd~/llama.cpp./build/bin/llama-server\--host0.0.0.0\--port5000\-m{你的模型目录}/microsoft_Fara-7B-Q8_0.gguf\--mmproj{你的模型目录}/mmproj-microsoft_Fara-7B-bf16.gguf\--n-gpu-layers30\--ctx-size8192

跑起来后8G直接干满。

客户端安装

使用的客户端是官方推荐的magentic-lite

安装命令如下:

#安装uv(如果没有的话)curl -LsSf https://astral.sh/uv/install.sh | sh# Create a project directorymkdir magentic-lite && cd magentic-lite# Create and activate a virtual environmentuv venv --python=3.12 --seed .venvsource .venv/bin/activate# Install the latest 0.2.x release from PyPIuv pip install "magentic_ui>=0.2.0"

安装后,根据提示配置下大模型接口的web服务就好。默认是http://localhost:5000/v1。

效果图如下,还是有点慢:

http://www.rkmt.cn/news/1470262.html

相关文章:

  • Mailwarm 2.0 邮件送达率提升效果实测
  • 重庆名酒回收服务实测评测:重庆礼盒酒回收/重庆茅台酒回收/重庆郎酒回收/重庆金条回收/重庆附近名酒回收商家/重庆高端白酒回收/选择指南 - 优质品牌商家
  • 2026年不锈钢管专业供应商TOP5技术实力盘点:304不锈钢装饰管、304薄壁不锈钢管、316L不锈钢凹槽管选择指南 - 优质品牌商家
  • 2026年铭博通风机靠谱吗? - mypinpai
  • 2026 EB-5移民中介哪家好?行业服务机构深度解析 - 品牌排行榜
  • 香薰工厂定制技术全解析:香薰推荐、香薰礼、香薰蜡烛、一站式香薰工厂、中国香薰工厂、义乌蜡烛、义乌香薰工厂、儿童香氛选择指南 - 优质品牌商家
  • 双向硅电压开关二极管,交流防护赛道核心器件!
  • EB Garamond 12:如何为你的设计项目注入古典优雅气质
  • LIS2DW12在智能手环中的低功耗配置实战:如何将功耗降到1µA以下?
  • 2026江苏高职单招长期班优质机构推荐榜
  • SM内最多容纳多少线程?
  • 驾驭未来:一文读懂智能驾驶中的深度学习模型
  • 2026新手开店靠谱加盟公司TOP5:开店攻略/开店选址/开店项目/新手开店/精品开店/莱啦开店加盟/集合店开店/选择指南 - 优质品牌商家
  • 微信小程序计算机毕设之微信小程序的博物馆文创商城系统的设计与实现基于springboot+微信小程序的博物馆文创系统的设计与实现(完整前后端代码+说明文档+LW,调试定制等)
  • Chinese-Medical-DIALOGUE-Data:构建中文医疗AI对话系统的终极实践指南
  • 费县实操为主的家电清洗培训学校 行业入门标准与培训流程科普
  • Gemma 4 12B本地部署避坑:OMLX后缀、4bit/8bit选择与gemma4_unified报错修复
  • 【课程设计/毕业设计】基于springboot+微信小程序的博物馆文创系统的设计与实现文创商品展示与售卖、文化背景讲解【附源码、数据库、万字文档】
  • 河南隔音房静音舱 / 隔音室_办公居家静音空间
  • ZYXWZ 远程连接工具实现远程 SSH 白名单安全访问
  • Windows可执行文件资源编辑终极指南:rcedit命令行的完整解决方案
  • 用Multisim 14.0仿真高频谐振功放:从欠压到过压,手把手教你调出三种工作状态
  • 告别C盘爆满!保姆级教程:在D盘为Quartus Prime 20.1精简版和Modelsim安个新家
  • 国内正火炉实测评测:渗碳炉/烧结炉/网带炉/退火炉/钎焊炉/光亮炉/台车炉/回火炉/淬火炉/正火炉/选择指南 - 优质品牌商家
  • 深度解析文件分析利器:Detect-It-Easy专业逆向工具完全指南
  • 用LangChain重构期货研报分析流:1天搭建可自动抓取、归因、生成交易建议的AI工作台
  • 《明月别枝》小说|下载|txt
  • Cesium for Unity 完整指南:5个核心技巧构建地理空间3D应用
  • 3个专业技巧让你掌握MegSpot:跨平台视觉分析终极指南
  • 2026乐山门窗厂技术实测:宜宾哪家门窗厂好/宜宾哪家门窗厂性价比高/宜宾哪家门窗好看/宜宾哪里有门窗厂/宜宾定制门窗/选择指南 - 优质品牌商家