尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

AMD Instinct MI50 通过llama.cpp 在 ROCm7.0.2上运行

AMD Instinct MI50 通过llama.cpp 在 ROCm7.0.2上运行
📅 发布时间:2026/6/21 21:06:16

关于网上传言MI50 ROCm7.0.2的性能提升了,这边做了下测试。

ROCm7.0.2安装方法:

ROCm 7.0 Install for Mi50 32GB | Ubuntu 24.04 LTS : r/LocalLLaMA

这边系统使用的ubuntu22.04

ROCm安装

wget https://repo.radeon.com/amdgpu-install/7.0.2/ubuntu/jammy/amdgpu-install_7.0.2.70002-1_all.deb
sudo apt install ./amdgpu-install_7.0.2.70002-1_all.deb
sudo apt update
sudo apt install python3-setuptools python3-wheel
sudo usermod -a -G render,video $LOGNAME # Add the current user to the render and video groups
sudo apt install rocm

Drivers安装

wget https://repo.radeon.com/amdgpu-install/7.0.2/ubuntu/jammy/amdgpu-install_7.0.2.70002-1_all.deb
sudo apt install ./amdgpu-install_7.0.2.70002-1_all.deb
sudo apt update
sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"
sudo apt install amdgpu-dkms

Guide:
1. Run the commands from the ROCm quick install: https://rocm.docs.amd.com/projects/install...
2. Before rebooting to complete the install, download the 6.4 rocblas from the AUR: https://archlinux.org/packages/extra/x86_6...
3. Extract it
4. Copy all files that contain the filename "gfx906" in rocblas-6.4.3-3-x86_64.pkg/opt/rocm/lib/rocblas/library to /opt/rocm/lib/rocblas/library
5. Reboot, enrolling MOK if needed
6. Check by running sudo update-alternatives --display rocm

Now you can build llama.cpp with ROCm + flash attention (adjust j value according to number of threads):

HIPCXX="$(hipconfig -l)/clang" HIP_PATH="$(hipconfig -R)" \
cmake -S . -B build -DGGML_HIP=ON -DAMDGPU_TARGETS=gfx906 -DGGML_HIP_ROCWMMA_FATTN=ON -DCMAKE_BUILD_TYPE=Release \
&& cmake --build build --config Release -- -j 16

Note: Vulkan also works, but in my findings prompt processing seems to be better on ROCm.

 

测试使用qwen3 vl 32b:

./llama-server -m ~/.lmstudio/models/huihui-ai/Huihui-Qwen3-VL-32B-Thinking-abliterated/ggml-model-Q4_K_M.gguf --port 8080

运行后进入浏览器测试

image

测试速度相对LM中Vulkan而言,感觉提升也不大,可能是对部分模型优化会更好,后面试试其他模型。

 

相关新闻

  • 如何成为高级的安卓逆向工程师 glm4.6
  • PyTorch实战(9)——从零开始实现Transformer - 教程
  • 常用设计模式:职责链模式

最新新闻

  • MC1322x USB Dongle硬件设计、射频布局与嵌入式开发实战指南
  • DRSeg基准与PixDLM模型:面向无人机的高效实时语义分割技术解析
  • CVE-2025-34300漏洞复现:服务器端模板注入原理、利用与防御
  • 改改鸭:让旧房改造,简单到一天搞定 - 松梢月冷
  • 2026广州黄金回收正规门店,上门收金无扣费,实时大盘价结算 - 奢侈品回收评测
  • 2026副主任药师考前突击:带分章节高频错题集的题库详细测评! - 医考机构品牌测评专家

日新闻

  • 2026速览惠州叛逆青少年学校前十大排名名单出炉 - 武汉中职最新信息发布
  • 2026上饶白蚁消杀哪家好?15年本土2大权威白蚁防治公司推荐(金盾虫控/青蚁卫士) - 我叫一
  • 天龙八部单机版终极数据管理工具:5个技巧快速掌握游戏数据编辑

周新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号