尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

离线轻量大模型,Ollama部署到docker方法

离线轻量大模型,Ollama部署到docker方法
📅 发布时间:2026/6/19 0:12:17

来自豆包

将Ollama部署到Docker的步骤如下:

一、安装Docker环境

  1. 启用系统功能(Windows系统):
    • 打开“控制面板” → “程序与功能” → “启用或关闭Windows功能”。
    • 勾选 Hyper-V、虚拟机平台、Linux子系统(WSL)。
    • 重启电脑使配置生效。
  2. 安装Docker Desktop:
    • 访问 Docker官网,下载并安装Docker Desktop。
    • 启动Docker Desktop,确保左下角状态显示为绿色“Running”。
  3. 验证安装:
    • 打开终端(PowerShell或CMD),输入命令:
      bash
      docker --version
    • 若显示版本号(如Docker version 28.0.0),则安装成功。

二、拉取Ollama Docker镜像

  1. 下载镜像:
    • 在终端执行命令,从Docker Hub拉取Ollama官方镜像:
      bash
      docker pull ollama/ollama
    • 若需指定版本(如旧版),可在镜像名后添加标签(如ollama/ollama:v0.1.0)。
  2. 验证镜像:
    • 输入命令查看已下载的镜像:
      bash
      docker images
    • 确认列表中包含ollama/ollama。

三、运行Ollama容器

  1. 基础运行命令(仅CPU模式):
    • 启动容器并映射端口(默认11434),挂载数据卷以持久化存储模型:
      bash
      docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
      • -d:后台运行容器。
      • -v ollama:/root/.ollama:将宿主机的ollama命名卷挂载到容器内,避免模型数据丢失。
      • -p 11434:11434:将容器端口映射到宿主机,通过http://localhost:11434访问服务。
      • --name ollama:指定容器名称。
  2. GPU加速模式:
    • NVIDIA GPU:需安装NVIDIA Container Toolkit,运行命令:
      bash
      docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
      • --gpus=all:允许容器访问宿主机所有NVIDIA GPU。
    • AMD GPU:需使用支持ROCm的Ollama镜像,运行命令:
      bash
      docker run -d --device /dev/kfd --device /dev/dri -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm
      • --device /dev/kfd --device /dev/dri:映射AMD GPU所需设备文件。

四、验证Ollama服务

  1. 检查容器状态:
    • 输入命令查看容器是否运行:
      bash
      docker ps
    • 确认列表中包含ollama容器,且状态为Up。
  2. 访问服务:
    • 打开浏览器,访问http://localhost:11434。
    • 若显示“Ollama is running”,则部署成功。

五、管理模型

  1. 拉取模型:
    • 进入容器交互模式:
      bash
      docker exec -it ollama bash
    • 在容器内拉取模型(如llama3):
      bash
      ollama pull llama3
    • 或直接在宿主机执行:
      bash
      docker exec -it ollama ollama pull llama3
  2. 运行模型:
    • 在容器内运行模型:
      bash
      ollama run llama3
    • 或通过API调用(需配置外部工具):
      python
      import requests
      response = requests.post("http://localhost:11434/api/generate", json={"model": "llama3", "prompt": "Hello"})
      print(response.json())

六、高级配置(可选)

  1. 自定义模型:
    • 通过Modelfile定义模型参数(如量化、提示词),示例:
      dockerfile
      FROM llama3
      PARAMETER temperature 0.8
      SYSTEM "你是一个中文助手,回答需简洁专业。"
    • 创建自定义模型:
      bash
      ollama create my_model -f Modelfile
  2. 公网访问:
    • 使用内网穿透工具(如cpolar)映射端口:
      bash
      cpolar http 11434
    • 生成公网地址后,通过浏览器访问。

常见问题解决

  • GPU支持失败:
    • 确认已安装驱动及CUDA/ROCm工具包。
    • 检查命令是否包含--gpus=all或--device参数。
  • 端口冲突:
    • 修改OLLAMA_PORT环境变量或调整Docker映射端口。
  • 模型下载失败:
    • 检查网络代理或更换镜像源。
    • 确保容器内有足够存储空间。
每天多努力一点,你将会变得更好。

相关新闻

  • 深入解析:华为Pura 80芯片细节曝光,预示着华为多款新品即将震撼登场!
  • 应用拓扑讲义整理 Chapter 6. 单纯复形(Simplicial Complexes)
  • AQS(ReentrantLock)源码浅析

最新新闻

  • 终极ESP-Drone开源飞控教程:从零构建你的第一架智能无人机
  • 学充电桩维修有前途吗 - 湖南阳光技术
  • MC68VZ328 BGA焊接可靠性:为何官方推荐HASL而非ENIG表面处理?
  • 免费光学模拟器终极指南:在浏览器中探索光的魔法世界!
  • 如何用南京信息工程大学LaTeX模板高效完成毕业论文排版
  • 2026年6月固定式升降货梯厂家推荐指南 - 多才菠萝

日新闻

  • 5分钟掌握Python进化算法:Geatpy高性能优化工具完全指南
  • Microchip 24AA044 EEPROM选型与应用全指南:从参数解析到实战编程
  • 华为的鸿蒙到底有多牛?为什么称作遥遥领先?

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号