尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

Ollama的安装及AI人工智能本地大模型的部署

Ollama的安装及AI人工智能本地大模型的部署
📅 发布时间:2026/6/20 2:19:31

View Post

Ollama的安装及AI人工智能本地大模型的部署

手动部署最简单的方式就是使用Ollama,这是一个帮助你部署和运行大模型的工具。官网如下:
首先,我们需要下载一个Ollama的客户端,在官网提供了各种不同版本的Ollama,大家可以根据自己的需要下载。
官网下载地址:https://ollama.com/

image

下载后双击即可安装。
注意:Ollama默认安装目录是C盘的用户目录,如果想安装到其他盘中,就不能直接双击安装了。需要通过命令行安装。
具体操作如下:
在OllamaSetup.exe所在目录打开cmd命令行,然后命令如下:
OllamaSetup.exe /DIR=你要安装的目录位置
安装完成后,还需要配置一个环境变量,更改Ollama下载和部署模型的位置。环境变量如下:
OLLAMA_MODELS=你想要保存模型的目录
环境变量配置方式相信学过Java的都知道,配置完成如图:

image

 打开控制台,输入Ollama help 列举相应的操作命令即安装成功。

  ollama serve      # Start ollamaollama create     # Create a model from a Modelfileollama show       # Show information for a modelollama run        # Run a modelollama stop       # Stop a running modelollama pull       # Pull a model from a registryollama push       # Push a model to a registryollama list       # List modelsollama ps         # List running modelsollama cp         # Copy a modelollama rm         # Remove a modelollama help       # Help about any command
注意事项:
  • 首次运行命令需要下载模型,根据模型大小不同下载时长在5分钟~1小时不等,请耐心等待下载完成。
  • ollama控制台是一个封装好的AI对话产品,与ChatGPT类似,具备会话记忆功能。
选择自己合适的模型后,ollama会给出运行模型的命令:
 

image

 

Ollama在本地部署时,会自动提供模型对应的Http接口,访问地址是:http://localhost:11434/api/chat

image

 接口说明

  • 请求方式:通常是POST,因为要传递JSON风格的参数
  • 请求URL:与平台有关
    • DeepSeek官方平台:https://api.deepseek.com/chat/completions
    • 阿里云百炼平台:https://dashscope.aliyuncs.com/compatible-mode/v1
    • 本地ollama部署的模型:http://localhost:11434
  • 请求头:开放平台都需要提供API_KEY来校验权限,本地ollama则不需要
    • Content-Type: application/json,请求参数的格式,必须是application/json,稍后解释
    • Authorization: Bearer <DeepSeek API Key>,上一节创建的API_KEY
  • 请求参数:JSON格式:
{"model": "deepseek-chat","messages": [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Hello!"},{"role": "assistant", "content": "你好,我叫令狐冲"}],"stream": false
}
  • model:模型名称,DeepSeek支持deepseek-reasoner和deepseek-chat两者模型
  • messages:发送给大模型的消息,[]是数组的意思,里面可以有多条消息。消息结构:
    • content:是消息的内容
    • role:消息的角色,有system、user、assisant三种角色
      • system:是给大模型设定一个角色,比如你让她扮演你的奶奶,让她哄你睡觉
      • user:就是用户提问的问题
      • assistant:是大模型的回答
  • stream:true,代表响应结果流式返回;false,代表响应结果一次性返回,但需要等待。
 下面就自己动手试下吧~~
 


相关新闻

  • 深入解析:flask 框架的ORM 学习及应用
  • 2025年口碑好的衬氟呼吸阀定制厂家
  • 2025年靠谱的精密配电柜厂家推荐及采购参考

最新新闻

  • 3种智能编排策略重构AI工作流创作效率
  • PPO算法在大语言模型RLHF训练中的工程实践与调参指南
  • 武汉南华光电职业技术学校2026年最新招生简章 - 武汉中职最新信息发布
  • 2026年电大中专/成人中专招生简章(可考消防员和造价工程师) - 武汉中职最新信息发布
  • 从TTL到485:深入解析差分信号转换电路的设计要点与实战应用
  • 杭州GEO优化公司2026年6月Top5:选型疑问与避坑全解 - GEO优化

日新闻

  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • Terrakube自定义工作流:如何集成OPA、Infracost等工具扩展IaC能力
  • grunt-concurrent快速入门:5分钟学会并行运行Grunt任务

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号