当前位置: 首页 > news >正文

如何在本地部署大模型-ollama_(保姆级教程)

一、部署方式选择部署方式上手难度核心特点适用场景Ollama⭐命令极简自动适配环境自带 API 接口新手日常本地调用、快速测试LM Studio⭐图形化操作无需敲代码兼容 OpenAI 接口不想使用命令行、纯可视化使用Text Generation WebUI⭐⭐⭐功能齐全支持模型微调、多种量化格式深度调试模型、个性化参数配置vLLM⭐⭐⭐⭐推理速度快高并发性能强搭建对外服务、生产环境部署大家可以按需自我选择我的推荐是本地自己玩使用ollama在企业使用最好用vLLM二、ollama下载windows电脑为例如果官网能下载就用官网不能就镜像地址懂得都懂官网地址https://ollama.com/download镜像地址https://cnb.cool/hex/ollama/-/releases/latest/download/OllamaSetup.exe注意后续下载模型一般都好几个G可以在setting中设置模型下载地址三、免费开源大模型选择模型名称推荐版本中文友好商用权限Ollama 下载命令最低显存推荐显存最低内存推荐内存硬件适配选型通义千问 QwenQwen2:7b/14b★★★★★免费可商用ollama run qwen2:7bollama run qwen2:14b6G10G8-16G16G16G32G32G64G16G 内存选 7b32G 及以上内存选 14b智谱 ChatGLMchatglm3:6b★★★★★免费可商用ollama run chatglm3:6b5G6-8G16G32G常规家用内存均可流畅运行Llama3llama3:8b★★★☆☆个人免费商用受限ollama run llama3:8b6G8-16G16G32G16G 标准内存适配日常使用DeepSeekdeepseek:7b★★★★☆个人免费商用受限ollama run deepseek:7b6G8-16G16G32G代码推理场景16G 内存够用Mixtralmixtral:8x7b★★★☆☆免费可商用ollama run mixtral10G16G32G64G大内存机型专属长文本处理优选Gemmagemma2:9b★★★☆☆个人免费商用受限ollama run gemma2:9b8G12-16G16G32G主流内存配置均可稳定运行Phi-3phi3:mini★★★☆☆免费可商用ollama run phi3:mini3G4-6G8G16G低配小内存笔记本首选我是16G内存下载的是Qwen2:7b直接在powershell上运行ollama run qwen2:7b四、使用选中模型直接对话即可就可以使用了地址验证http://localhost:11434/五、项目集成(Spring AI框架为例)pom依赖dependenciesdependencygroupIdorg.springframework.boot/groupIdartifactIdspring-boot-starter-web/artifactId/dependency!-- Spring AI Ollama 依赖 --dependencygroupIdorg.springframework.ai/groupIdartifactIdspring-ai-starter-model-ollama/artifactIdversion1.0.0/version/dependency/dependenciesyaml配置spring:application:name:spring-ai-demoai:ollama:base-url:http://localhost:11434chat:model:qwen2:7b测试运行packagecom.example.springaidemo.controller;importorg.springframework.ai.chat.client.ChatClient;importorg.springframework.web.bind.annotation.GetMapping;importorg.springframework.web.bind.annotation.RestController;RestControllerpublicclassAiController{privatefinalChatClientchatClient;// 自动注入 OllamapublicAiController(ChatClient.BuilderchatClientBuilder){this.chatClientchatClientBuilder.build();}// 测试接口GetMapping(/ai)publicStringask(Stringquestion){returnchatClient.prompt().user(question).call().content();}}六、云端部署TODO
http://www.rkmt.cn/news/1375010.html

相关文章:

  • 2026年质量好的硅胶电线并线/硅胶电线/东莞硅胶电线并线/编织硅胶电线厂家选择推荐 - 品牌宣传支持者
  • 2026年质量好的电力工程施工/电力工程建设服务型公司推荐 - 行业平台推荐
  • 2026年高效AI论文写作软件全攻略(含新手入门指南)
  • LSTM在四旋翼无人机轨迹优化中的实践与性能分析
  • 2026年靠谱的高浓度废气处理/沸石转轮RTO废气处理/环保废气处理/低浓度废气处理批量采购厂家推荐 - 品牌宣传支持者
  • 祖玛游戏核心原理:状态机驱动的链式消除系统
  • 2026年上海AI Agent智能体开发公司全景解析:从技术底座到产业落地的能力坐标
  • 总结模式的智能化升级
  • 天赐范式第53天:当伙伴没有上下文的时候——说我皮肤好~算子包装
  • CANN graph-autofusion:算子自动融合框架的设计思路
  • 避坑!云南数字人直播选择难?昆明速算企业星播AI数字人来解忧
  • 专业不对口反而成了优势:我是如何用AI思维打动面试官的
  • CANN asnumpy:在 NPU 上跑 NumPy 工作负载
  • Cowrie SSH蜜罐实战:10分钟部署高保真攻击诱捕系统
  • 用机器学习与SHAP解析教育公平:巴西学生成绩预测模型实战
  • 金仓数据库 KES:DISTINCT 语句性能优化实践与内核实现
  • CSDN 的表格这么难用
  • Playwright MCP配置决策树:企业级浏览器自动化选型指南
  • Gemini免费额度用得少却总超限?这4类隐性消耗场景(含Embedding缓存、多轮会话状态、跨区域路由)正在悄悄吃掉你的quota
  • 从0到1:如何打造一块高精度的工业级隔离数据采集卡?
  • Maven POM(项目对象模型)
  • 2026年4月行业内好用的实验室污水处理设备订做厂家推荐,次氯酸钠发生器,实验室污水处理设备制造商口碑推荐 - 品牌推荐师
  • gmapping算法源码实现分析(一)
  • 2026年口碑好的贵州家政培训哪家好 - 行业平台推荐
  • 模型流体:基于连续特征空间的蒸馏过程夹带剂智能筛选方法
  • Python 类型注解:从入门到日常实用
  • 【数据集】中国已签署双边投资协定(BIT)数据(2000-2025年)
  • 个人免费AI编程软件推荐:2026最新8款工具,独立开发者必看
  • 避开Hyper-V大坑!用物理机搭建Windows驱动HLK测试环境的保姆级指南
  • CentOS 7.9下Lustre 2.12.9集群部署避坑指南:从yum源配置到客户端挂载全流程