当前位置: 首页 > news >正文

百度文心大模型4.5全系列源代码开放 配套API服务同步上线

百度文心大模型4.5全系列源代码开放 配套API服务同步上线

【免费下载链接】ERNIE-4.5-21B-A3B-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-PT

2025年6月30日,百度正式对外宣布文心大模型4.5系列完成开源工作,并同步推出API服务接口。此次开源行动涵盖10款不同规格的模型产品,参数规模从470亿混合专家(MoE)架构延伸至3亿轻量级稠密模型,全面覆盖文本生成、多模态交互等主流AI应用场景。开发者可通过飞桨星河社区、HuggingFace平台及百度智能云千帆大模型平台获取完整的模型权重与代码资源,所有开源资产均采用Apache 2.0协议授权,为商业应用与学术研究提供灵活支持。

百度文心大模型4.5开源家族在技术架构上实现重大突破,创新性地提出多模态异构模型设计。该架构专门优化大语言模型向多模态能力扩展的持续预训练流程,在确保文本任务性能不降反升的前提下,通过多模态混合专家预训练机制、高效训练推理引擎以及模态专属后训练策略等三大技术支柱,显著增强模型对跨模态信息的理解能力。全系列模型均基于飞桨深度学习框架开发,在大语言模型预训练阶段实现47%的FLOPs利用率(MFU),达到行业领先的计算效率水平。

如上图所示,该架构图清晰呈现了文心大模型4.5系列的产品矩阵,通过A47B、A3B和0.3B三个技术分支构建起完整的模型生态。这一模块化设计充分体现了百度在大模型架构创新上的系统性思考,为开发者提供了从超大规模到轻量化部署的全场景技术选择。

第三方评测数据显示,文心大模型4.5系列在12项国际权威基准测试中刷新性能纪录,尤其在指令理解准确率、世界知识覆盖率、视觉语义解析和跨模态推理速度等关键指标上表现突出。文本模型方面,其在MMLU、HumanEval等主流评测中全面超越DeepSeek-V3和Qwen3等竞品;多模态领域更实现突破性进展,依托精细化视觉感知能力与海量视觉常识库,成功构建"思考-执行"一体化认知框架,在VQAv2、Flickr30K等多模态评测中性能超越闭源的OpenAI o1模型。轻量化产品矩阵中,210亿参数的文心4.5-21B-A3B-Base文本模型与同量级Qwen3性能持平,而280亿参数的文心4.5-VL-28B-A3B多模态模型不仅在同参数开源模型中位列第一,甚至可与320亿参数的Qwen2.5-VL展开性能竞争。

作为国内AI技术研发的先行者,百度构建了从算力基础设施、深度学习框架、大模型算法到行业应用的全栈技术体系。此次开源行动中,基于飞桨平台多年积累的开源生态优势,同步发布文心大模型开发套件ERNIEKit和高效部署工具FastDeploy,形成覆盖模型训练、微调优化、推理部署的全流程技术支持。特别值得关注的是,该系列模型通过飞桨框架实现多芯片架构兼容,可无缝适配CPU、GPU及各类国产加速芯片,大幅降低企业级应用的部署门槛。这种"框架+模型"的双层开源模式,标志着我国大模型技术在生态开放度与产业实用性方面进入新阶段,将加速AI技术在智能制造、智慧城市、医疗健康等关键领域的深度渗透。

随着文心大模型4.5系列的开源,百度正在重塑AI产业的创新格局。Apache 2.0协议下的商业友好特性,结合飞桨生态丰富的工具链支持,预计将吸引超过10万家企业加入模型应用开发。这种开放式创新模式不仅有利于构建良性竞争的技术生态,更能通过开发者社区的集体智慧推动模型持续进化。未来,随着模型轻量化技术的成熟与垂直领域知识库的完善,文心大模型有望在边缘计算设备、嵌入式系统等终端场景实现规模化应用,最终形成"通用智能+行业专精"的多层次AI服务体系,为数字经济发展注入新动能。

【免费下载链接】ERNIE-4.5-21B-A3B-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-PT

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.rkmt.cn/news/95337.html

相关文章:

  • 阿里重磅开源轻量级视觉大模型:Qwen3-VL-4B/8B本地化部署全攻略,小参数撬动大能力
  • 100秒出片:Step-Video-T2V-Turbo如何让视频创作效率提升300倍?
  • 5、高增长企业商业模式的价值构成与多样性分析
  • NeurIPS 2025重磅突破:Tar-7B实现视觉理解与生成的统一范式
  • 1、商业模式:创新、数字化转型与数据分析的融合洞察
  • 智谱AI推出GLM-4.5V-FP8多模态模型,视觉语言理解能力刷新行业标杆
  • 百度ERNIE-4.5轻量化模型突破推理效率瓶颈:210亿参数实现128K上下文智能处理
  • 字节跳动Seed-OSS-36B震撼开源:512K超长上下文引领大模型效率革命
  • 【核心复现】模拟风电不确定性——拉丁超立方抽样生成及缩减场景研究(Matlab代码)
  • 开源里程碑:WebRL-Llama-3.1-8B让网页智能体效能提升8倍,开启自动化新纪元
  • 英伟达Nemotron Nano v2横空出世:90亿参数模型改写小模型性能天花板,20万亿token预训练数据首次开源
  • 百度网盘直链解析技术工具:5步实现高效下载的完整方案
  • 10、为 Oracle Database 10g RAC 安装 Linux 系统全攻略
  • Qwen3-30B-A3B-Instruct-2507-FP8:新一代大语言模型性能突破与技术解析
  • 基于微信小程序的云上考场毕设源码(源码+lw+部署文档+讲解等)
  • 基于微信小程序的商品展示计算机毕设(源码+lw+部署文档+讲解等)
  • 基于微信小程序的居住证申报系统计算机毕业设计(源码+lw+部署文档+讲解等)
  • dify 1.11.1 版本发布:重要安全更新、性能优化与新特性解析
  • 基于微信小程序的4S店客户管理系统毕业设计源码(源码+lw+部署文档+讲解等)
  • CogAgent:革新GUI交互的视觉语言模型突破
  • 大模型应用:TTA文本驱动音频:MusicGen大模型参数调优+音频情绪可视化.23
  • 英伟达发布AceReason-Nemotron-7B:强化学习驱动的数学与代码推理新突破
  • 突破140亿参数!NextStep-1开创文本生成图像新范式,连续令牌技术登顶SOTA
  • Log4j2 + AI 异常分析:当生产环境报错时,让 AI 自动告诉你 Bug 在哪一行(LogAppender 实战)
  • 10、Linux 通信程序使用与传真收发指南
  • 部署成本锐减四分之三:ERNIE 4.5量化技术如何引爆企业级AI应用革命
  • 21、数字取证图像的格式转换与加密保护
  • ViGEmBus虚拟手柄驱动:从零开始的游戏控制器终极配置指南
  • 边缘智能新纪元:LFM2-1.2B模型重构AI部署范式
  • 人工智能领域突破性进展:全新模型架构引领行业变革