当前位置：首页 > news >正文

百度文心大模型4.5全系列源代码开放配套API服务同步上线

news 2026/5/30 20:25:49

百度文心大模型4.5全系列源代码开放配套API服务同步上线

【免费下载链接】ERNIE-4.5-21B-A3B-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-PT

2025年6月30日，百度正式对外宣布文心大模型4.5系列完成开源工作，并同步推出API服务接口。此次开源行动涵盖10款不同规格的模型产品，参数规模从470亿混合专家（MoE）架构延伸至3亿轻量级稠密模型，全面覆盖文本生成、多模态交互等主流AI应用场景。开发者可通过飞桨星河社区、HuggingFace平台及百度智能云千帆大模型平台获取完整的模型权重与代码资源，所有开源资产均采用Apache 2.0协议授权，为商业应用与学术研究提供灵活支持。

百度文心大模型4.5开源家族在技术架构上实现重大突破，创新性地提出多模态异构模型设计。该架构专门优化大语言模型向多模态能力扩展的持续预训练流程，在确保文本任务性能不降反升的前提下，通过多模态混合专家预训练机制、高效训练推理引擎以及模态专属后训练策略等三大技术支柱，显著增强模型对跨模态信息的理解能力。全系列模型均基于飞桨深度学习框架开发，在大语言模型预训练阶段实现47%的FLOPs利用率（MFU），达到行业领先的计算效率水平。

如上图所示，该架构图清晰呈现了文心大模型4.5系列的产品矩阵，通过A47B、A3B和0.3B三个技术分支构建起完整的模型生态。这一模块化设计充分体现了百度在大模型架构创新上的系统性思考，为开发者提供了从超大规模到轻量化部署的全场景技术选择。

第三方评测数据显示，文心大模型4.5系列在12项国际权威基准测试中刷新性能纪录，尤其在指令理解准确率、世界知识覆盖率、视觉语义解析和跨模态推理速度等关键指标上表现突出。文本模型方面，其在MMLU、HumanEval等主流评测中全面超越DeepSeek-V3和Qwen3等竞品；多模态领域更实现突破性进展，依托精细化视觉感知能力与海量视觉常识库，成功构建"思考-执行"一体化认知框架，在VQAv2、Flickr30K等多模态评测中性能超越闭源的OpenAI o1模型。轻量化产品矩阵中，210亿参数的文心4.5-21B-A3B-Base文本模型与同量级Qwen3性能持平，而280亿参数的文心4.5-VL-28B-A3B多模态模型不仅在同参数开源模型中位列第一，甚至可与320亿参数的Qwen2.5-VL展开性能竞争。

作为国内AI技术研发的先行者，百度构建了从算力基础设施、深度学习框架、大模型算法到行业应用的全栈技术体系。此次开源行动中，基于飞桨平台多年积累的开源生态优势，同步发布文心大模型开发套件ERNIEKit和高效部署工具FastDeploy，形成覆盖模型训练、微调优化、推理部署的全流程技术支持。特别值得关注的是，该系列模型通过飞桨框架实现多芯片架构兼容，可无缝适配CPU、GPU及各类国产加速芯片，大幅降低企业级应用的部署门槛。这种"框架+模型"的双层开源模式，标志着我国大模型技术在生态开放度与产业实用性方面进入新阶段，将加速AI技术在智能制造、智慧城市、医疗健康等关键领域的深度渗透。

随着文心大模型4.5系列的开源，百度正在重塑AI产业的创新格局。Apache 2.0协议下的商业友好特性，结合飞桨生态丰富的工具链支持，预计将吸引超过10万家企业加入模型应用开发。这种开放式创新模式不仅有利于构建良性竞争的技术生态，更能通过开发者社区的集体智慧推动模型持续进化。未来，随着模型轻量化技术的成熟与垂直领域知识库的完善，文心大模型有望在边缘计算设备、嵌入式系统等终端场景实现规模化应用，最终形成"通用智能+行业专精"的多层次AI服务体系，为数字经济发展注入新动能。

【免费下载链接】ERNIE-4.5-21B-A3B-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-PT

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.rkmt.cn/news/95337.html