效率飙升10倍!Claude 5双模型发布
近期,Anthropic 正式发布了全新的Claude 5 系列模型,包括面向大众和企业用户的Claude Fable 5,以及侧重特殊安全与科研需求的Claude Mythos 5。
前特斯拉 AI 负责人 Andrej Karpathy 在体验后第一时间表示:"这是一个非常令人兴奋的版本,它配得上'大版本升级'的跃迁式进步。"
那么,这一代被誉为"最强前沿模型"的 Claude 5 究竟带来了哪些颠覆性的体验?它又是如何在安全与性能之间找到微妙平衡的?
全能型"效率怪兽"
作为面向公开市场能力最强的模型,Claude Fable 5(Fable意为"寓言/故事")在几乎所有的主流 AI 基准测试中都处于领先水平。
在实际业务应用中,它展现出了惊人的生产力转化价值:
•代码工程的"时间压缩术":
在针对一个拥有5000万行代码的 Ruby 代码库进行迁移时,Fable 5 仅用1天时间就完成了整个代码库的迁移工作。而如果依靠人工,这通常需要一个专业团队耗费2个多月才能搞定。
•长文本的"持久专注力":
相比前代模型,Fable 5 更加节省 Token。在长周期运行的任务中,它可以处理数百万 Token 而不失去焦点,并能通过"自身笔记"不断自我修正、改进输出。任务越长、越复杂,Fable 5 的优势就越明显。
•视觉与多模态的新高度:
Fable 5 已经成为视觉任务上的新 SOTA 模型。它不仅能从详尽的科学图表中提取精确数值,甚至能仅凭一张截图,就还原出 Web 应用的完整源代码。在游玩经典游戏《宝可梦:火红》时,它仅需极简的纯视觉辅助机制便成功通关。
首创"安全降级"机制
随着大模型能力直逼人类专家水平,安全问题再次被推上风口浪尖。Anthropic 此次采取了一种极为聪明的"动态安全平衡术"。
在 Fable 5 中,系统内置了新型分类器。当用户查询涉及网络安全、生物化学等敏感领域的请求,或者系统检测到有人试图对模型进行"蒸馏"(用其输出数据训练其他大模型)时,系统会自动将模型降级为Opus 4.8进行响应。
根据官方数据,约 95% 的日常对话不会触发这种降级。这种动态切换既保证了日常使用的高效,又拉起了一条坚固的安全红线——"你不能用 Fable 5 去开发新的大模型",这也是 Anthropic 为自己挖掘技术护城河的独特方式。
科研领域的"hypothesis 制造机"
同步推出的Claude Mythos 5则呈现出截然不同的侧重点。该模型目前主要通过"Project Glasswing"项目,面向经过审核的合作伙伴及特定科研机构开放。
Mythos 5 与 Fable 5 拥有相同的模型底座,但去掉了部分安全限制,更加专注于前沿科学研究:
•药物研发提效 10 倍:在蛋白质设计、基因组学等复杂研究中,Mythos 5 帮助内部专家将某些关键环节的效率提升了约 10 倍。
•科学假说被实验证实:在盲测对比中,科学家们有80%的情况下更倾向于 Mythos 5 提出的分子生物学假说。更令人振奋的是,它提出的一个关于大肠杆菌蛋白质新机制的假说,已在独立实验室的实际研究中得到了证实。
价格与订阅:限时免费窗口开启!
在商业定价方面,两款模型保持了统一标准:
•输入:每百万 Token 10 美元
•输出:每百万 Token 50 美元
这个价格比此前的 Mythos Preview 便宜了一半,但比 Opus 4.8 贵了一倍,相比 GPT-5.5 的输入也贵了一倍。
有传闻称,OpenAI 的 GPT-5.6 也将在本周发布。期待 Claude 5 与 ChatGPT 的新一轮对决,谁能在这场AI王座之争中笑到最后?我们拭目以待。
