Anthropic危险模型耗时45分钟、耗20欧元令牌,一次性实现游戏创意!
【导语:2026年,Anthropic发布了一个据说危险到不能让世人看到的模型,有人用自己的测试标准对其进行测试,让它实现一个多年来的游戏创意,该模型最终成功完成。】
几天前,Anthropic发布了一个被认为危险到不能让世人看到的模型。测试者想用自己的测试标准来试试它,即让它一次性实现自己多年来一直有的一个游戏创意。
这个模型一开始进行了很长时间的推理,45分钟过去了,消耗了价值超过20欧元的令牌后,它愉快地报告说:“牧羊犬游戏已完成 —— 一个2319行的index.html文件,且无任何依赖。”
测试者表示这款游戏真的很有趣,和自己想象的一模一样,这是第一次有AI模型能一次性为其实现这个创意。人们可以观看相关视频,也可以通过链接 vnglst.github.io/when-ai-fails/shepards-dog/claude-fable-5/index.html 来玩这款游戏。此外,还能查看早期模型的其他尝试 github.com/vnglst/when-ai-fails/blob/main/shepards-dog/README.md。
编辑观点:Anthropic这个危险模型展现出强大的能力,一次性实现游戏创意,其应用潜力值得关注,但也需重视其所谓的“危险性”。
