
Anthropic 最近推出了 Claude Haiku 4.5——Claude 4.5 系列中最新也是体量最小的模型——但它的表现远超“小模型”应有的水准。在经历近一年的 Haiku 系列更新空窗期后,这次发布带来了令人惊喜的升级:更快的推理速度、以往仅大模型才能使用的高级功能,以及在部分任务中甚至能超越 Claude Sonnet 4 的性能。
虽然社区还需要时间来验证 Anthropic 的大胆声明,但内部基准测试和实际应用结果已经显示出非常有前景的表现。本文将全面介绍 Haiku 4.5,包括功能、定价、性能测试、实测效果以及它在 AI 生态中的定位。
Claude Haiku 4.5 是 Anthropic 最新推出的轻量级、经济实惠模型,但“轻量”可不要被字面误导。它拥有:
这些更新让 Haiku 4.5 特别适合实时、低延迟任务,例如聊天助手、客服机器人或配对编程等场景,在速度和准确性上都有很强表现。
虽然 Sonnet 4.5 依旧是 Anthropic 最强的编程模型,但 Haiku 4.5 以显著更低成本提供接近前沿的性能,非常适合可扩展或成本敏感的工作负载。
Haiku 4.5 的定价为:
相比 Sonnet 系列仍然便宜很多,尽管比 Haiku 3.5 贵约 25%。 早期 Haiku 版本的价格曾比 Sonnet 低 12 倍,而现在差距缩小到约 3 倍。不过考虑到性能的大幅提升,这个价格增长还是很合理的——Haiku 4.5 在部分任务中接近 Sonnet 4,甚至逼近 Sonnet 4.5。
Haiku 4.5 引入了多项以往仅限大模型的高级功能,让小模型也能“上大舞台”,成本却大幅降低。
1. 扩展思维
Haiku 4.5 支持扩展思维模式,为复杂任务提供更多计算时间,同时可显示透明的“思维链可视化流”,让用户实时观察内部推理过程。
这种透明性有助于审查逻辑、提升多步骤任务输出的可信度。
2. 虚拟电脑操作
升级中最亮眼的一项:Haiku 4.5 能操作虚拟电脑,包括:
在 OSWorld 验证的基准测试中,Haiku 4.5 的成功率达 50.7%,远超早期版本,甚至高于 Claude Sonnet 4 的 42.2%。对小模型而言,这一水平的实际操作能力是里程碑式突破。
3. 上下文感知
Haiku 4.5 可以智能管理 20 万 token 的上下文窗口。 当模型检测到空间不足时,它会:
这使得长时间对话或多步骤工作流更加稳定可靠。
XXAI 已将 Haiku 4.5 集成到平台中,用户可立即在写作、编程、分析、客服自动化及创意工作流中使用最新模型。凭借增强的视觉推理、更高准确率及极速响应,Haiku 4.5 扩展了 XXAI 的工具集,尤其适合需要高级功能但不想承担前沿模型高成本的用户。
对于开发 AI 自动化或多智能体系统的开发者来说,Haiku 4.5 的速度与效率是构建智能工作流和可扩展部署的有力选项。
我通过 Claude Web 界面对 Haiku 4.5 进行了多项实测:
1. 构建基础记账应用
之前使用 Sonnet 4.5 构建健康习惯应用,这次让 Haiku 4.5 制作个人记账工具。结果:
完成速度更快,成本更低,效果几乎与 Sonnet 4.5 相同。
2. 从截图生成 UI
上传截图并要求将左侧边栏移到顶部,Haiku 4.5 立即完成布局调整。 随后为每个菜单模块添加功能:
模型顺利扩展了 UI 并实现了全部功能,无任何阻力。
Anthropic 发布的基准显示,Haiku 4.5 的表现远超其体量预期。
聊天访问
API 接入
可轻松将 Haiku 集成到应用、自动化或多智能体系统中。
Claude Haiku 4.5 找到了一种罕见的平衡:接近 Sonnet 性能,速度翻倍,成本仅三分之一。 凭借增强推理能力、强大电脑操作能力及出色视觉理解,Haiku 4.5 巩固了 Anthropic 模型阵容的整体实力。
对于多智能体系统、实时助手或成本敏感的 AI 工作流,Haiku 4.5 是目前最出色的轻量模型之一。 在 XXAI 等平台的集成下,开发者和创作者可以立即使用其升级功能。