笨蛋三月七的日常

笨蛋三月七的日常

Claude Opus 4.8 发布。 #news

TL;DR：

- 能力全面提升：在编程、Agent（智能体）能力、逻辑推理及实际知识工作方面均超越前代，是更高效的协作伙伴。
- 显著提升“诚实度”：模型减少了“盲目自信”和过度承诺的毛病。测试显示，Opus 4.8 漏掉代码缺陷的概率比前代降低了约 4 倍，更倾向于主动指出其工作中的不确定性。
- 安全性与对齐：错位行为（如欺骗、配合滥用）大幅减少，安全性和道德对齐达到了与最高标准预览版（Claude Mythos Preview）平齐的水平。

- 动态工作流（Dynamic Workflows）：在 Claude Code 中提供研究预览。允许 Claude 在单个会话中规划并运行数百个并行子 Agent，从而能够处理代码库级别的海量迁移任务（支持数十万行代码从启动到合并）。
- 精力 / 投入控制（Effort Control）：在 claude.ai 和 Cowork 中推出。用户可以自由调整模型的投入程度——“高投入 / 最大投入”下模型会进行更频繁和更深度的思考以提供更高质量的回答（Opus 4.8 默认采用高投入模式）；“低投入”则响应更快，更节省额度。
- Messages API 升级：现在支持在消息数组（messages array）内直接插入系统输入（system entries），允许开发者在 Agent 运行中途更新指令 / 权限 / 上下文，且不会破坏现有的提示词缓存（Prompt Cache）。

- 常规定价不变：输入为 $5/ 百万 token，输出为 $25/ 百万 token。
- 快模模式（Fast Mode）大幅降价：快模模式下运行速度可提升至 2.5 倍，而价格却比之前的快模模型便宜了 3 倍（调整后为输入 $10/ 百万 token，输出 $50/ 百万 token）。

- 官方表示下一步将专注于开发低成本的 Opus 级别模型。
- 同时，更强大的下一代全新模型 Mythos 级别模型（来自 Project Glasswing 计划） 目前正处于极少数组织的网络安全测试阶段，预计将在未来几周内向所有客户全面开放。

Source
#news