TL;DR:
- 能力全面提升:在编程、Agent(智能体)能力、逻辑推理及实际知识工作方面均超越前代,是更高效的协作伙伴。
- 显著提升“诚实度”:模型减少了“盲目自信”和过度承诺的毛病。测试显示,Opus 4.8 漏掉代码缺陷的概率比前代降低了约 4 倍,更倾向于主动指出其工作中的不确定性。
- 安全性与对齐:错位行为(如欺骗、配合滥用)大幅减少,安全性和道德对齐达到了与最高标准预览版(Claude Mythos Preview)平齐的水平。
- 动态工作流(Dynamic Workflows):在 Claude Code 中提供研究预览。允许 Claude 在单个会话中规划并运行数百个并行子 Agent,从而能够处理代码库级别的海量迁移任务(支持数十万行代码从启动到合并)。
- 精力 / 投入控制(Effort Control):在 claude.ai 和 Cowork 中推出。用户可以自由调整模型的投入程度——“高投入 / 最大投入”下模型会进行更频繁和更深度的思考以提供更高质量的回答(Opus 4.8 默认采用高投入模式);“低投入”则响应更快,更节省额度。
- Messages API 升级:现在支持在消息数组(messages array)内直接插入系统输入(system entries),允许开发者在 Agent 运行中途更新指令 / 权限 / 上下文,且不会破坏现有的提示词缓存(Prompt Cache)。
- 常规定价不变:输入为 $5/ 百万 token,输出为 $25/ 百万 token。
- 快模模式(Fast Mode)大幅降价:快模模式下运行速度可提升至 2.5 倍,而价格却比之前的快模模型便宜了 3 倍(调整后为输入 $10/ 百万 token,输出 $50/ 百万 token)。
- 官方表示下一步将专注于开发低成本的 Opus 级别模型。
- 同时,更强大的下一代全新模型 Mythos 级别模型(来自 Project Glasswing 计划) 目前正处于极少数组织的网络安全测试阶段,预计将在未来几周内向所有客户全面开放。
Source
#news
- 能力全面提升:在编程、Agent(智能体)能力、逻辑推理及实际知识工作方面均超越前代,是更高效的协作伙伴。
- 显著提升“诚实度”:模型减少了“盲目自信”和过度承诺的毛病。测试显示,Opus 4.8 漏掉代码缺陷的概率比前代降低了约 4 倍,更倾向于主动指出其工作中的不确定性。
- 安全性与对齐:错位行为(如欺骗、配合滥用)大幅减少,安全性和道德对齐达到了与最高标准预览版(Claude Mythos Preview)平齐的水平。
- 动态工作流(Dynamic Workflows):在 Claude Code 中提供研究预览。允许 Claude 在单个会话中规划并运行数百个并行子 Agent,从而能够处理代码库级别的海量迁移任务(支持数十万行代码从启动到合并)。
- 精力 / 投入控制(Effort Control):在 claude.ai 和 Cowork 中推出。用户可以自由调整模型的投入程度——“高投入 / 最大投入”下模型会进行更频繁和更深度的思考以提供更高质量的回答(Opus 4.8 默认采用高投入模式);“低投入”则响应更快,更节省额度。
- Messages API 升级:现在支持在消息数组(messages array)内直接插入系统输入(system entries),允许开发者在 Agent 运行中途更新指令 / 权限 / 上下文,且不会破坏现有的提示词缓存(Prompt Cache)。
- 常规定价不变:输入为 $5/ 百万 token,输出为 $25/ 百万 token。
- 快模模式(Fast Mode)大幅降价:快模模式下运行速度可提升至 2.5 倍,而价格却比之前的快模模型便宜了 3 倍(调整后为输入 $10/ 百万 token,输出 $50/ 百万 token)。
- 官方表示下一步将专注于开发低成本的 Opus 级别模型。
- 同时,更强大的下一代全新模型 Mythos 级别模型(来自 Project Glasswing 计划) 目前正处于极少数组织的网络安全测试阶段,预计将在未来几周内向所有客户全面开放。
Source
#news