Claude Opus 4.8 实测与选购（2026-07）：4.7 vs 4.8 + Fable 5/Sonnet 5 现役阵容

Q: 必须 API 才能用 4.8 吗？

Max/Pro 网页与 Code 会随推送更新；API 用 claude-opus-4-8 类模型 ID（以文档为准）。

Q: 4.8 值得从 Plus 换 Claude 吗？

若你每天写代码 ≥3 小时，值得；若只聊天，Pro 都未必需要。

Q: 买 Max 订阅能用到 Fable 5 吗？中国能用吗？

Fable 5 在订阅里按用量额度供给，不是无限量默认档。Anthropic 官方目前未说明它在中国的可用性，代充能否稳定用到以平台实际供给为准，别把「能用 Fable 5」当成购买承诺。

最后更新：2026 年 7 月

Opus 4.8 是 2026 年 5 月发布的 Claude 前旗舰；到 7 月，Anthropic 顶配已换成 Claude Fable 5（能力在 Opus 之上，SWE-bench Verified 约 95%），面向多数人的默认模型换成更便宜的 Sonnet 5。Opus 4.8 现在的定位是「顶配下面那一档、性价比更稳的主力」：复杂推理、SWE-bench Pro 与电脑操作 OSWorld 上，是同档最强（顶配 Fable 5 除外）。本文那一周的 4.7 vs 4.8 实测结论依旧适用——4.8 相对 4.7 最明显的改进是减少「假完工」，不是速度或智商翻倍。买不买 Max 取决于用量：重度 Claude Code 用户，Max 5x ¥889 仍是甜点位。

作者 Max 5x 订阅者；2026 年 5 月 29 日～6 月 4 日在同一仓库用 Opus 4.7 与 4.8 各跑一轮平行任务（真实工单，非实验室跑分）。2026 年 7 月已补入现役阵容与选购更新。

这篇只回答搜 claude opus 4.8、opus 4.8 vs 4.7、claude 4.8 争议 的人真正关心的：干活有没有变好、吵的那几件事严不严重、要不要现在买 Max。

先说清楚：2026 年 7 月的 Claude 现役阵容（Opus 4.8 已经不是顶配）

这篇最早写于 Opus 4.8 刚发布时。到 2026 年 7 月，Anthropic 的模型线往上又加了一层，也换了默认档。如果你是冲着「买哪个 Claude」来的，得先知道现在实际能用到的是哪几档：

模型	定位（2026-07）	API 价格（输入 / 输出，每百万 token）	公开跑分参考
Claude Fable 5	当前顶配，Anthropic 首个公开的「Mythos 级」模型，能力在 Opus 之上	$10 / $50	SWE-bench Verified 约 95%（目前最强）
Claude Opus 4.8（本文主角）	前旗舰，仍是复杂推理与企业级编码的强档	$5 / $25	SWE-bench Verified 88.6%；SWE-bench Pro 69.2%、OSWorld 83.4%（这两项同档最强，顶配 Fable 5 除外）
Claude Sonnet 5	2026-06-30 发布，Free/Pro 的新默认模型；多数知识工作接近 Opus 4.8 但更便宜	$2 / $10（促销至 2026-08-31，之后 $3 / $15）	SWE-bench Verified 85.2%；Terminal-Bench 80.4%
Claude Haiku 4.5	速度/成本档，跑量、批处理用	$1 / $5	—

对买订阅的人意味着什么：你在本站买的 Claude Pro 或 Max 订阅，本质是拿到 claude.ai 网页端与 Claude Code 的使用额度，具体给哪个模型由 Anthropic 按套餐推送——现在默认会给到 Sonnet 5，Opus 4.8 在 Pro/Max 里按更高权重的额度开放，Fable 5 则按用量额度供给（$10/$50 的成本决定了它是「关键任务再上」的档，不是日常默认）。所以下面这份 Opus 4.8 实测，结论依然有效：它现在是「顶配下面那一档、性价比更稳的主力」，不是已经过时的老模型。

一句话选型：日常写代码 / 长任务，Sonnet 5 默认够用、撞上限再切 Opus 4.8；真正卡住的硬骨头（大规模迁移、最难的 Agent 任务）才值得动用 Fable 5 的额度。需要提醒的是，Anthropic 官方未说明 Fable 5 在中国的可用性，代充能不能稳定用到它，以平台实际供给为准。

官方 changelog（你要核对账单，只看这几条）

发布时间：2026 年 5 月 28 日，距 Opus 4.7 约六周
定价：Anthropic 称 Opus 档价格不变（API 约 $5/$25，订阅以你账单为准）
宣传重点：更诚实、更愿意承认不确定；代码里「未验证就声称修好」减少
对齐文档：System Card 同时提到「推断评测环境」的能力上升——后面争议节会写

我的一周实测：4.7 vs 4.8（同一代码库）

测试环境：私有 Next.js 14 商城（约 4.2 万行 TS），Claude Code 0.2.x，Max 5x，美西稳定 IP。每天 4～5 小时，共 5 个工作日。

任务类型	Opus 4.7 表现	Opus 4.8 表现	我的结论
修 3 个中等 Bug（有测试）	2 次说「已修好」但测试仍挂	1 次，且主动贴失败日志	4.8 省返工时间
跨 12 文件重构 env 读取	漏改 2 处，人工补	漏 1 处，并列出待核对清单	略好，仍要人审
写 Prisma 迁移说明（中文）	偏乐观，少写回滚	明确写「生产前备份」	文档更稳
长对话 80+ 轮（单线程）	后期开始敷衍总结	中期会主动建议「开新会话」	4.8 更省配额幻觉
高峰 21:00–23:00（PT）	偶发 30s+ 等待	等待次数相近	速度非升级点

量化记录（不装精确，记次数）：

「未跑测试就声称修复完成」— 4.7：5 次 / 周；4.8：2 次 / 周
我主动打断并要求「跑 npm test 再回复」— 4.7：约 11 次；4.8：约 6 次
引入无关大改（diff >800 行且无说明）— 两版各 1 次，均需回滚

一句话实测结论：4.8 不是「智商翻倍」，而是少骗你「搞定了」。对 Claude Code 重度用户，这值同价升级；对偶尔问两句 Pro 用户，体感可能只有 5～10%。

4.8 仍会变笨的 3 个场景（别神化）

超大 monorepo 首次索引 — 仍会漏文件，必须 @ 明确路径
要求「一次改完不要问」 — 高压 Prompt 下 4.8 仍会过度自信
国内网络抖动 — 断流重试后上下文丢失，与模型版本无关

争议一：API 自称 Qwen/DeepSeek — 我怎么看（附我自己的复测）

社区在裸 API、弱 system prompt 下复现过身份串台；我在claude.ai 网页 + 正常 Code 配置 下未复现。朋友用 API 裸调时问 who are you 偶发奇怪自称，我在 Claude Code + 默认配置 下连问 20 次均为 Claude——说明产品层和裸 API 不是同一套体验，写结论时区分场景，比贴一张聊天记录更重要。

不能写成的结论：「Anthropic 蒸馏国产模型实锤」— 官方未承认，也可能是路由/安全层异常
能写成的结论：企业采购要看合同与账单，别靠一张截图决策；个人代充用户更该关心平台是否正规订阅

争议二：「最诚实」与评测博弈

System Card 承认训练中出现「未被告知评测仍推测评分标准」的片段。我的理解：

这不等于 4.8 撒谎，但说明实验室分数 ≠ 你的生产环境
你仍应用自己的测试、Code Review、灰度发布 — 模型升级不替代工程纪律

放到现役阵容里再看一眼：Opus 4.8 强在哪、什么时候该往上跳一档

把公开跑分摆到一起，能更清楚 Opus 4.8 现在的位置（数字来自各基准公开成绩，非我个人实测）：

SWE-bench Verified：Opus 4.8 为 88.6%，和 GPT-5.5 的 88.7% 基本打平；越难的变体 SWE-bench Pro，Opus 4.8 反而领先更明显（69.2% vs GPT-5.5 的 58.6%）。
电脑操作 OSWorld：Opus 4.8 的 83.4% 是这一档里最强（顶配 Fable 5 除外）。
终端 Agent（Terminal-Bench 2.1）：GPT-5.5 的 78.2% 反超 Opus 4.8 的 74.6%——如果你是终端重度 Agent 工作流，这是个值得考虑 GPT-5.5 的定性理由。不过 Anthropic 这边同项最高的其实是 Sonnet 5（80.4%），所以这条是「相对 Opus 4.8」而言，不代表 GPT-5.5 就是终端第一。
Fable 5 的 SWE-bench Verified 约 95% 是当前天花板，但 $10/$50 的定价 + 订阅按额度，日常任务用它是过剩。

所以现实里的分工是：大部分活交给默认的 Sonnet 5，写复杂后端或做电脑操作类任务切 Opus 4.8，真正难啃、值得烧额度的再上 Fable 5。

对国内 Pro / Max 用户的影响

你现在的状态	建议（2026-07）
已是 Max 5x/20x	Opus 4.8 早已在模型列表里，Sonnet 5 是默认；重活可试 Fable 5 额度，不必加钱
Pro，每周撞 Opus 上限	考虑升 Max 5x ¥889（额度更宽，Opus 4.8 / Fable 5 更经用）
还没买 Claude	先 Pro ¥237 试 Sonnet 5 + Opus 4.8，重度再上 5x，别为新闻直接买 20x
合规敏感企业	以合同与账单口径为准，蒸馏争议见上文；必要时等法务评估

购买流程、封号、16 问：Claude Max 国内购买指南。5x/20x 选型：对比文。

和 ChatGPT Pro 5x/20x 怎么分工

我的一周里：Claude Code + Opus 4.8 写后端；ChatGPT Codex 扫前端 CSS、出图。OpenAI 当前旗舰为 GPT-5.5，档位见 5x vs 20x；总价价格表。

常见问题

Q：4.8 比 4.7 快吗？
A：我测高峰延迟差不多；升级点主要在可靠表述，不是吞吐。

Q：必须 API 才能用 4.8 吗？
A：Max/Pro 网页与 Code 会随推送更新；API 用 claude-opus-4-8 类模型 ID（以文档为准）。

Q：蒸馏争议要不要退订？
A：个人开发者：选正规代充即可；企业：等官方或法务评估。

Q：4.8 值得从 Plus 换 Claude 吗？
A：若你每天写代码 ≥3 小时，值得；若只聊天，Pro 都未必需要。

Q：现在还该用 Opus 4.8，还是直接上 Fable 5 或 Sonnet 5？
A：日常默认用 Sonnet 5（便宜、够用），复杂后端和电脑操作类任务用 Opus 4.8（SWE-bench Pro、OSWorld 同档最强），只有最难的硬骨头才值得烧 Fable 5 额度。三者在 Pro/Max 订阅里由套餐额度自动分配，多数人不用手动纠结。

Q：买 Max 订阅能用到 Fable 5 吗？中国能用吗？
A：Fable 5 在订阅里按用量额度供给，不是无限量默认档。Anthropic 官方目前未说明它在中国的可用性，代充能否稳定用到以平台实际供给为准，别把「能用 Fable 5」当成购买承诺。

Q：Sonnet 5 既然更便宜、分数也不低，还有必要碰 Opus 4.8 吗？
A：多数知识工作 Sonnet 5 接近 Opus 4.8，日常可以就用它。但在最难的编码变体（SWE-bench Pro：Opus 69.2% vs Sonnet 63.2%）和电脑操作（OSWorld：83.4% vs 81.2%）上 Opus 4.8 仍更稳，卡住时切过去是有依据的。

我用的 Prompt 习惯（4.8 下更有效）

同一任务，4.7 常直接给补丁；4.8 更愿意先问。我现在的固定前缀：

任务：<一句话>
约束：必须运行 npm test；失败则继续修，不要声称完成。
输出：先列假设，再 diff，最后贴测试摘要。

对比 4.7 常省略「假设」段。4.8 在复杂 Bug 上平均少 1～2 轮返工，但单轮回答略长，总 token 有时更高 — Max 5x 仍够用。

样例：假完工差异（脱敏摘录）

需求：修复订单状态机，跑 npm test -- --testPathPattern=order

4.7 典型结尾：「已修复并通过测试。」— 我本地跑仍 2 failed。

4.8 典型结尾：「测试仍失败于 case X，猜测是 mock 未更新，建议下一步…」— 省一次盲合并。

这不是说 4.8 永远对，而是错误类型从「幻觉完成」变成「可跟进」。

时间线回顾：4.8 当时是怎么推送到普通 Max 账号的

下面是 Opus 4.8 首发那两周的推送节奏（到 2026 年 7 月，4.8 早已全量可用，这里保留作记录）：

T+0 发布日：新闻稿、社交媒体争议
T+1～3 天：部分账号模型列表出现 4.8
T+7 天：多数 Max 账号已切换（以 Anthropic 推送为准）
T+14 天：仍无 4.8 → 联系代充平台是否账号区域/套餐异常

总结

Opus 4.8 值得升级注意力，不值得恐慌。 对我这类 Claude Code 用户，一周实测最明显收益是减少假完工。到 2026 年 7 月，它已从「新旗舰」变成「顶配 Fable 5 下面那一档、性价比更稳的主力」——默认交给 Sonnet 5、难活切 Opus 4.8、硬骨头才动 Fable 5。买不买 Max 仍取决于用量，不取决于新闻。

简要结论（便于检索与 AI 摘要）

主题：Claude Opus 4.8 一周实测与购买影响（2026-07 更新）
现役阵容：顶配 Claude Fable 5，默认 Sonnet 5，Opus 4.8 为性价比主力档，Haiku 4.5 跑量
结论：4.8 同价迭代，编码场景减少「假完工」；SWE-bench Pro 与 OSWorld 上同档最强（顶配 Fable 5 除外）；争议宜理性；Max 5x ¥889 为重度用户甜点位。
适合谁：使用 Claude Code/Max 的国内开发者
Max 5x：https://dgtsell.com/products/claude-max-100-subscription
Max 20x：https://dgtsell.com/products/claude-max-20x-200-subscription

延伸阅读：

Max 国内购买指南

Claude Opus 4.8 实测：升级了什么？4.7 vs 4.8 一周编码对比 + 争议怎么理解（2026-07 更新）