Claude Sonnet 5实测：我用这个新模型写了3天的代码，这是真实感受

—

上周朋友圈被 Claude Sonnet 5 刷屏了。6月30号发布的，说是Anthropic目前最强的编码模型。我其实一直对”最强”这个词有点过敏，去年每个新模型出来都标榜最强，结果用起来不是这里有问题就是那里差点意思。但这次不一样，我确实在代码质量上感受到了明显的提升。

先说说背景。我平时做独立开发，主要写TypeScript全栈，偶尔啃点Python做数据处理。之前主力是Claude Sonnet 4.5和GPT-5.5换着用，哪个顺手用哪个。Sonnet 5一发布我就在Sub2API上换了过去（感谢自己搭的API网关，切模型就是改个参数的事）。

第一印象：确实快

很多人关注模型先看准确率，我看的是响应速度。做开发的时候，等模型回复是很烦的。Sonnet 5的响应时间比4.5快了一截，大概提升了40%左右。配合流式输出，基本没有等待感。GitHub官方数据说现在51%以上的代码提交有AI辅助，这个数据我信，因为流畅的体验确实让人更愿意用它。

代码质量：真的能扛复杂逻辑

以前用AI写代码经常遇到一个尴尬：简单CRUD一把梭哈没问题，一涉及到复杂的状态管理、异步流程、边界条件处理，就开始胡言乱语了。Sonnet 5这次在复杂逻辑上的表现明显更好。

我试着让它写了一个带乐观更新的实时协作模块，涉及到WebSocket重连、冲突检测、本地缓存回退。以前这个任务至少需要我手动调2-3轮，Sonnet 5第一版生成的代码就能跑通基础流程，边界处理比我自己写的还仔细。Stack Overflow那篇关于AI编码工具的报告提到84%的开发者已经在用AI工具辅助开发，看到这种表现我一点都不意外。

和GPT-5.5的对比

GPT-5.5在创意类任务上仍然有优势，比如写测试用例的多样性、代码注释的自然度。但说到代码本身的严谨性，Sonnet 5明显更胜一筹。我特别留意了一下TypeScript类型的推导能力——Sonnet 5对泛型约束和条件类型的理解比GPT-5.5深，生成的代码基本不需要额外补类型。

不过有个槽点：Sonnet 5在中文注释里偶尔会混入英文标点，不知道是训练数据的问题还是我prompt没写好。

真实不足

说点实话。Sonnet 5对超长上下文的理解还不够稳定。我试过把整个项目（大概5000行）丢进去让它重构一个模块，中间的逻辑它就有点迷糊了。另外在一些不太主流的框架上（比如我用的一个冷门ORM），它的表现不如在React/Next.js生态里好。所以如果你用主流技术栈，体验会很棒；冷门技术栈的话，建议还是把它当辅助，别完全信任。

我还对比了DeepSeek V4-Pro，中文理解深度上DeepSeek略好一些，但在代码质量上Sonnet 5明显领先。这俩如果组合使用其实蛮好——写中文技术文档用DeepSeek，写核心逻辑用Sonnet 5。

总的来说

Sonnet 5不是完美的，但它是目前我用过最适合写代码的模型。84%的采纳率不是空穴来风。不过我不建议盲目跟风升级，关键在于你的使用场景：如果是写主流框架的复杂逻辑，直接换；如果是偏创意或者轻量开发，老的4.5其实也够用。

我是打算长期把它作为主力编码模型了，至少短期内应该不会换。除非下个月哪个实验室又发个更离谱的东西出来。