—
上周朋友圈被 Claude Sonnet 5 刷屏了。6月30号发布的,说是Anthropic目前最强的编码模型。我其实一直对”最强”这个词有点过敏,去年每个新模型出来都标榜最强,结果用起来不是这里有问题就是那里差点意思。但这次不一样,我确实在代码质量上感受到了明显的提升。
先说说背景。我平时做独立开发,主要写TypeScript全栈,偶尔啃点Python做数据处理。之前主力是Claude Sonnet 4.5和GPT-5.5换着用,哪个顺手用哪个。Sonnet 5一发布我就在Sub2API上换了过去(感谢自己搭的API网关,切模型就是改个参数的事)。
第一印象:确实快
很多人关注模型先看准确率,我看的是响应速度。做开发的时候,等模型回复是很烦的。Sonnet 5的响应时间比4.5快了一截,大概提升了40%左右。配合流式输出,基本没有等待感。GitHub官方数据说现在51%以上的代码提交有AI辅助,这个数据我信,因为流畅的体验确实让人更愿意用它。
代码质量:真的能扛复杂逻辑
以前用AI写代码经常遇到一个尴尬:简单CRUD一把梭哈没问题,一涉及到复杂的状态管理、异步流程、边界条件处理,就开始胡言乱语了。Sonnet 5这次在复杂逻辑上的表现明显更好。
我试着让它写了一个带乐观更新的实时协作模块,涉及到WebSocket重连、冲突检测、本地缓存回退。以前这个任务至少需要我手动调2-3轮,Sonnet 5第一版生成的代码就能跑通基础流程,边界处理比我自己写的还仔细。Stack Overflow那篇关于AI编码工具的报告提到84%的开发者已经在用AI工具辅助开发,看到这种表现我一点都不意外。
和GPT-5.5的对比
GPT-5.5在创意类任务上仍然有优势,比如写测试用例的多样性、代码注释的自然度。但说到代码本身的严谨性,Sonnet 5明显更胜一筹。我特别留意了一下TypeScript类型的推导能力——Sonnet 5对泛型约束和条件类型的理解比GPT-5.5深,生成的代码基本不需要额外补类型。
不过有个槽点:Sonnet 5在中文注释里偶尔会混入英文标点,不知道是训练数据的问题还是我prompt没写好。
真实不足
说点实话。Sonnet 5对超长上下文的理解还不够稳定。我试过把整个项目(大概5000行)丢进去让它重构一个模块,中间的逻辑它就有点迷糊了。另外在一些不太主流的框架上(比如我用的一个冷门ORM),它的表现不如在React/Next.js生态里好。所以如果你用主流技术栈,体验会很棒;冷门技术栈的话,建议还是把它当辅助,别完全信任。
我还对比了DeepSeek V4-Pro,中文理解深度上DeepSeek略好一些,但在代码质量上Sonnet 5明显领先。这俩如果组合使用其实蛮好——写中文技术文档用DeepSeek,写核心逻辑用Sonnet 5。
总的来说
Sonnet 5不是完美的,但它是目前我用过最适合写代码的模型。84%的采纳率不是空穴来风。不过我不建议盲目跟风升级,关键在于你的使用场景:如果是写主流框架的复杂逻辑,直接换;如果是偏创意或者轻量开发,老的4.5其实也够用。
我是打算长期把它作为主力编码模型了,至少短期内应该不会换。除非下个月哪个实验室又发个更离谱的东西出来。
