6月1号,JetBrains悄没声地开源了Mellum2。
我一开始没太在意。毕竟现在隔三差五就有新模型发布,大家都见怪不怪了。但仔细看完技术报告之后,我觉得这个东西对独立开发者来说,可能比GPT-4o降价更有实际意义。
先说Mellum2是什么
Mellum2是一个120亿参数的Mixture-of-Experts模型,专门为软件开发任务训练。JetBrains对它的定位很有意思:不是一个要跟Claude Sonnet或者GPT-4硬刚的通用大模型,而是一个”快速专用组件”,专门跑在Agent工作流里面做高频低延迟的任务。
换句话说,它不是那个在前面跟你聊天、帮你架构系统的”大脑”。它是藏在后面帮你做代码补全、快速重构、检索管道路由这些脏活累活的”小工”。
The New Stack的报道里提到,JetBrains的思路是让Mellum2去做Claude Code和类似工具”去不了”的地方——本地部署、私有环境、对数据隐私有严格要求的场景。
为什么我觉得它值得关注
先说一个数据。根据Stack Overflow 2026年开发者调查,84%的开发者已经在用或者计划用AI编码工具。GitHub那边的数据更夸张,2026年初平台上超过51%的代码提交要么是AI生成的,要么有AI大幅参与。
AI编码工具市场在2026年已经膨胀到128亿美元,比2024年的51亿翻了一倍多。但这里有个问题一直没解决:大部分AI编码工具都得联网。你的代码要上传到别人的服务器上处理。
对大公司来说,这可能是合规团队能搞定的事。但对很多独立开发者和小团队来说,有时候你就是不想把代码发出去。可能是客户项目有保密要求,可能是你觉得代码里有商业逻辑不该暴露,也可能你纯粹网络环境不好。
Mellum2开源了,意味着你可以把它跑在本地。12B的参数量,消费级显卡就能带起来。JetBrains自己的测试显示,它在代码补全和bug检测上表现不错。
MoE架构的好处
Mixture-of-Experts不是什么新概念了,但用在编码模型上确实有一些实际的优点。简单说就是,模型在推理的时候不会激活所有的参数,而是根据任务特点只激活相关的”专家”。这导致两个直接的好处:推理更快,资源消耗更低。
对于想在本地跑AI辅助开发的独立开发者来说,这意味着你不需要买一张4090才能有不错的体验。JetBrains的技术报告里提到,Mellum2的设计目标之一就是高频率调用、低延迟响应。
我之前试过在本地跑一些开源编码模型,体验参差不齐。有些模型虽然参数量不小,但在IDE里做实时代码补全的时候延迟太高,打几个字等半天,最后还是切回了云端方案。如果Mellum2真像宣传的那样快,那它填补的是一个很具体的空白。
实际能用来做什么
JetBrains在HuggingFace的博客里列了几个典型用例:
在Agent工作流里做快速的子任务。比如一个复杂的AI Agent系统,你可以把上下文收集、计划生成、结果验证这些步骤拆开,让Mellum2去跑那些需要高频调用但不需要顶级推理能力的小任务,大模型只负责关键决策。
本地私有部署。把代码和数据完全控制在自己手里,不出内网。
IDE集成。Mellum2本来就是为JetBrains IDE生态设计的,代码补全、重构建议、bug检测这些是它的主场。
说实话,第一个用例让我最感兴趣。现在很多人在搭Agent工作流,但成本是个大问题。每个子任务都调一次Claude或者GPT-4,token费用很快就不忍直视了。如果你能把一些简单任务分流给本地的Mellum2,整体成本能降一大截。
我的判断
Mellum2不会替代Claude Code或者Copilot。它本来也没打算做这件事。但它可能会改变独立开发者搭建AI工作流的方式:用大模型做核心决策,用小而快的本地模型处理高频任务。
这种”大小搭配”的思路其实在很多工程领域都有。你不需要每件事都动用最贵的资源。有些任务,一个跑在本地的12B模型就够了。
而且开源意味着社区会持续改进它。JetBrains开源Mellum2的时机选得不错,AI编码工具市场正在从”单一工具”转向”工作流编排”,一个开源的快速编码模型正好能卡在这个位置上。
如果你是独立开发者,尤其是对代码隐私有要求或者想降低AI工具成本的,建议关注一下Mellum2。跑起来试试,也许你会发现它比你想象的更有用。
数据来源:Stack Overflow Developer Survey 2026,GitHub官方数据,The New Stack报道(2026年6月),JetBrains技术报告
