JetBrains开源Mellum2：一个12B编码模型能干什么？独立开发者的本地AI新选择

6月1号，JetBrains悄没声地开源了Mellum2。

我一开始没太在意。毕竟现在隔三差五就有新模型发布，大家都见怪不怪了。但仔细看完技术报告之后，我觉得这个东西对独立开发者来说，可能比GPT-4o降价更有实际意义。

先说Mellum2是什么

Mellum2是一个120亿参数的Mixture-of-Experts模型，专门为软件开发任务训练。JetBrains对它的定位很有意思：不是一个要跟Claude Sonnet或者GPT-4硬刚的通用大模型，而是一个”快速专用组件”，专门跑在Agent工作流里面做高频低延迟的任务。

换句话说，它不是那个在前面跟你聊天、帮你架构系统的”大脑”。它是藏在后面帮你做代码补全、快速重构、检索管道路由这些脏活累活的”小工”。

The New Stack的报道里提到，JetBrains的思路是让Mellum2去做Claude Code和类似工具”去不了”的地方——本地部署、私有环境、对数据隐私有严格要求的场景。

先说一个数据。根据Stack Overflow 2026年开发者调查，84%的开发者已经在用或者计划用AI编码工具。GitHub那边的数据更夸张，2026年初平台上超过51%的代码提交要么是AI生成的，要么有AI大幅参与。

AI编码工具市场在2026年已经膨胀到128亿美元，比2024年的51亿翻了一倍多。但这里有个问题一直没解决：大部分AI编码工具都得联网。你的代码要上传到别人的服务器上处理。

对大公司来说，这可能是合规团队能搞定的事。但对很多独立开发者和小团队来说，有时候你就是不想把代码发出去。可能是客户项目有保密要求，可能是你觉得代码里有商业逻辑不该暴露，也可能你纯粹网络环境不好。

Mellum2开源了，意味着你可以把它跑在本地。12B的参数量，消费级显卡就能带起来。JetBrains自己的测试显示，它在代码补全和bug检测上表现不错。

Mixture-of-Experts不是什么新概念了，但用在编码模型上确实有一些实际的优点。简单说就是，模型在推理的时候不会激活所有的参数，而是根据任务特点只激活相关的”专家”。这导致两个直接的好处：推理更快，资源消耗更低。

对于想在本地跑AI辅助开发的独立开发者来说，这意味着你不需要买一张4090才能有不错的体验。JetBrains的技术报告里提到，Mellum2的设计目标之一就是高频率调用、低延迟响应。

我之前试过在本地跑一些开源编码模型，体验参差不齐。有些模型虽然参数量不小，但在IDE里做实时代码补全的时候延迟太高，打几个字等半天，最后还是切回了云端方案。如果Mellum2真像宣传的那样快，那它填补的是一个很具体的空白。

JetBrains在HuggingFace的博客里列了几个典型用例：

在Agent工作流里做快速的子任务。比如一个复杂的AI Agent系统，你可以把上下文收集、计划生成、结果验证这些步骤拆开，让Mellum2去跑那些需要高频调用但不需要顶级推理能力的小任务，大模型只负责关键决策。

本地私有部署。把代码和数据完全控制在自己手里，不出内网。

IDE集成。Mellum2本来就是为JetBrains IDE生态设计的，代码补全、重构建议、bug检测这些是它的主场。

说实话，第一个用例让我最感兴趣。现在很多人在搭Agent工作流，但成本是个大问题。每个子任务都调一次Claude或者GPT-4，token费用很快就不忍直视了。如果你能把一些简单任务分流给本地的Mellum2，整体成本能降一大截。

Mellum2不会替代Claude Code或者Copilot。它本来也没打算做这件事。但它可能会改变独立开发者搭建AI工作流的方式：用大模型做核心决策，用小而快的本地模型处理高频任务。

这种”大小搭配”的思路其实在很多工程领域都有。你不需要每件事都动用最贵的资源。有些任务，一个跑在本地的12B模型就够了。

而且开源意味着社区会持续改进它。JetBrains开源Mellum2的时机选得不错，AI编码工具市场正在从”单一工具”转向”工作流编排”，一个开源的快速编码模型正好能卡在这个位置上。

如果你是独立开发者，尤其是对代码隐私有要求或者想降低AI工具成本的，建议关注一下Mellum2。跑起来试试，也许你会发现它比你想象的更有用。

数据来源：Stack Overflow Developer Survey 2026，GitHub官方数据，The New Stack报道（2026年6月），JetBrains技术报告