外网爆火，比Vibe Coding便宜10倍！北邮重构多智能体编排范式

新智元报道

编辑：LRST

【新智元导读】北京邮电大学团队开源的MASFactory框架，用Vibe Graphing重构多智能体系统编排。它将自然语言指令转化为结构化工作流，三步完成角色分配、拓扑设计与语义补全，API成本降为传统方式的十分之一，代码量暴减，开发效率飙升。系统以图为核心，支持混合编排与全栈可视化，已通过多项权威测试，性能全面超越同类方案。

近日，YouTube等外网平台上一段名为《Vibe Graphing: 10x More Affordable than Vibe Coding (MAS-Factory)》的技术解析视频在开发者圈层中引发了强烈的共鸣与热议。

视频中给出的数据令人咋舌：在同等任务复杂度下，传统的Vibe Coding试错成本高达数美元，而采用一种名为「Vibe Graphing」的全新范式，API成本直接骤降至原来的十分之一，且成功率大幅跃升。

这支视频背后的主角，正是由北京邮电大学团队最新开源的LLM多智能体编排框架——MASFactory。

项目官网: https://masfactory.dev

代码仓库: https://github.com/BUPT-GAMMA/MASFactory

原版论文: https://arxiv.org/abs/2603.06007

目前，该项目已在GitHub全面开源，学术论文也已同步发布。

Vibe Coding在多智能体编排水土不服

伴随着基础大模型能力的溢出，业界形成了一个明确的技术共识：通过角色特化、交叉验证和迭代协作，多智能体系统（MAS）能够解决单一 Agent 难以覆盖的长周期复杂任务。

然而，构建一个健壮、可扩展的 MAS，依然是一场令人筋疲力尽的工程「泥沼战」。

现有的编排框架主要分为两个派别：

一是硬编码派（Imperative/Declarative），要求开发者学习特定的 DSL，手动维护极其复杂的通信逻辑与状态同步。这种方式灵活性高，但工程成本极其高昂。

二是端是可视化拖拽派，虽然大幅降低了门槛，但在面对需要深度定制的多层次复杂拓扑结构时，满屏蜘蛛网般的连线会让后续的维护和扩展形同灾难。

即使是当下备受瞩目的Vibe Coding范式，也难以弥补上述两种开发范式的缺陷。

由于大多数大语言模型在训练时缺乏对各类小众DSL（特定领域语言）的充分学习，当Vibe Coding工具面对硬编码框架时往往显得水土不服。

这不仅意味着开发者需要付出额外的Token成本来让模型预习DSL语法，还投入大量精力，去约束AI遵循DSL的拓扑规范与通信逻辑，导致开发体验大打折扣。对于可视化拖拽派，Vibe Coding工具更是难以入手。

Vibe Graphing

多智能体编排的一等公民

Vibe Graphing工具本质上是一个「自然语言意图 -> 结构化中间表示（IR） -> 可执行工作流」的编译器。

与Vibe Coding简单粗暴地让AI直接吐出底层代码不同，Vibe Graphing将MAS的构建抽象为一个极具秩序感的三阶段设计过程。在引擎内部，这被封装为由三个Agent驱动的Loop组件：

阶段一：角色分配（Role Assignment）。

系统首先剥离所有的代码实现细节，只关注「人」。当开发者输入诸如「帮我构造一个文献综述工作流」的自然语言指令时，引擎会将任务意图映射为一组候选智能体（如检索员、阅读员、写作员、评审员），并划定严格的责任边界。

阶段二：拓扑设计（Topology Design）。

确定角色后，系统开始构建一张有向图拓扑骨架。这个骨架只定义节点间的消息依赖和执行顺序（如串行、并行、循环），而不涉及任何具体的 Prompt 或工具调用。

阶段三：语义补全（Semantic Completion）。

最后，系统对拓扑骨架进行参数化实例化，为每个节点精准配置指令、输入输出约束。

因为AI每次只需要生成或修改极其简短的JSON拓扑配置，而不是几千行的 Python 逻辑代码，Token消耗呈指数级下降；从而达到了比Vibe Coding节省10倍token的效果。

MASFactory

以图为中心的四层架构

Vibe Graphing 能够如此优雅地运行，是因为 MASFactory 拥有一个底层图引擎，它将多智能体工作流建模为有向计算图。整个系统被科学地划分为四个层次：

图骨架

在最底层，系统完全由 Node（节点）和 Edge（边）构成。MASFactory 极其硬核地对协作信号进行了物理隔离，拆分为三种流：

控制流（Control Flow）：沿着有向边传播，严格推进调度与依赖，确保执行的因果时序。

消息流（Message Flow）：横向传递，将节点的输出有效载荷精准投递给下游节点。

状态流（State Flow）：在图与子图的树状层级结构间纵向传播，实现自治域的上下文和运行时状态同步。

组件层与可复用层

基础的节点被进一步抽象为丰富的组件库。除了遵循感知-推理-行动（Perception-Reasoning-Action）范式的基础Agent外，系统还提供了：

Graph: 用于表达子图嵌套结构，方便进行模块化设计。

Loop：用于表达循环结构，用语实现反思（Reflection）、多轮辩论等博弈模式。

Switch：Switch 能够根据运行时状态动态选择并激活特定分支，实现了复杂的动态路由控制。

无缝嵌套机制：任何一个 Graph 都可以作为子节点无限嵌套到更高维度的图中。通过 NodeTemplate 和 ComposedGraph 机制，开发者可以轻松实现分支级别的拓扑复用，减少代码冗余。

协议与上下文适配层

现代MAS应用不可避免地需要整合异构的外部组件（Memory、RAG、MCP等）。

MASFactory引入了两种适配器：

Message Adapter：将底层图结构与具体的通信协议解耦。开发者可以在不修改拓扑的前提下，自由切换 JSON Schema、Markdown 或定制化的通信协议。

Context Adapter：面对外部复杂的记忆系统、RAG、MCP，Context Adapter 提供了一个标准化的接口。它将异构上下文切片为标准单元，使得 MASFactory 能够像插拔 U 盘一样无缝对接到 LlamaIndex、Mem0 等前沿框架中。

混合编排与可视化交互层

在操作入口上，MASFactory 同时兼容代码开发（声明式、命令式）、可视化拖拽以及 Vibe Graphing。

值得注意的是，这三种方式不仅不冲突，反而可以在同一个大型项目中混合嵌套使用。你可以用代码硬编码一个底层极度严谨的工具子图，再用 Vibe Graphing 生成一个静态结构图，最后用可视化拖拽方式将他们组合在为一个完整的Workflow。

此外，MASFactory也提供一款深度集成的 VS Code 扩展工具——MASFactory Visualizer。它可以在代码编排阶段、拖拽式编排阶段、Vibe Graphing阶段、调试运行阶段提供全栈的可视化支持。

代码编排预览

拖拽式工作流设计

Vibe Graphing 交互

运行时监测与追踪

性能评估

MASFactory在 HumanEval、MBPP、BigCodeBench、SRDD、GAIA、MMLU-Pro 等七大覆盖代码生成与复杂推理的主流 Benchmark 上给出了具有说服力的数据。

实验表明，MASFactory 能够极为稳定且高效地复现当前业界最具代表性的系统（包括 ChatDev、MetaGPT、Agent Verse、CAMEL、HuggingGPT 等），且在多项指标上表现优于原始硬编码实现。

参考资料：

https://arxiv.org/abs/2603.06007

https://github.com/BUPT-GAMMA/MASFactory