为什么在国内,A2A 协议行不通,而微信才是 Agent 通信的唯一正解
作者观点:Agent 通信的本质是即时通讯的延伸。在中国互联网"赢者通吃"的底层逻辑下,通用 Agent 基础设施只会收敛到一家——微信。A2A 这类开放协议在国内没有生存空间,但在企业私有化场景中,野火 IM 可以找到自己的位置。
1. 引言:Agent 通信——下一个十年的基础设施之战
1.1. 一个正在发生的未来
想象这样一个场景:
早上 8 点,你的个人 Agent 收到公司财务 Agent 的消息:"本月差旅预算还剩 3200 元,您申请的深圳出差预计花费 4500 元,超预算 1300 元。已为您生成三个方案:A. 缩减住宿标准;B. 申请追加预算(需要您的主管 Agent 审批);C. 取消行程。请确认。"
你回复"选 B,走审批"。你的 Agent 自动将申请提交给主管 Agent,主管 Agent 评估后转发给 HR Agent 核验编制,HR Agent 确认后通知财务 Agent 释放预算。全程没有人工介入,但你随时可以中断流程、查看状态、提出异议。
下午,你的采购 Agent 发现供应商 Agent 的报价异常波动,自动触发风控 Agent 的审计流程。风控 Agent 调取了该供应商过去 12 个月的交易记录、工商信息、舆情数据,生成风险评估报告,推送给你的微信。你扫了一眼,点击"同意继续交易"。
这不是科幻。这是Agent 通信(Agent-to-Agent Communication)正在描绘的商业图景。
1.2. 为什么 Agent 通信比 5G、云计算更重要
过去二十年,互联网解决了"人与信息"的连接(搜索引擎)、"人与人"的连接(社交网络)、"人与服务"的连接(平台经济)。
下一个二十年,要解决的是"智能体与智能体"的连接和"人与智能体"的连接。
当 AI 从"工具"进化为"Agent"(自主决策、自主执行、自主协作的数字员工),它们之间的通信效率将直接决定整个经济系统的运行效率:
- 企业层面:采购 Agent 与供应商 Agent 的谈判效率,决定供应链成本
- 金融层面:风控 Agent 与交易 Agent 的协同速度,决定风险敞口
- 政务层面:审批 Agent 与监管 Agent 的数据互通,决定公共服务质量
- 个人层面:你的健康 Agent、理财 Agent、出行 Agent 能否无缝协作,决定生活品质
Agent 通信协议,就是智能时代的 TCP/IP。 谁掌握了这个协议,谁就掌握了智能经济的底层操作系统。
1.3. 但这条路在国内走不通
开放协议的设计假设(去中心化、公网可达、跨域互信)与国内现实存在根本冲突。
国内的互联网土壤决定了:Agent 通信不会走开放协议路线,而会走平台聚合路线——和即时通讯一样,赢者通吃,只能有一家。
那一家,只能是微信。
2. 一、A2A 协议在国内行不通的五个硬伤
A2A(Agent-to-Agent)协议的设计初衷是构建一个开放的 Agent 互联网。但在国内落地时,它至少存在五个结构性缺陷:
2.1. 1. NAT 穿透:内网 Agent 无法互联
A2A 基于 HTTP(S) + SSE 的客户端-服务器模型,要求调用方知道被调用方的可访问端点 URL。这意味着:
- 位于企业内网、家庭网络、边缘设备上的 Agent,没有公网 IP,无法被直接发现
- 两个都在 NAT 后的 Agent 永远无法建立直连
- 必须依赖 Cloudflare Tunnel、ngrok 等第三方中继,引入中心化依赖和信任风险
在国内,大量企业核心系统部署在内网,A2A 的这一假设直接失效。
2.2. 2. 缺乏人机交互标准
A2A 定义了 INPUT_REQUIRED 状态,表示"需要人工输入",但:
- 没有规定"人如何接入这个对话流"——弹窗?邮件?IM 消息?电话?
- 没有定义人的身份认证、权限传递、显式同意机制
- 在需要人工审批、敏感数据访问的场景下,这是致命缺口
国内的业务流程高度依赖人工审批(财务、采购、合规),A2A 无法原生支持。
2.3. 3. 安全模型过于乐观
A2A 假设 Agent 之间是可信协作关系,但:
- 没有标准化的身份认证:Agent Card 可以自声明能力,谁来验证"这个 Agent 真的是它声称的那个"?
- 权限传递是黑箱:Agent A 委托 B,B 再调用 C,原始用户的权限如何沿链传递?没有委托令牌或能力衰减机制
- 敏感数据缺乏分级保护:两个 Agent 交换数据时,没有内置的数据敏感度标签或访问控制策略
在国内强监管环境下(等保、数据安全法、个人信息保护法),这种"信任假设"不可接受。
2.4. 4. 发现机制脆弱
A2A 的 Agent 发现依赖:
- 静态 URL(Agent Card 的
url字段) - 或企业内部的目录服务
这意味着:
- 没有全局去中心化发现能力,Agent 要么事先知道对方地址,要么依赖中心化注册表
- 动态网络适应性差:Agent 迁移、扩缩容、多实例负载均衡时,需要外部机制维护端点信息
在国内复杂的网络环境(多分支机构、混合云、VPN)下,这种静态发现机制几乎无法维护。
2.5. 5. 与监管合规的天然冲突
A2A 作为开放协议,设计理念是去中心化、跨域协作。但国内监管要求:
- 内容安全:所有通信内容必须可审核、可追溯
- 数据本地化:敏感数据不得出境,境内存储需满足等保要求
- 实名认证:服务提供者和使用者必须实名
- 算法备案:AI 服务需进行算法推荐备案
A2A 的开放架构与这些要求存在根本张力。协议本身不定义审核、审计、合规机制,全靠应用层补充,落地成本极高。
3. 二、为什么 Agent 通信和 IM 一样,只能是"赢者通吃"
3.1. 网络效应的数学本质
Agent 通信的价值遵循梅特卡夫定律:网络的价值与节点数的平方成正比。
- 如果平台 A 有 100 个 Agent,平台 B 有 100 个 Agent,但互不连通
- 每个平台的网络价值是 100² = 10,000
- 如果合并,网络价值是 200² = 40,000
- 分裂的总价值只有合并的 50%
这意味着:Agent 通信平台有极强的自然垄断倾向——用户和开发者会自发向最大的平台聚集,小平台因缺乏生态而消亡。
3.2. 中国互联网的历史验证
| 领域 | 主导者 | 格局 |
|---|---|---|
| 即时通讯 | 微信 | 一家独大,QQ 边缘化 |
| 移动支付 | 微信支付 + 支付宝 | 双寡头,但微信因社交粘性更强 |
| 短视频 | 抖音 | 快手生存但明显弱势 |
| 搜索 | 百度 | 一家独大 |
| 外卖 | 美团 | 饿了么被收购后边缘化 |
规律:中国互联网每个赛道最终都会收敛到"一家主导 + 边缘化生存者"。这不是行政垄断,是网络效应 + 用户习惯 + 资本集中的必然结果。
3.3. Agent 通信比 IM 更极端
Agent 通信相比 IM,有几个让垄断更强烈的因素:
| 因素 | 为什么加剧集中 |
|---|---|
| 互操作性刚需 | Agent 必须能互相发现、调用,分裂的生态 = 没有生态 |
| 信任基础设施 | 身份认证、支付担保、纠纷仲裁需要中心化背书 |
| 数据飞轮 | 平台掌握越多 Agent 行为数据,越能优化匹配和调度 |
| 监管便利 | 政府更愿意管理"一个平台"而非"百家争鸣" |
| 切换成本更高 | 不仅是关系链,还有训练数据、能力配置、业务逻辑 |
结论:在国内,通用 Agent 通信基础设施极大概率收敛到一家。这不是预测,是网络效应的数学必然。
4. 三、为什么是微信,而不是别人
4.1. 1. 基础设施已经赢了
| 维度 | 微信现状 |
|---|---|
| 用户覆盖 | 13 亿+ 月活,几乎等于"全民互联网" |
| 身份体系 | 实名认证 + 支付实名 + 企业微信认证,国内最完备 |
| 网络穿透 | 所有客户端连接腾讯服务器,NAT/防火墙问题不存在 |
| 推送到达 | 系统级保活,消息到达率接近 100% |
| 人机交互 | 聊天界面就是原生 UI,无需额外 App 或前端 |
这些不是"优势",是已经存在的沉没成本。任何替代方案重建这套基础设施,成本不可想象。
4.2. 2. 监管合规:微信是"预审核"的
国内 Agent 服务涉及内容安全、金融支付、数据出境、算法备案等监管要求。微信作为已经跑通全套监管流程的平台,Agent 开发者可以"搭便车":
- 内容审核复用微信现有机制
- 支付能力直接调用微信支付
- 数据存储在境内,合规默认满足
自建 A2A 基础设施,每一项都要单独过审,时间和成本极高。
4.3. 3. 企业入口:企业微信是现成的 B 端网络
- 企业微信已经连接了国内绝大多数企业的组织架构
- Agent 以"企微机器人"或"智能客服"形态部署,用户零学习成本
- 审批流、通知、群聊协作,都是现成的业务场景
4.4. 4. 生态锁定:关系链 + 习惯 + 数据
- 用户的社交关系链在微信,迁移成本无限大
- 企业的工作流程、审批习惯、文档沉淀都在微信/企微
- Agent 的训练数据、能力配置、业务逻辑一旦沉淀,切换成本比 IM 更高
这不是技术竞争,是生态位竞争。微信已经占据了"国民级通信基础设施"这个位置,Agent 通信只是这个基础设施的自然延伸。
5. 四、微信方案的具体好处
5.1. 对开发者
| 好处 | 说明 |
|---|---|
| 零基础设施成本 | 不需要自建服务器、NAT 穿透、推送服务、身份认证 |
| 用户触达零成本 | 13 亿用户已经在了,不需要教育市场 |
| 合规零成本 | 内容审核、实名认证、支付合规默认满足 |
| 快速迭代 | 基于微信 API 开发,周期以天计,而非月计 |
5.2. 对企业
| 好处 | 说明 |
|---|---|
| 员工零学习成本 | 在熟悉的聊天界面与 Agent 交互 |
| 审批流天然打通 | 利用微信的群聊、@提及、消息推送做人工介入 |
| 内外部协作一体 | 对内用企微,对外用微信,同一套 Agent 能力 |
| 数据可追溯 | 微信的消息记录天然满足审计要求 |
5.3. 对监管
| 好处 | 说明 |
|---|---|
| 单一入口管理 | 所有 Agent 通信经过微信,便于内容审核和行为审计 |
| 实名可追溯 | 微信实名体系覆盖所有 Agent 使用者 |
| 数据不出境 | 腾讯服务器在境内,满足数据本地化要求 |
当然,微信统一也有其代价:生态锁定、平台抽成、规则变动风险、数据主权让渡——这些"坏处"在开放竞争的语境下会被放大讨论。但在国内 Agent 通信的赛道上,由于网络效应的天然垄断性,市场最终仍会收敛于微信。只要微信不犯颠覆性错误,这个格局难以撼动。
6. 五、私有部署 IM 的春天:将迎来另一个爆发期
6.1. 野火 IM:私有即时通讯的杰出代表
野火 IM 不追求与微信在通用市场的竞争,而是专注于企业私有化场景——在那些微信无法覆盖或不适合覆盖的领域,提供不可替代的价值。
但在以下场景,野火 IM 有不可替代的价值:
| 场景 | 为什么必须是私有化 |
|---|---|
| 金融核心系统 | 交易数据、客户信息绝不能流经第三方平台 |
| 政务/涉密 | 等保三级/四级要求,数据必须物理隔离 |
| 大型集团内网 | 分支机构多、混合云架构,需要自主可控的通信层 |
| 工业物联网 | 工厂内网设备 Agent 通信,不能依赖公网 |
| 跨境企业 | 海外分支机构与国内的数据合规要求冲突,需要自主部署 |
6.2. 野火 IM 的定位:"企业内部的 Agent 操作系统"
| 层级 | 微信 | 野火 IM |
|---|---|---|
| 定位 | 国民级通信基础设施 | 企业私有化 Agent 协作层 |
| 部署方式 | 公有云,SaaS | 私有化部署,自主可控 |
| 数据主权 | 平台可见 | 企业完全掌控 |
| 网络环境 | 公网 | 纯内网、VPN、混合云 |
| 合规等级 | 通用合规 | 等保、密评、行业专属合规 |
核心逻辑:
- 企业内部 Agent 之间的协作,通过野火 IM 完成,数据不出域
- 需要人工介入或对外沟通时,也可以通过野火发送到人。
7. 六、结论
7.1. A2A 在国内行不通
不是因为技术不够先进,而是因为它的设计假设(开放互联网、去中心化、公网可达)与国内现实(强监管、内网为主、NAT 普遍)存在根本冲突。
7.2. Agent 通信和 IM 一样,赢者通吃
网络效应的数学本质决定了,通用 Agent 基础设施只会收敛到一家。这不是预测,是规律。
7.3. 微信是最佳最快方案
因为它已经占据了"国民级通信基础设施"这个位置,Agent 通信只是自然延伸。开发者零基础设施成本、企业零学习成本、监管零额外负担。
7.4. 野火 IM 的出路在企业私有化
不与微信正面竞争,而是守住"数据不出域、自主可控"的刚需场景。成为企业内部的 Agent 协作层,通过微信网关对外连接,形成互补而非替代。
最后的话:开放协议与平台路线的选择,不是技术优劣之争,而是场景适配之辨。A2A 追求的是全球互联的通用标准,微信追求的是国内场景的最优解——两者目标不同,本无高下。在国内,微信以其基础设施的完备性、监管的预合规性和用户的零迁移成本,成为 Agent 通信落地最快、阻力最小的路径。而野火 IM 的价值,在于为那些数据不能出域、网络不能触公、合规不能妥协的企业,提供与微信同等品质、但完全自主可控的私有化替代方案。微信覆盖广度,野火 IM 守护深度——这不是竞争,而是分工。
在 Agent 通信的浪潮中,野火 IM 正积极探索与 Agent 的深度集成能力,致力于成为企业私有化场景下 Agent 协作的优先选择。