Skip to content

代理互操作性协议综述:MCP、ACP、A2A和ANP

本文基于学术论文《A Survey of Agent Interoperability Protocols: Model Context Protocol (MCP), Agent Communication Protocol (ACP), Agent-to-Agent Protocol (A2A), and Agent Network Protocol (ANP)》,对当前主要的代理互操作性协议进行了系统性总结,帮助开发者了解不同协议的特点、适用场景和实施路径。

引言

随着大型语言模型(LLM)的发展,基于LLM的自主代理系统在云端、边缘和桌面环境中得到广泛应用。这些代理需要摄取上下文信息、执行任务并与外部服务或工具交互。然而,当前代理系统之间的互操作性实践不一致且分散,使得集成、安全保障和扩展LLM驱动的代理之间的通信变得困难。

互操作性(不同代理和系统发现能力、交换上下文和无缝协调行动的能力)对于构建模块化、可重用和弹性的多代理工作流至关重要。标准化协议可以减少开发开销,提高安全性,并实现跨平台协作。

代理互操作性面临的挑战

尽管已经出现了多种开放协议,但在实际AI系统中实现无缝代理互操作性仍然面临诸多挑战:

  1. LLM上下文标准化缺失:LLM需要上下文信息才能产生准确输出,但现有应用架构没有统一的机制来向LLM提供结构化上下文,导致工具集成临时性强且行为不可靠。

  2. 异构代理之间的通信障碍:企业系统通常由使用不同技术栈和框架构建的代理组成,导致孤立行为和协作能力差。

  3. 统一代理协作标准的缺失:即使代理能够通信,也缺乏动态协商、能力共享和协调的共享框架。

  4. 开放网络中的代理发现和安全问题:在开放互联网环境中,代理需要安全地发现彼此并建立信任关系,但缺乏标准化的身份和验证机制。

四种主要代理互操作性协议

本文介绍四种新兴的代理通信协议,每种协议针对不同的互操作性层次:

1. 模型上下文协议 (Model Context Protocol, MCP)

核心定位:用于安全上下文摄取和结构化工具调用的JSON-RPC客户端-服务器接口。

主要特点

  • 提供标准化方式向LLM传递工具、数据集和采样指令
  • 支持灵活的即插即用工具
  • 确保安全的基础设施集成
  • 跨LLM供应商兼容

技术实现

  • 基于JSON-RPC的客户端-服务器架构
  • 支持类型化数据交换
  • 提供安全的工具调用机制

适用场景

  • 单一应用程序需要与LLM集成多种工具
  • 需要安全、结构化的LLM-工具交互
  • 作为代理系统的基础层

2. 代理通信协议 (Agent Communication Protocol, ACP)

核心定位:具有多部分消息、异步流和可观察性功能的REST原生性能消息层。

主要特点

  • 提供RESTful、无SDK依赖的接口
  • 支持异步优先交互
  • 允许离线发现
  • 实现供应商中立的执行
  • 在Linux基金会下开放治理

技术实现

  • 基于REST的API设计
  • 支持多部分消息格式
  • 提供异步流机制
  • 内置可观察性功能

适用场景

  • 本地多代理系统
  • 需要多模态代理响应的应用
  • 企业内部异构代理系统集成

3. 代理对代理协议 (Agent-to-Agent Protocol, A2A)

核心定位:使用基于能力的代理卡片通过HTTP和服务器发送事件进行企业级任务编排的点对点框架。

主要特点

  • 引入多模态通信标准
  • 支持动态交互
  • 基于能力的代理卡片系统
  • 适用于不透明、自主的代理

技术实现

  • 点对点通信架构
  • 基于HTTP和服务器发送事件(SSE)
  • 能力描述和发现机制
  • 任务委派和协调框架

适用场景

  • 企业级任务编排
  • 需要代理间动态协作的系统
  • 跨组织边界的工作流

4. 代理网络协议 (Agent Network Protocol, ANP)

核心定位:基于去中心化标识符(DIDs)和JSON-LD图构建的去中心化发现和协作协议。

主要特点

  • 支持开放网络代理发现
  • 提供安全协作机制
  • 使用去中心化标识符(DIDs)
  • 基于JSON-LD图的语义表示

技术实现

  • 去中心化身份和验证系统
  • 基于JSON-LD的语义数据模型
  • 开放网络发现机制
  • 安全协作框架

适用场景

  • 开放互联网代理市场
  • 需要去中心化信任的系统
  • 跨组织、跨网络的代理协作

协议比较与评估

这四种协议在多个维度上存在差异:

维度MCPACPA2AANP
交互模式客户端-服务器REST API点对点去中心化网络
发现机制静态配置服务注册能力卡片去中心化标识符
通信模式同步RPC异步REST事件流语义图交换
安全模型沙箱执行API密钥/OAuth能力验证去中心化身份
部署复杂性中高
扩展性有限良好良好极佳
标准成熟度中高初级初级

分阶段采用路线图

基于比较分析,论文提出了一个分阶段采用路线图:

  1. 第一阶段:MCP采用

    • 实现工具访问标准化
    • 建立安全的LLM-工具交互
    • 为更高级协议奠定基础
  2. 第二阶段:ACP集成

    • 添加多模态消息支持
    • 实现异步通信能力
    • 增强可观察性和监控
  3. 第三阶段:A2A实施

    • 启用协作任务执行
    • 建立基于能力的代理发现
    • 支持企业级工作流编排
  4. 第四阶段:ANP扩展

    • 构建去中心化代理市场
    • 实现跨组织代理协作
    • 建立开放网络信任框架

结论与未来方向

代理互操作性协议的发展对于构建安全、可互操作和可扩展的LLM驱动代理生态系统至关重要。MCP、ACP、A2A和ANP各自解决了不同层次的互操作性挑战,从基础工具访问到复杂的去中心化协作。

未来研究方向包括:

  • 协议之间的桥接和互操作性
  • 安全性和隐私保护增强
  • 多模态交互标准化
  • 跨语言和跨文化代理协作
  • 大规模分布式代理网络的治理模型

通过采用这些标准化协议,开发者可以构建更加模块化、安全和可扩展的代理系统,推动AI代理技术向更加开放和协作的方向发展。

参考资源


注:本文基于arXiv:2505.02279v1 [cs.AI] 论文整理,该论文发表于2025年5月4日。

基于 MIT 许可发布