
当我们还在习惯通过文字指令与AI助手对话,接受一段段文本形式的回复时,AI交互领域已经迎来了一次重要升级。1月26日,由Anthropic、OpenAI与社区维护者联合推出的Model Context Protocol(MCP,模型上下文协议)首个官方扩展——MCP Apps正式亮相,它打破了AI回复的文本局限,让AI工具能直接在对话界面中生成可交互的用户界面,从根本上重塑了AI助手的能力边界。
要理解MCP Apps的革命性意义,首先需要回溯MCP本身的价值。2024年11月,Anthropic推出MCP协议,旨在解决AI助手与现实世界数据、工具脱节的核心痛点。在此之前,每一次将AI与日历、文件系统或企业软件集成,都需要定制化开发,不同平台间的兼容性差、开发成本高。MCP的出现如同AI领域的USB-C接口,为AI模型与外部系统建立了标准化的连接方式。
MCP采用客户端-服务器架构,AI助手(如Claude Desktop或ChatGPT)作为客户端,连接到提供特定功能的MCP服务器——这些服务器可以对接谷歌日历、企业数据库,或是Figma这类专业工具。与传统AI只能被动接收数据不同,通过MCP协议,AI模型能在运行时主动调用工具,直接执行操作而非仅描述操作步骤。这一标准迅速获得行业认可:2025年3月OpenAI正式接入MCP,同年12月Anthropic将MCP捐赠给Linux基金会旗下的Agentic AI基金会,谷歌、微软、AWS等巨头纷纷加入,共同推动这一开放标准的发展。
而MCP Apps的到来,让MCP的能力实现了质的飞跃。此前,即便AI能通过MCP调用工具,最终输出仍局限于文本:查询日历得到的是文字版日程,数据分析结果是段落式总结,用户始终需要在“指令-文本”的循环中操作。MCP Apps改变了这一现状,它允许工具返回HTML格式的交互式界面,直接在对话窗口中渲染出仪表盘、表单、可视化图表甚至结账流程。
从技术层面看,MCP Apps采用沙箱iframe保障安全性:MCP服务器预先声明UI模板,客户端在隔离环境中渲染这些界面,有效防止恶意代码执行。这一设计让AI从单纯的对话伙伴,转变为承载可操作控件的界面层。用户无需反复输入指令,就能通过点击、拖拽等直观操作完成任务——比如在对话窗口中直接查看可点击的日历网格、 hover查看详情的数据分析图表,或是填写结账表单完成购物。
这种交互方式的转变带来了效率的显著提升。以数据分析为例,过去用户需要不断输入“按地区展示销售额”“筛选第四季度数据”“按营收排序”这类指令,每一步都要等待文本回复;而通过MCP Apps,AI会直接生成交互式数据表格,用户点击表头即可排序,拖动滑块就能筛选日期范围,AI则会根据用户的操作主动提供深度分析,比如“我注意到你在关注东北地区,这里是更详细的分析”。
目前,Anthropic已向Claude的Pro、Max、Team及企业版用户开放MCP Apps支持,首批合作方包括Amplitude、Asana、Box、Canva、Figma、Slack等知名工具,Salesforce的集成也即将上线。用户现在就能在Claude的对话界面中直接完成Asana项目 timeline 搭建、Slack消息编辑、Figma图表创作与修改、Box文件管理等操作,每个工具都能呈现原生UI,无需在不同应用间切换。
对于开发者,Anthropic发布了包含SDK和示例的ext-apps仓库,提供了Three.js 3D可视化、交互式地图、PDF查看、实时系统监控仪表盘、乐谱符号等参考实现。由于采用开放规范,开发者只需构建一次交互式工具,就能在所有支持该扩展的AI助手中运行。
MCP Apps延续了Anthropic开放标准的战略,该公司此前已将MCP工具连接协议、Agent Skills能力定制框架开源,如今又将交互式界面能力纳入开放生态。这一模式彻底颠覆了传统软件逻辑:不再是应用内置AI功能,而是让AI成为访问各类应用的统一界面。
当然,MCP Apps的普及仍面临挑战,比如开发者能否快速打造出有吸引力的应用,以及沙箱iframe架构能否有效应对在AI对话中运行任意Web界面的安全问题。但不可否认的是,MCP Apps为AI交互打开了新的大门,它让AI助手从“文字输出者”升级为“交互式界面提供者”,为更流畅、直观的AI工作流奠定了基础。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/mcp-apps-rang-ai-zhu-shou-cong-wen-ben-ying-da-zhuan-xiang