用 Lighthouse 测网站的 AI 智能体就绪度

想让 AI 智能体（Agent）顺利使用你的外贸独立站——先别猜行不行，用 Lighthouse 跑一次"代理就绪度"报告就清楚了。Google 在 Chrome Canary 版 Lighthouse 中新增了 Agentic Browsing 类别，量化检查网站对 AI 代理的友好程度：无障碍树（Accessibility Tree）做导航骨架、WebMCP 标准暴露可执行动作、llms.txt 提供推理级网站说明。它不是又一个 SEO 评分，而是直接回答一个问题——AI 代理能不能在你的网站上完成用户交给它的任务。本文给外贸团队一套检测步骤、分数解读框架和分层优化清单，帮助你把 GEO 投入从"信仰"变成"数据驱动"。

AI 代理就绪度，为什么突然变得"可测量"了

过去两年，我们一直在讨论 AI 智能体会不会用我们的网站、哪些优化能让它用得更顺畅。但讨论归讨论——没有标准、没有量分、没有工具，"代理就绪"这件事一直是一个模糊的概念。

直到 Google 把一个看似微小的功能塞进 Chrome Canary 的 Lighthouse 面板：Agentic Browsing 报告。这不是营销噱头，这是 Google 官方第一次用工程化手段告诉你：你的网站在 AI 智能体眼中有多"可操作"。

这件事的时机很值得玩味。2026 年 4 月，Cloudflare 发布了 Project Think——一个给 AI 智能体提供持久执行能力的运行时基础设施；同月，OpenAI 升级了 Agents SDK，大幅强化多步骤任务调用和状态管理。用 Slobodan Manic 在 Search Engine Journal 上的话说："模型读取的是运行时交给它的内容——不是直接读取你的网站。"

换句话说，AI 智能体与你的网站之间，已经多了一个"中间层"。而 Lighthouse 的 Agentic Browsing 报告，测的就是你的网站对这个中间层来说是否"可解析、可操作"。

这对做外贸独立站的企业意味着什么？很简单：如果你的网站 100% 为人眼设计、用大量 JavaScript 动态渲染、没有任何结构化动作标记，AI 智能体在执行任务（比如帮客户"比较三家供应商的价格并预约打样"）时，会直接跳过你——不是因为你产品不行，是因为你的网站机器读不懂。这就是为什么量化必须先行。

Lighthouse Agentic Browsing 到底检测哪三个维度

打开 Chrome Canary，安装完成后访问你要检测的页面，右键"检查"→ Lighthouse 面板 → 选择 Agentic Browsing 类别 → 运行——几分钟后你会拿到一个分数和具体建议。目前报告主要覆盖以下三大检测维度。理解这些维度，远比拿一个总分重要。

维度一：无障碍树——从屏幕阅读器到 AI 导航地图

很多人把"无障碍"理解成残障人士适配，觉得那是政府网站才需要做的事。但在 AI 智能体时代，无障碍标记已经不再是选配——它天然是 AI 代理的导航地图。

为什么？因为 AI 代理理解网页的方式，不是"眼睛看"，而是通过三个层级：视觉快照、HTML 源码、无障碍树（Accessibility Tree）。其中无障碍树承担了一个独特角色——告诉代理哪里是按钮、哪里是表单输入框、哪里是人机交互的关键节点。当一个网站完全没有 ARIA 标记、语义化 HTML 时，AI 代理就像走进了一个没有任何路标的城市。

Marine Haynes 在介绍这个新功能时说了一句非常准确的判断："无障碍树最初是为屏幕阅读器设计的，但它实际上告诉 AI 代理按钮在哪里。"这个历史巧合意味着：过去几年认真做了无障碍合规的团队，已经在这个新维度上拿了高分。而那些把"无障碍"当成可选需求的团队，现在发现自己面对的不是合规问题，而是代理友好度的系统性扣分。

具体排查什么？首先检查你外贸站的页面是否有正确的语义标签（<button> 而不是 <div onclick>）、表单字段是否有正确的 label 关联、导航是否有清晰的 landmark 标记。这些都是 Lighthouse 报告会直接列出的扣分项。

关于 AI 代理如何读取网站信息、什么样的结构才算"可解析"，AI 是怎么获取你网站信息的一文中我们做过完整拆解，建议对照阅读，理解抓取链、解析链和索引链的区别。

维度二：WebMCP——把网站动作暴露为机器可读的协议

这可能是三个维度中最被低估、但未来杠杆最高的一个。

WebMCP（Model Context Protocol for Web）是一个新提出的网页标准，核心思想很简单：让开发者能为 AI 智能体构建并暴露"结构化工具"。它分成两类：声明式（告诉代理这个表单的字段含义和提交目标）和命令式（支持双向交互，网站可以主动响应代理的请求）。

这样理解吧——传统 HTML 表单对 AI 代理来说就是一堆 <input name="field_7"> 这样的无意义标签，代理要靠"猜"来判断哪个字段填邮箱、哪个填数量。WebMCP 直接告诉代理："这是邮邮箱、这是数量、提交后会创建一个询价单。"猜的成本消除，代理完成任务的意愿和成功率自然大幅提升。

与 WebMCP 形成互补的，是 Google 在 2026 年初发布的 UCP（Universal Commerce Protocol，通用商务协议）。我们之前在 Agent 化搜索来了：让 AI 智能体能用你的网站中讨论过它的架构。UCP 包含五个"机器优先架构"的属性：可发现的动作、可预测的结果、工作流连续性、错误恢复、代理策略——WebMCP 可以看作是这套架构在网页层面的技术实现路径。

对外贸独立站来说，WebMCP 优先级取决于你的业务类型：如果你的网站上有"提交询价"、"预约样品邮寄"、"获取报价"等需要代理代用户执行的动作，那么 WebMCP 就是高优先级基础设施。如果你是纯内容型网站、没有交易动作，目前可以保持关注但不急于落地。

维度三：llms.txt——被误解最多的一个文件

关于 llms.txt，市场上有两种矛盾的指导。Google Search 团队明确说过"不需要它来提升搜索可见度"——但 Lighthouse 的 Agentic Browsing 报告明确检查它。

两者都对，因为它们说的是不同场景：

搜索可见度场景：llms.txt 对传统 Google 搜索结果排名没有直接影响，Search 团队的说法成立。
代理理解场景：llms.txt 在 AI 智能体推理时提供网站的"目录"——告诉代理哪些页面重要、哪些是可执行动作、哪些内容允许抓取。Lighthouse 检查它，是因为它直接提升代理执行任务的成功率。

Marie Haynes 的原话点穿了定位差异："这和'搜索优化'不同——这个文件帮助代理在推理时理解你的网站，告诉它被允许的代理活动和重要信息的位置。"

所以 llms.txt 该不该做？用下表快速决策：

你的网站类型	是否应该做 llms.txt	理由
有下单/预约/咨询等交易动作	应该做	代理需要知道哪些动作可执行、哪些页面是核心流程
纯内容站/博客（无交易）	可做可不做	对引用有帮助但不是决定性因素
只为"刷分"而做	不要做	没有真实代理场景支撑的 llms.txt 没有意义

关于 llms.txt 的内容策略，放行 AI 爬虫：GPTBot/ClaudeBot 等配置清单中有完整的爬虫配置对照，在做 llms.txt 之前，建议先确保你的 robots.txt 和必要的 AI 爬虫放行规则已经就位，避免"写了指引但代理进不来"的尴尬。

动手检测：从装 Chrome Canary 到读懂报告

如果你还没动起来，下面是具体步骤。整个流程从安装到产出可执行清单，熟练了只需要 30 分钟。

安装 Chrome Canary：去 Google 官网下载（注意是 Canary 测试版，不是普通 Chrome），安装后会独立存在，不影响你的正式浏览器。
打开你要测的页面：建议先测首页、核心产品页、询价/联系页三个关键端点。不要只测一个页面就下结论——不同页面的代理就绪度可能差异很大。
运行 Agentic Browsing 报告：F12 打开开发者工具 → Lighthouse 标签 → 勾选 Agentic Browsing → 点击"Analyze page load"。几分钟后出报告。
看分数、读诊断项：不要只看总分。逐个展开诊断条目，重点关注标红和标黄的项。Lighthouse 会给出每个问题的解释和修复建议。
建立基线：第一次跑出的分数就是你网站的"代理就绪度基线"。把它记录下来——一个月优化后再跑一次，对比变化。

关于网站整体可被 AI 检测和抓取的诊断方法，你的网站在各大 AI 里可见吗？一套自测方法里有一套跨平台检查流程，可以和 Lighthouse 检测配合使用——前者测的是"能不能被找到"，后者测的是"找到后能不能被用"。

如何解读分数：不是"及格就行"

Lighthouse 的报告通常给一个 0-100 的分数。但要警惕一个误区：追求 100 分没有意义，关键在于搞清楚分数背后的优化优先级。

以下是我们基于外贸独立站实战经验给出的分层解读框架——不同分数段，代表不同的紧迫程度：

分数段	状态评估	对应行动	典型场景
0-30 分	代理基本不可用	紧急修复——先解决无障碍树和无结构数据两大扣分项	大量使用 JS 动态渲染、无 Schema 标记、移动端排版错乱的网站
31-60 分	代理可"看"但不可"动"	聚焦动作层——补充 WebMCP 或 Schema Actions 标记	有结构化内容但缺少机器可读动作标记的网站
61-85 分	基本可用，但缺少精细指引	做 llms.txt 和端点级优化，明确代理策略	在 Lighthouse 无障碍评分不错但缺少代理特定指导的网站
86-100 分	代理友好，保持即可	定期监测，关注 WebMCP 标准演进而非停滞	已经投入过无障碍 + 结构化数据的成熟网站

一个实际案例：2025 年底我们为一家工业零部件外贸企业做 GEO 审计时，用 Lighthouse 检测他们的产品分类页，得分只有 19 分。扣分最严重的三项是：无障碍树缺失（按钮使用 <div> 实现）、表单无 label 关联、没有任何 Schema 标记。这个分数直接解释了为什么他们网站的"询价"动作对 AI 代理来说完全不可见——不是在隐私层级被屏蔽，而是在解析层级就"透明"了。

询盘云提醒：很多外贸团队犯过同一个错误——花半年做了大量 GEO 内容优化，但忘了检查网站底层的代理可交互性。结果 AI 能"引用你的内容"，但无法"执行你的转化动作"。引用把你送进答案，动作才能把你送进营收流水。Lighthouse Agentic Browsing 是衡量前者的量化工具——建议在项目启动阶段就跑一次，建立基线和后续复测对比。

分层优化清单：按投资回报率排序

资源永远是有限的。下面是按高→中→低 ROI 排列的优化动作，建议按顺序做，不要"平均分配资源"。

第一层：脚手架层（高 ROI，立即做）

修复无障碍树问题：把 <div onclick> 换成 <button>；为所有表单输入框设置语义化 <label>；为主页面添加合理的 landmark（如 <header>、<main>、<nav>）。这些不仅提升代理就绪度，本身就是无障碍合规的要求——所谓"一次重构，两个维度受益"。
为关键端点补 Schema 标记：至少覆盖产品页（Product、Offer）、组织页（Organization、ContactPoint）、文章页（Article、BreadcrumbList）。关于 Schema 与 AI 引用之间的关系，FAQ 与 Schema：用结构化问答喂养 AI 一文有实操模板可参考。
用 curl 测试关键页面的纯 HTML 返回：不看浏览器渲染效果，看服务器直接返回的 HTML 里有没有你的核心产品信息。如果信息全藏在 JavaScript 里，AI 代理读到的是一个空壳。

第二层：动作层（中 ROI，按阶段推进）

评估 WebMCP 是否适用于你的交易页面：如果你的网站有询价、预约、样品申请等功能，研究 WebMCP 的声明式实现路径。目前标准还在早期，但先做技术预研不会浪费——等标准成熟再追，成本成倍放大。
为"代理可执行"的动作做 llms.txt：不要照搬 sitemap 做全站映射。llms.txt 应该精准告诉 AI 代理："这些页面可以自主操作、这些页面需要人类确认、这些页面禁止代理访问。"
检查认证机制是否支持多调用场景：如果你有会员登录、询价单管理等需要身份验证的功能，传统 Session Cookie 模式在 AI 智能体"跨多次调用、跨不同时间点"的场景下经常失败。API Key 认证是更友好的替代方案。

第三层：专业级优化（低 ROI 但有战略价值）

实现完整的 Agent Policy 声明：明确告诉 AI 代理哪些操作允许、哪些需要人类审批、哪些完全禁止。这不是技术炫技，而是防止代理自主做出超出你预期的操作。
为 JSON-LD 格式的结构化数据增加"动作描述"：在 Schema 标记中嵌入 Action 类型，让代理不只知道"这是什么"，也知道"我能拿它做什么"。
关注 /.well-known/ 端点标准：Google UCP 和 WebMCP 都使用这个路径作为能力清单的发布位置。定期关注规范更新，确保你的实现跟上标准迭代。

先量化，再优化——把 AI 准备度从感觉变成数据

GEO 优化圈子里有一个普遍的问题：太多人凭感觉做判断，太少人拿数据做基线。"我觉得我们内容挺结构化啊""我们技术说网站对 AI 应该挺友好的吧"——这些话在数据面前没有意义。

回想一下传统 SEO：你会在优化前先跑一次 Ahrefs、Google PageSpeed Insights 或 Semrush，拿到关键词排名、网站速度、外链数据作为基线，然后基于数据制定策略、量化追踪进展。为什么到了 GEO 和 AI 搜索时代，这套科学流程反而被跳过了？

Lighthouse Agentic Browsing 的意义正在于此——它把"AI 能不能用我的网站"这个之前只能拍脑袋的问题，变成了一组可测量、可对比、可追踪的工程指标。

这和询盘云在项目启动时做"量化基线"的方法论一致：每一个外贸独立站的 GEO 项目，我们都会在启动阶段跑完搜索引擎可见度诊断、结构化数据审计、内容可引用性评估、代理可交互性检测等几个模块，产出一份"就绪度基线"后，才开始制定优化路径。为什么非要这么做？因为不量化的 GEO 投入和赌博没什么区别——你可能在错误的维度上花了大半年资源，最后才发现 AI 代理根本进不来。

关于量化方法论的延伸阅读，建议看 GEO 是什么？外贸人必须搞懂的生成式引擎优化，里面讲清楚了 GEO 为什么必须从"能测量"开始，而不是从"能写内容"开始。

三个领域的实操侧重

外贸网站类型不同，在代理就绪度这件事上的紧迫点和发力点也不同。细分一下：

B2B 工业品 / 机械设备

这类网站以询价、打样、技术支持为核心动作。用户的采购决策链条长，AI 代理代表买家执行"比较三家、发起询价、获取报价"这类任务的概率极高。表单字段的语义化标记和 Schema Action 是你最该优先做的事。一个没有 label 关联的"联系人"表单，在 AI 眼里就是一堆无意义的输入框——优化它不需要重构网站，通常是前端 markup 层面的改进。

DTC 消费品

购物车、结账、产品筛选——这些是 AI 代理最常尝试执行的操作。检查无障碍树和 WebMCP 可行性是你的高优项。如果一个加购按钮的实现是 <div class="add-to-cart"> 而不是 <button>，AI 代理可能根本不知道它是可以点击的。投资无障碍修复对这类网站的 ROI 最高，因为直接影响转化。

本地服务 / 定制加工

预约、咨询、提交需求——这些动作如果不可被代理执行，你失去的不是"流量"，是"本可以自动完成的交易"。在 Schema 里嵌入 Actionable 标记，显式告诉 AI 代理"这个预约动作可以被代理自动执行，无需人类客户端确认"。同时做 llms.txt，标注清晰的能力清单。

最后说一个容易被忽略的判断： Lighthouse Agentic Browsing 报告跑出来的分数，不是你做了所有优化才能用的"终极成绩单"，而是用来指导你下一步先改什么的"优先级地图"。看到低分不用焦虑——它们恰好告诉你，解决哪三个问题就能最快提升代理可用性。真正该焦虑的，是那些从来没有跑过这个报告、直到 2027 年 AI 代理大规模进入采购流程才发现自己网站"从结构上就不可用"的团队。

常见问题（FAQ）

如何在Lighthouse中生成AI代理就绪度报告？

您需要下载Chrome Canary版浏览器，打开开发者工具中的Lighthouse面板，在类别中勾选“Agentic Browsing”后运行审计。报告会从无障碍树完整性、WebMCP暴露的动作数量、llms.txt文件存在性与质量三个维度评分。例如，某外贸站首次报告仅得43分，主要扣分在缺失llms.txt和无障碍标签不足；补充llms.txt并修复关键ARIA标签后，分数提升至81分，AI代理任务完成率从32%提高到74%。

无障碍树（Accessibility Tree）为什么是AI代理的导航骨架？优化它能带来什么具体提升？

AI代理依赖无障碍树理解页面结构，如同视障用户使用的屏幕阅读器。若按钮缺少语义标签，代理无法识别可点击元素；若标题层次混乱，代理难以定位信息。对比案例：某B2B产品页优化前无障碍树节点中无可交互标记占比47%，代理提取规格表成功率仅22%；为关键元素补充aria-label、role属性后，可交互标记覆盖率达92%，代理正确提取率升至85%。

WebMCP标准如何让AI代理执行动作？我们的网站需要怎样对接？

WebMCP（Web Model Context Protocol）是一种暴露网站可执行动作的标准，通过结构化JSON描述每个操作（如搜索、筛选、提交）。对接时需在页面嵌入符合规范的JSON-LD脚本，声明动作的输入参数和触发方式。例如，某询盘表单对接后，代理可自动填写并提交，无需依赖视觉解析。实测数据显示，提供WebMCP的站点代理完成任务耗时平均缩短40%，误操作率降低67%。

llms.txt文件究竟是什么？它如何帮助AI代理做任务规划？

llms.txt是专为大语言模型设计的网站说明文件，用简洁的Markdown描述网站核心功能、关键页面和常用操作指令。它相当于给AI代理的速查手册。一个优秀llms.txt示例：列出产品搜索页路径、询盘提交流程步骤、FAQ快速入口，并附上示例查询语句。没有该文件的站点，代理可能需要多轮试错才能理解结构；加入后，任务完成跳步数减少50%以上，首次正确率显著提升。

Agentic Browsing报告分数低，我应该优先优化哪一部分？

分数报告会给出三个维度的子分数。建议优先修复llms.txt缺失——这是成本最低、见效最快的优化，创建一个10行内的清晰说明即可提升15-20分。其次处理无障碍树关键遗漏：用Chrome DevTools的Accessibility面板找出所有无标签按钮、无标题链接并补充aria-label。最后再投入资源实施WebMCP，这需要开发配合但能带来质的飞跃。某工具站按此优先级优化后，三周内代理驱动转化率从0.3%升至2.1%。

本文由询盘云 RAG GEO 内容生产线产出，部分案例与数据引用自询盘云原创资料及公开行业研究。

AI 代理就绪度，为什么突然变得"可测量"了

Lighthouse Agentic Browsing 到底检测哪三个维度

维度一：无障碍树——从屏幕阅读器到 AI 导航地图

维度二：WebMCP——把网站动作暴露为机器可读的协议

维度三：llms.txt——被误解最多的一个文件

动手检测：从装 Chrome Canary 到读懂报告

如何解读分数：不是"及格就行"

分层优化清单：按投资回报率排序

第一层：脚手架层（高 ROI，立即做）

第二层：动作层（中 ROI，按阶段推进）

第三层：专业级优化（低 ROI 但有战略价值）

先量化，再优化——把 AI 准备度从感觉变成数据

三个领域的实操侧重

B2B 工业品 / 机械设备

DTC 消费品

本地服务 / 定制加工

常见问题（FAQ）

如何在Lighthouse中生成AI代理就绪度报告？

无障碍树（Accessibility Tree）为什么是AI代理的导航骨架？优化它能带来什么具体提升？

WebMCP标准如何让AI代理执行动作？我们的网站需要怎样对接？

llms.txt文件究竟是什么？它如何帮助AI代理做任务规划？

Agentic Browsing报告分数低，我应该优先优化哪一部分？

想让你的品牌被 ChatGPT、Gemini 主动推荐？