结构化数据完整指南：用 Schema Markup 让 Google 和 AI 真正理解你的页面

你的页面在 Google 眼里是什么？一段文字、几张图片、一个标题——仅此而已。搜索引擎能 "读" 网页，但不一定能 "理解" 网页。结构化数据（Structured Data）就是你主动告诉搜索引擎 "这段内容是什么、关于谁、属于哪个类别" 的方式。

具体来说，Schema Markup 是基于 Schema.org 词汇表的一套标记规范。你把它嵌入 HTML，搜索引擎就能精确提取页面中的实体、属性和关系——而不是靠猜。

2026 年，结构化数据的价值远不止 "拿个富片段"。当 AI 搜索引擎（ChatGPT、Gemini、Perplexity）需要从海量网页中提取事实来生成回答时，结构化数据为它们提供了最可靠的信号源。它已经从 SEO 加分项变成了 AI 可见性的底层基础设施。

为什么结构化数据在 2026 年比以往更重要

富片段带来的直接收益

最直观的好处：结构化数据让你的搜索结果 "变大"。Google 会根据你标记的 Schema 类型，在搜索结果中展示评分星级、价格区间、FAQ 折叠、操作步骤、视频缩略图等富片段（Rich Snippets）。

数据说话：Google 官方文档明确指出，结构化数据是触发富媒体搜索结果的前提条件。多项行业研究表明，带富片段的结果比纯文本结果的点击率（CTR）平均高出 20-30%。在竞争激烈的 SERP 中，这个差距可以决定你是被点击还是被忽略。

AI 搜索引擎的新依赖

传统搜索引擎花了二十年学会从非结构化文本中提取信息。AI 搜索引擎更聪明，但也更 "懒"——它们优先消费已经结构化的数据，因为提取成本最低、准确度最高。

当 AI Overviews 需要回答 "这款产品多少钱" 时，它不会去解析你页面里的一段描述文字，而是直接读取 Product Schema 中的 price 属性。当 ChatGPT 需要判断一篇文章的作者是否可信时，Article Schema 中的 author 和 publisher 字段提供了最直接的信号。

这意味着：没有结构化数据的页面，在 AI 搜索中被正确引用的概率显著降低。结构化数据正在成为 AIO 优化的重要组成部分。

E-E-A-T 信号的机器可读表达

Google 的 E-E-A-T 框架（Experience, Expertise, Authoritativeness, Trustworthiness）评估内容质量时，需要判断 "谁写的、在哪发布的、凭什么可信"。结构化数据让这些信号变得机器可读：

author 字段关联到作者实体（Person Schema），包含职位、隶属机构、社交链接
publisher 字段关联到组织实体（Organization Schema），包含品牌名、Logo、官网
datePublished 和 dateModified 表明内容的时效性
citation 和 isBasedOn 标明内容的来源和依据

这些字段不是排名因素本身，但它们帮助 Google 的质量评估系统更快、更准确地判断你的内容是否可信。

Google 支持的 8 种常用 Schema 类型

Schema.org 定义了数百种类型，但 Google 目前明确支持并可能触发富媒体结果的只有几十种。以下是实际使用频率最高、收益最明确的 8 种，附完整的 JSON-LD 代码示例。

1. Article — 文章

适用于博客文章、新闻报道、深度分析。正确标记后可在 Google 搜索和 Google News 中获得增强展示（标题、发布时间、作者头像等）。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "Schema Markup 结构化数据完全指南",
  "description": "从基础概念到 AI 搜索实战，覆盖 8 种 Google 支持的结构化数据类型。",
  "image": "https://example.com/schema-guide-cover.jpg",
  "author": {
    "@type": "Person",
    "name": "Linus",
    "url": "https://seo.yiguotech.com/about"
  },
  "publisher": {
    "@type": "Organization",
    "name": "翼果科技",
    "logo": {
      "@type": "ImageObject",
      "url": "https://seo.yiguotech.com/logo.png"
    }
  },
  "datePublished": "2026-03-05",
  "dateModified": "2026-03-05"
}
</script>

要点：headline 不要超过 110 个字符。image 建议宽度不低于 1200px。如果是新闻类内容，可用 NewsArticle 替代 Article。

2. Product — 商品

适用于电商产品页。正确标记后可触发价格、库存状态、评分等富片段，对点击率影响最直接。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Product",
  "name": "Ahrefs SEO 工具套件",
  "image": "https://example.com/ahrefs-product.jpg",
  "description": "一站式 SEO 工具平台，覆盖关键词研究、外链分析、排名追踪等核心功能。",
  "brand": {
    "@type": "Brand",
    "name": "Ahrefs"
  },
  "offers": {
    "@type": "Offer",
    "url": "https://example.com/ahrefs",
    "priceCurrency": "USD",
    "price": "99",
    "priceValidUntil": "2026-12-31",
    "availability": "https://schema.org/InStock"
  },
  "aggregateRating": {
    "@type": "AggregateRating",
    "ratingValue": "4.7",
    "reviewCount": "3200"
  }
}
</script>

要点：offers 中的 price 必须与页面可见价格一致，否则会被 Google 判为误导性标记（Misleading Structured Data）并触发手动操作（Manual Action）。

3. FAQPage — 常见问题

适用于页面中包含问答对的内容。正确标记后，问答会以折叠形式直接展示在搜索结果中，大幅增加 SERP 占位面积。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [
    {
      "@type": "Question",
      "name": "什么是结构化数据？",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "结构化数据是一种标准化的格式，用于向搜索引擎提供页面内容的明确信息。它基于 Schema.org 词汇表，通过 JSON-LD 格式嵌入 HTML 页面。"
      }
    },
    {
      "@type": "Question",
      "name": "Schema Markup 会直接影响排名吗？",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "Schema Markup 本身不是排名因素，但它能触发富片段、提升点击率，间接影响排名表现。同时，它帮助搜索引擎更准确地理解内容，提高内容与查询的匹配度。"
      }
    }
  ]
}
</script>

要点：2023 年起 Google 收紧了 FAQ 富片段的展示条件，目前仅对政府和医疗权威网站保留 SERP 中的 FAQ 展示。但 FAQ Schema 仍然有助于 AI 搜索引擎理解你的问答结构，不建议因为富片段缩水就移除标记。

4. HowTo — 操作步骤

适用于教程、指南、操作流程类内容。正确标记后可展示分步骤的操作指引。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "HowTo",
  "name": "如何在网站中添加 Schema Markup",
  "description": "使用 JSON-LD 格式为网页添加结构化数据的完整步骤。",
  "step": [
    {
      "@type": "HowToStep",
      "name": "确定页面类型",
      "text": "根据页面内容选择合适的 Schema 类型，如 Article、Product 或 FAQPage。"
    },
    {
      "@type": "HowToStep",
      "name": "编写 JSON-LD 代码",
      "text": "按照 Schema.org 规范编写 JSON-LD 代码块，填入页面的具体属性值。"
    },
    {
      "@type": "HowToStep",
      "name": "嵌入 HTML 页面",
      "text": "将 JSON-LD 代码块放入页面的 <head> 或 <body> 中的 <script type='application/ld+json'> 标签内。"
    },
    {
      "@type": "HowToStep",
      "name": "测试并验证",
      "text": "使用 Google Rich Results Test 验证标记是否正确，修复所有错误和警告。"
    }
  ]
}
</script>

要点：与 FAQ 类似，HowTo 的 SERP 富片段展示也在收紧。但作为内容结构的机器可读描述，它对 AI 搜索的价值依然明确。

5. Organization — 组织

适用于公司官网首页或 "关于我们" 页面。帮助 Google 知识面板（Knowledge Panel）展示品牌信息。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Organization",
  "name": "翼果科技",
  "url": "https://seo.yiguotech.com",
  "logo": "https://seo.yiguotech.com/logo.png",
  "description": "专注 SEO 与 AI 搜索优化的技术顾问团队。",
  "sameAs": [
    "https://www.linkedin.com/company/yiguotech",
    "https://twitter.com/yiguotech"
  ],
  "contactPoint": {
    "@type": "ContactPoint",
    "telephone": "+65-XXXX-XXXX",
    "contactType": "customer service",
    "availableLanguage": ["Chinese", "English"]
  }
}
</script>

要点：sameAs 字段关联品牌的社交媒体主页，帮助 Google 建立品牌实体图谱。这对 AI 搜索引擎判断品牌权威性也有帮助。

6. LocalBusiness — 本地商家

适用于有实体经营地址的企业。标记后可增强 Google 本地搜索和地图的展示。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "LocalBusiness",
  "name": "翼果科技新加坡办公室",
  "image": "https://seo.yiguotech.com/office.jpg",
  "address": {
    "@type": "PostalAddress",
    "streetAddress": "1 Raffles Place",
    "addressLocality": "Singapore",
    "postalCode": "048616",
    "addressCountry": "SG"
  },
  "geo": {
    "@type": "GeoCoordinates",
    "latitude": 1.2847,
    "longitude": 103.8510
  },
  "telephone": "+65-XXXX-XXXX",
  "openingHoursSpecification": {
    "@type": "OpeningHoursSpecification",
    "dayOfWeek": ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday"],
    "opens": "09:00",
    "closes": "18:00"
  }
}
</script>

要点：LocalBusiness 有大量子类型（Restaurant、Dentist、AutoRepair 等），优先使用更具体的子类型。地址信息必须与 Google Business Profile 中的注册信息一致。

7. BreadcrumbList — 面包屑导航

适用于任何有层级结构的网站。标记后搜索结果中的 URL 会以面包屑路径展示，提升用户对页面位置的理解。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "BreadcrumbList",
  "itemListElement": [
    {
      "@type": "ListItem",
      "position": 1,
      "name": "首页",
      "item": "https://seo.yiguotech.com"
    },
    {
      "@type": "ListItem",
      "position": 2,
      "name": "干货观点",
      "item": "https://seo.yiguotech.com/categories/seo-secrets"
    },
    {
      "@type": "ListItem",
      "position": 3,
      "name": "Schema Markup 结构化数据指南"
    }
  ]
}
</script>

要点：最后一项（当前页面）不需要 item 属性。面包屑标记应与页面上实际可见的面包屑导航一致。这是实施成本最低、收益最确定的 Schema 类型之一，建议所有网站优先部署。

8. VideoObject — 视频

适用于嵌入视频内容的页面。标记后可在搜索结果中展示视频缩略图、时长、上传日期等信息。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "VideoObject",
  "name": "Schema Markup 入门教程",
  "description": "5 分钟学会用 JSON-LD 为网页添加结构化数据。",
  "thumbnailUrl": "https://example.com/video-thumbnail.jpg",
  "uploadDate": "2026-03-01",
  "duration": "PT5M30S",
  "contentUrl": "https://example.com/video.mp4",
  "embedUrl": "https://www.youtube.com/embed/xxxxx"
}
</script>

要点：duration 使用 ISO 8601 时长格式（PT5M30S = 5 分 30 秒）。如果视频托管在 YouTube，embedUrl 比 contentUrl 更实用。2025 年起 Google 要求视频页面的主要内容必须是视频本身，纯文本页面附带一个嵌入视频不会触发视频富片段。

JSON-LD 为什么是推荐格式

Schema Markup 有三种实现格式：JSON-LD、Microdata 和 RDFa。Google 官方明确推荐 JSON-LD，理由很直接：

与 HTML 解耦：JSON-LD 作为独立的 <script> 块嵌入页面，不需要修改现有的 HTML 结构。Microdata 和 RDFa 需要在 HTML 标签上添加属性（itemscope、itemprop、typeof），侵入性强，维护成本高。
便于动态生成：JSON-LD 是标准 JSON，可以通过后端模板、CMS 插件或 JavaScript 动态注入，适合自动化。
不影响渲染：JSON-LD 不参与页面渲染，不会影响 CSS 布局或 JavaScript 行为。
调试友好：JSON 格式的错误比散布在 HTML 属性中的标记更容易定位和修复。

唯一例外：BreadcrumbList 在某些场景下也可以用 Microdata 实现，因为面包屑本身就是 HTML 结构的一部分。但如果你的站点已经统一使用 JSON-LD，保持一致即可。

在不同平台上实施结构化数据

WordPress

WordPress 生态有成熟的 Schema 插件。Yoast SEO 和 Rank Math 都内置了结构化数据功能，能自动为文章、页面、作者生成 Article、Person、Organization 等基础 Schema。对大多数站点来说，安装插件 + 正确配置 = 完成 80% 的工作。

需要自定义 Schema（比如 Product、FAQ）时，可以用 Rank Math 的 Schema 模板功能，或直接在主题的 header.php / footer.php 中注入 JSON-LD 代码块。

Shopify

Shopify 的默认主题会自动生成 Product 和 BreadcrumbList Schema。但默认实现通常不够完整——缺少 aggregateRating、brand、sku 等重要属性。建议：

在 theme.liquid 或产品模板中手动补全 JSON-LD
或使用 Schema 专用 App（如 JSON-LD for SEO by Little Stream Software）
用 Google Rich Results Test 逐页验证，确保无缺失属性

自定义站点（Headless CMS / SSR 框架）

如果你的站点使用 Next.js、Nuxt.js 或其他 Headless 架构，结构化数据需要在构建层或渲染层注入。关键原则：JSON-LD 必须出现在服务端渲染的 HTML 中，不能依赖客户端 JavaScript 动态插入。

原因很简单：AI 爬虫不执行 JavaScript。如果你的 JSON-LD 是通过 useEffect 或 onMounted 在客户端注入的，Googlebot 能看到（因为 Google 会渲染 JS），但 GPTBot、ClaudeBot 完全看不到。这与 JS 渲染对 SEO 的影响是同一个底层问题。

在 Next.js 中，推荐在 Server Component 或 generateMetadata 中输出 JSON-LD；在 Nuxt.js 中，使用 useHead 或 useSchemaOrg 组合式函数。确保 HTML 源代码（View Source）中能直接看到完整的 <script type="application/ld+json"> 块。

结构化数据与 AI 搜索：被低估的连接

传统 SEO 语境下，结构化数据的价值主要是富片段和点击率。但在 AI 搜索时代，它的角色发生了质变。

AI 搜索引擎如何消费结构化数据

AI 搜索引擎（Google Gemini、ChatGPT Search、Perplexity）生成回答时需要从网页中提取 "事实"。它们的提取管道大致分两层：

结构化层：优先读取 JSON-LD、HTML 表格、定义列表（<dl>）等结构化内容
非结构化层：对自然语言段落进行 NER（命名实体识别）和关系提取

结构化层的提取成本低、准确率高，因此在 AI 系统的信息提取优先级中天然排在前面。这与 Google 自身的 Hummingbird 算法从关键词匹配转向语义理解的演进方向一致——搜索引擎越来越依赖实体和关系，而非简单的字符串匹配。一个标记了 Product Schema 且包含 price、brand、aggregateRating 的页面，比一段描述了同样信息的自然语言段落，更容易被 AI 正确引用。

对 AI Overviews 的具体影响

AI Overviews 在生成搜索结果摘要时，会引用网页内容作为事实来源。结构化数据在这个过程中的作用包括：

实体消歧：Schema 中的 @type 帮助 AI 区分 "Apple（公司）" 和 "apple（水果）"。Google 的 BERT 算法虽然增强了对上下文语义的理解能力，但明确的 Schema 标记仍然是最可靠的消歧手段
属性提取：price、datePublished、author 等字段让 AI 直接获取结构化事实，无需从文本中推断
可信度信号：publisher、author 与已知实体的关联度影响 AI 的引用倾向。Google 的实体排名指标专利揭示了搜索引擎如何评估实体的权威性和相关性

结合页面的语义化 HTML 结构和清晰的 Schema 标记，你的内容在 AI 搜索中被正确理解和引用的概率会显著提高。这不是理论推测——Google 在 2025 年更新的结构化数据开发者文档中已经明确提到，结构化数据帮助 Google "理解页面内容并在搜索功能中展示"。

Schema 与内容可提取性

AI 搜索优化的核心之一是可提取性（Extractability）——你的内容能否被 AI 系统干净地提取为独立事实。结构化数据天然服务于这个目标：

FAQ Schema 中每个问答对 = 一个可独立提取的事实单元
HowTo Schema 中每个步骤 = 一个可独立引用的操作指令
Product Schema 中每个属性 = 一个无需推断的结构化事实

这与 AIO 优化中强调的 "内容分块" 原则高度一致。Schema Markup 本质上就是在告诉 AI："这块内容的边界在哪，它的类型是什么，核心属性是哪些。"

测试与监控

结构化数据写完了不等于生效了。验证和持续监控是不可跳过的环节。

Google Rich Results Test

Rich Results Test 是 Google 官方提供的在线测试工具。输入 URL 或直接粘贴代码，它会告诉你：

检测到了哪些 Schema 类型
是否符合富片段展示的要求
有哪些错误（Error）和警告（Warning）

错误必须修复（否则富片段不会触发），警告建议修复（缺少推荐属性会降低展示效果）。

Schema Markup Validator

Schema Markup Validator（由 Schema.org 官方维护）比 Rich Results Test 更严格——它不仅检查 Google 支持的类型，还验证所有 Schema.org 规范的合规性。如果你的标记需要同时服务于 Google、Bing 和 AI 搜索引擎，建议两个工具都用。

Google Search Console 增强功能报告

Google Search Console 的 "增强功能"（Enhancements）板块会持续监控你整个站点的结构化数据状态。它会报告：

每种 Schema 类型的有效页面数
出现错误的页面清单
最近的变化趋势（新增错误或错误修复）

建议每周检查一次。特别是在 CMS 升级、主题更换或模板修改后，结构化数据容易意外损坏。

常见错误与避坑指南

标记与页面内容不一致

这是最严重的错误。Google 明确规定：结构化数据中的信息必须与页面上用户可见的内容一致。典型违规场景：

Product Schema 中标价 $49，页面上显示 $99
Article Schema 中的 author 是一个真实的人名，但文章实际上是 AI 生成的
FAQ Schema 中的问答在页面上根本不可见（用 CSS display:none 隐藏）

后果：Google 可能发出手动操作（Manual Action），直接移除你的所有富片段资格，甚至降低页面排名。

过度标记

不是标记越多越好。常见的过度标记行为：

给每个页面都加上 FAQ Schema，即使页面并没有问答内容
在一个页面上堆叠 5-6 种不相关的 Schema 类型
为页面中一句话的内容创建 HowTo Schema

原则：只标记页面上确实存在且对用户有价值的内容。 Schema 是内容的机器可读描述，不是凭空创造内容。

缺少必填属性

每种 Schema 类型都有必填（Required）和推荐（Recommended）属性。Google 的 Rich Results Test 会明确标出缺失项。常见遗漏：

Article 缺少 image（Google 强烈推荐，影响 Discover 和 Top Stories 展示）
Product 缺少 offers（没有价格信息的 Product Schema 几乎没有价值）
VideoObject 缺少 thumbnailUrl（视频富片段的强制要求）

嵌套错误

Schema 类型之间有嵌套关系（如 Article 中嵌套 Person 作为 author）。常见错误：

把嵌套类型写成字符串而非对象："author": "Linus" 应改为 "author": {"@type": "Person", "name": "Linus"}
嵌套层级不符合 Schema.org 规范：比如在 Product 中直接嵌套 FAQPage（FAQ 应该是页面级类型，不应嵌套在 Product 内）

未考虑技术 SEO 基础

结构化数据不是孤立存在的。如果页面本身有技术问题——被 robots.txt 屏蔽、返回 404、加载时间超过 5 秒——再完美的 Schema 标记也没有意义。确保你的技术 SEO 基础健全，再在上面叠加结构化数据。

翼果洞察

结构化数据在 2026 年的价值已经分化成两个层面：

第一层是传统层面——富片段、点击率、SERP 占位。这个价值依然存在，但因为 Google 收紧了 FAQ 和 HowTo 的展示条件，ROI 在下降。

第二层是 AI 层面——帮助 AI 搜索引擎理解你的内容实体、属性和关系。这个价值正在快速上升。当 AI Overviews 需要引用一个产品的价格时，JSON-LD 中的 price 字段比页面上一句 "售价 99 美元" 更容易被正确提取。

实操建议：优先部署 BreadcrumbList + Article/Product + Organization 这三层基础 Schema，覆盖全站。然后针对重点页面补充 FAQ、HowTo、VideoObject 等细分类型。不要追求标记数量，追求标记与内容的一致性和完整性。对于中小企业而言，结构化数据也是在 AI 搜索中建立可见性的低成本切入点。

最后一个容易被忽视的点：定期用 curl 或无头浏览器检查你的 JSON-LD 是否出现在服务端返回的 HTML 中。如果你的结构化数据是客户端注入的，Googlebot 能看到，但 AI 爬虫看不到——和 SSR 渲染的问题如出一辙。

分享