Linus
Linus

原文发布于

2026年03月05日

/

最新更新于

2026年03月05日

/

阅读

3
1

结构化数据完整指南:用 Schema Markup 让 Google 和 AI 真正理解你的页面

你的页面在 Google 眼里是什么?一段文字、几张图片、一个标题——仅此而已。搜索引擎能 "读" 网页,但不一定能 "理解" 网页。结构化数据(Structured Data)就是你主动告诉搜索引擎 "这段内容是什么、关于谁、属于哪个类别" 的方式。

具体来说,Schema Markup 是基于 Schema.org 词汇表的一套标记规范。你把它嵌入 HTML,搜索引擎就能精确提取页面中的实体、属性和关系——而不是靠猜。

2026 年,结构化数据的价值远不止 "拿个富片段"。当 AI 搜索引擎(ChatGPT、Gemini、Perplexity)需要从海量网页中提取事实来生成回答时,结构化数据为它们提供了最可靠的信号源。它已经从 SEO 加分项变成了 AI 可见性的底层基础设施

为什么结构化数据在 2026 年比以往更重要

富片段带来的直接收益

最直观的好处:结构化数据让你的搜索结果 "变大"。Google 会根据你标记的 Schema 类型,在搜索结果中展示评分星级、价格区间、FAQ 折叠、操作步骤、视频缩略图等富片段(Rich Snippets)。

数据说话:Google 官方文档明确指出,结构化数据是触发富媒体搜索结果的前提条件。多项行业研究表明,带富片段的结果比纯文本结果的点击率(CTR)平均高出 20-30%。在竞争激烈的 SERP 中,这个差距可以决定你是被点击还是被忽略。

AI 搜索引擎的新依赖

传统搜索引擎花了二十年学会从非结构化文本中提取信息。AI 搜索引擎更聪明,但也更 "懒"——它们优先消费已经结构化的数据,因为提取成本最低、准确度最高。

AI Overviews 需要回答 "这款产品多少钱" 时,它不会去解析你页面里的一段描述文字,而是直接读取 Product Schema 中的 price 属性。当 ChatGPT 需要判断一篇文章的作者是否可信时,Article Schema 中的 authorpublisher 字段提供了最直接的信号。

这意味着:没有结构化数据的页面,在 AI 搜索中被正确引用的概率显著降低。结构化数据正在成为 AIO 优化的重要组成部分。

E-E-A-T 信号的机器可读表达

Google 的 E-E-A-T 框架(Experience, Expertise, Authoritativeness, Trustworthiness)评估内容质量时,需要判断 "谁写的、在哪发布的、凭什么可信"。结构化数据让这些信号变得机器可读:

  • author 字段关联到作者实体(Person Schema),包含职位、隶属机构、社交链接
  • publisher 字段关联到组织实体(Organization Schema),包含品牌名、Logo、官网
  • datePublisheddateModified 表明内容的时效性
  • citationisBasedOn 标明内容的来源和依据

这些字段不是排名因素本身,但它们帮助 Google 的质量评估系统更快、更准确地判断你的内容是否可信。

Google 支持的 8 种常用 Schema 类型

Schema.org 定义了数百种类型,但 Google 目前明确支持并可能触发富媒体结果的只有几十种。以下是实际使用频率最高、收益最明确的 8 种,附完整的 JSON-LD 代码示例。

1. Article — 文章

适用于博客文章、新闻报道、深度分析。正确标记后可在 Google 搜索和 Google News 中获得增强展示(标题、发布时间、作者头像等)。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "Schema Markup 结构化数据完全指南",
  "description": "从基础概念到 AI 搜索实战,覆盖 8 种 Google 支持的结构化数据类型。",
  "image": "https://example.com/schema-guide-cover.jpg",
  "author": {
    "@type": "Person",
    "name": "Linus",
    "url": "https://seo.yiguotech.com/about"
  },
  "publisher": {
    "@type": "Organization",
    "name": "翼果科技",
    "logo": {
      "@type": "ImageObject",
      "url": "https://seo.yiguotech.com/logo.png"
    }
  },
  "datePublished": "2026-03-05",
  "dateModified": "2026-03-05"
}
</script>

要点headline 不要超过 110 个字符。image 建议宽度不低于 1200px。如果是新闻类内容,可用 NewsArticle 替代 Article

2. Product — 商品

适用于电商产品页。正确标记后可触发价格、库存状态、评分等富片段,对点击率影响最直接。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Product",
  "name": "Ahrefs SEO 工具套件",
  "image": "https://example.com/ahrefs-product.jpg",
  "description": "一站式 SEO 工具平台,覆盖关键词研究、外链分析、排名追踪等核心功能。",
  "brand": {
    "@type": "Brand",
    "name": "Ahrefs"
  },
  "offers": {
    "@type": "Offer",
    "url": "https://example.com/ahrefs",
    "priceCurrency": "USD",
    "price": "99",
    "priceValidUntil": "2026-12-31",
    "availability": "https://schema.org/InStock"
  },
  "aggregateRating": {
    "@type": "AggregateRating",
    "ratingValue": "4.7",
    "reviewCount": "3200"
  }
}
</script>

要点offers 中的 price 必须与页面可见价格一致,否则会被 Google 判为误导性标记(Misleading Structured Data)并触发手动操作(Manual Action)。

3. FAQPage — 常见问题

适用于页面中包含问答对的内容。正确标记后,问答会以折叠形式直接展示在搜索结果中,大幅增加 SERP 占位面积。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [
    {
      "@type": "Question",
      "name": "什么是结构化数据?",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "结构化数据是一种标准化的格式,用于向搜索引擎提供页面内容的明确信息。它基于 Schema.org 词汇表,通过 JSON-LD 格式嵌入 HTML 页面。"
      }
    },
    {
      "@type": "Question",
      "name": "Schema Markup 会直接影响排名吗?",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "Schema Markup 本身不是排名因素,但它能触发富片段、提升点击率,间接影响排名表现。同时,它帮助搜索引擎更准确地理解内容,提高内容与查询的匹配度。"
      }
    }
  ]
}
</script>

要点:2023 年起 Google 收紧了 FAQ 富片段的展示条件,目前仅对政府和医疗权威网站保留 SERP 中的 FAQ 展示。但 FAQ Schema 仍然有助于 AI 搜索引擎理解你的问答结构,不建议因为富片段缩水就移除标记。

4. HowTo — 操作步骤

适用于教程、指南、操作流程类内容。正确标记后可展示分步骤的操作指引。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "HowTo",
  "name": "如何在网站中添加 Schema Markup",
  "description": "使用 JSON-LD 格式为网页添加结构化数据的完整步骤。",
  "step": [
    {
      "@type": "HowToStep",
      "name": "确定页面类型",
      "text": "根据页面内容选择合适的 Schema 类型,如 Article、Product 或 FAQPage。"
    },
    {
      "@type": "HowToStep",
      "name": "编写 JSON-LD 代码",
      "text": "按照 Schema.org 规范编写 JSON-LD 代码块,填入页面的具体属性值。"
    },
    {
      "@type": "HowToStep",
      "name": "嵌入 HTML 页面",
      "text": "将 JSON-LD 代码块放入页面的 <head> 或 <body> 中的 <script type='application/ld+json'> 标签内。"
    },
    {
      "@type": "HowToStep",
      "name": "测试并验证",
      "text": "使用 Google Rich Results Test 验证标记是否正确,修复所有错误和警告。"
    }
  ]
}
</script>

要点:与 FAQ 类似,HowTo 的 SERP 富片段展示也在收紧。但作为内容结构的机器可读描述,它对 AI 搜索的价值依然明确。

5. Organization — 组织

适用于公司官网首页或 "关于我们" 页面。帮助 Google 知识面板(Knowledge Panel)展示品牌信息。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Organization",
  "name": "翼果科技",
  "url": "https://seo.yiguotech.com",
  "logo": "https://seo.yiguotech.com/logo.png",
  "description": "专注 SEO 与 AI 搜索优化的技术顾问团队。",
  "sameAs": [
    "https://www.linkedin.com/company/yiguotech",
    "https://twitter.com/yiguotech"
  ],
  "contactPoint": {
    "@type": "ContactPoint",
    "telephone": "+65-XXXX-XXXX",
    "contactType": "customer service",
    "availableLanguage": ["Chinese", "English"]
  }
}
</script>

要点sameAs 字段关联品牌的社交媒体主页,帮助 Google 建立品牌实体图谱。这对 AI 搜索引擎判断品牌权威性也有帮助。

6. LocalBusiness — 本地商家

适用于有实体经营地址的企业。标记后可增强 Google 本地搜索和地图的展示。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "LocalBusiness",
  "name": "翼果科技新加坡办公室",
  "image": "https://seo.yiguotech.com/office.jpg",
  "address": {
    "@type": "PostalAddress",
    "streetAddress": "1 Raffles Place",
    "addressLocality": "Singapore",
    "postalCode": "048616",
    "addressCountry": "SG"
  },
  "geo": {
    "@type": "GeoCoordinates",
    "latitude": 1.2847,
    "longitude": 103.8510
  },
  "telephone": "+65-XXXX-XXXX",
  "openingHoursSpecification": {
    "@type": "OpeningHoursSpecification",
    "dayOfWeek": ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday"],
    "opens": "09:00",
    "closes": "18:00"
  }
}
</script>

要点LocalBusiness 有大量子类型(RestaurantDentistAutoRepair 等),优先使用更具体的子类型。地址信息必须与 Google Business Profile 中的注册信息一致。

7. BreadcrumbList — 面包屑导航

适用于任何有层级结构的网站。标记后搜索结果中的 URL 会以面包屑路径展示,提升用户对页面位置的理解。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "BreadcrumbList",
  "itemListElement": [
    {
      "@type": "ListItem",
      "position": 1,
      "name": "首页",
      "item": "https://seo.yiguotech.com"
    },
    {
      "@type": "ListItem",
      "position": 2,
      "name": "干货观点",
      "item": "https://seo.yiguotech.com/categories/seo-secrets"
    },
    {
      "@type": "ListItem",
      "position": 3,
      "name": "Schema Markup 结构化数据指南"
    }
  ]
}
</script>

要点:最后一项(当前页面)不需要 item 属性。面包屑标记应与页面上实际可见的面包屑导航一致。这是实施成本最低、收益最确定的 Schema 类型之一,建议所有网站优先部署。

8. VideoObject — 视频

适用于嵌入视频内容的页面。标记后可在搜索结果中展示视频缩略图、时长、上传日期等信息。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "VideoObject",
  "name": "Schema Markup 入门教程",
  "description": "5 分钟学会用 JSON-LD 为网页添加结构化数据。",
  "thumbnailUrl": "https://example.com/video-thumbnail.jpg",
  "uploadDate": "2026-03-01",
  "duration": "PT5M30S",
  "contentUrl": "https://example.com/video.mp4",
  "embedUrl": "https://www.youtube.com/embed/xxxxx"
}
</script>

要点duration 使用 ISO 8601 时长格式(PT5M30S = 5 分 30 秒)。如果视频托管在 YouTube,embedUrlcontentUrl 更实用。2025 年起 Google 要求视频页面的主要内容必须是视频本身,纯文本页面附带一个嵌入视频不会触发视频富片段。

JSON-LD 为什么是推荐格式

Schema Markup 有三种实现格式:JSON-LD、Microdata 和 RDFa。Google 官方明确推荐 JSON-LD,理由很直接:

  • 与 HTML 解耦:JSON-LD 作为独立的 <script> 块嵌入页面,不需要修改现有的 HTML 结构。Microdata 和 RDFa 需要在 HTML 标签上添加属性(itemscopeitemproptypeof),侵入性强,维护成本高。
  • 便于动态生成:JSON-LD 是标准 JSON,可以通过后端模板、CMS 插件或 JavaScript 动态注入,适合自动化。
  • 不影响渲染:JSON-LD 不参与页面渲染,不会影响 CSS 布局或 JavaScript 行为。
  • 调试友好:JSON 格式的错误比散布在 HTML 属性中的标记更容易定位和修复。

唯一例外:BreadcrumbList 在某些场景下也可以用 Microdata 实现,因为面包屑本身就是 HTML 结构的一部分。但如果你的站点已经统一使用 JSON-LD,保持一致即可。

在不同平台上实施结构化数据

WordPress

WordPress 生态有成熟的 Schema 插件。Yoast SEORank Math 都内置了结构化数据功能,能自动为文章、页面、作者生成 Article、Person、Organization 等基础 Schema。对大多数站点来说,安装插件 + 正确配置 = 完成 80% 的工作。

需要自定义 Schema(比如 Product、FAQ)时,可以用 Rank Math 的 Schema 模板功能,或直接在主题的 header.php / footer.php 中注入 JSON-LD 代码块。

Shopify

Shopify 的默认主题会自动生成 Product 和 BreadcrumbList Schema。但默认实现通常不够完整——缺少 aggregateRatingbrandsku 等重要属性。建议:

  1. theme.liquid 或产品模板中手动补全 JSON-LD
  2. 或使用 Schema 专用 App(如 JSON-LD for SEO by Little Stream Software)
  3. 用 Google Rich Results Test 逐页验证,确保无缺失属性

自定义站点(Headless CMS / SSR 框架)

如果你的站点使用 Next.js、Nuxt.js 或其他 Headless 架构,结构化数据需要在构建层或渲染层注入。关键原则:JSON-LD 必须出现在服务端渲染的 HTML 中,不能依赖客户端 JavaScript 动态插入。

原因很简单:AI 爬虫不执行 JavaScript。如果你的 JSON-LD 是通过 useEffectonMounted 在客户端注入的,Googlebot 能看到(因为 Google 会渲染 JS),但 GPTBot、ClaudeBot 完全看不到。这与 JS 渲染对 SEO 的影响是同一个底层问题。

在 Next.js 中,推荐在 Server Component 或 generateMetadata 中输出 JSON-LD;在 Nuxt.js 中,使用 useHeaduseSchemaOrg 组合式函数。确保 HTML 源代码(View Source)中能直接看到完整的 <script type="application/ld+json"> 块。

结构化数据与 AI 搜索:被低估的连接

传统 SEO 语境下,结构化数据的价值主要是富片段和点击率。但在 AI 搜索时代,它的角色发生了质变。

AI 搜索引擎如何消费结构化数据

AI 搜索引擎(Google Gemini、ChatGPT Search、Perplexity)生成回答时需要从网页中提取 "事实"。它们的提取管道大致分两层:

  1. 结构化层:优先读取 JSON-LD、HTML 表格、定义列表(<dl>)等结构化内容
  2. 非结构化层:对自然语言段落进行 NER(命名实体识别)和关系提取

结构化层的提取成本低、准确率高,因此在 AI 系统的信息提取优先级中天然排在前面。一个标记了 Product Schema 且包含 pricebrandaggregateRating 的页面,比一段描述了同样信息的自然语言段落,更容易被 AI 正确引用。

对 AI Overviews 的具体影响

AI Overviews 在生成搜索结果摘要时,会引用网页内容作为事实来源。结构化数据在这个过程中的作用包括:

  • 实体消歧:Schema 中的 @type 帮助 AI 区分 "Apple(公司)" 和 "apple(水果)"
  • 属性提取pricedatePublishedauthor 等字段让 AI 直接获取结构化事实,无需从文本中推断
  • 可信度信号publisherauthor 与已知实体的关联度影响 AI 的引用倾向

结合页面的语义化 HTML 结构和清晰的 Schema 标记,你的内容在 AI 搜索中被正确理解和引用的概率会显著提高。这不是理论推测——Google 在 2025 年更新的结构化数据开发者文档中已经明确提到,结构化数据帮助 Google "理解页面内容并在搜索功能中展示"。

Schema 与内容可提取性

AI 搜索优化的核心之一是可提取性(Extractability)——你的内容能否被 AI 系统干净地提取为独立事实。结构化数据天然服务于这个目标:

  • FAQ Schema 中每个问答对 = 一个可独立提取的事实单元
  • HowTo Schema 中每个步骤 = 一个可独立引用的操作指令
  • Product Schema 中每个属性 = 一个无需推断的结构化事实

这与 AIO 优化中强调的 "内容分块" 原则高度一致。Schema Markup 本质上就是在告诉 AI:"这块内容的边界在哪,它的类型是什么,核心属性是哪些。"

测试与监控

结构化数据写完了不等于生效了。验证和持续监控是不可跳过的环节。

Google Rich Results Test

Rich Results Test 是 Google 官方提供的在线测试工具。输入 URL 或直接粘贴代码,它会告诉你:

  • 检测到了哪些 Schema 类型
  • 是否符合富片段展示的要求
  • 有哪些错误(Error)和警告(Warning)

错误必须修复(否则富片段不会触发),警告建议修复(缺少推荐属性会降低展示效果)。

Schema Markup Validator

Schema Markup Validator(由 Schema.org 官方维护)比 Rich Results Test 更严格——它不仅检查 Google 支持的类型,还验证所有 Schema.org 规范的合规性。如果你的标记需要同时服务于 Google、Bing 和 AI 搜索引擎,建议两个工具都用。

Google Search Console 增强功能报告

Google Search Console 的 "增强功能"(Enhancements)板块会持续监控你整个站点的结构化数据状态。它会报告:

  • 每种 Schema 类型的有效页面数
  • 出现错误的页面清单
  • 最近的变化趋势(新增错误或错误修复)

建议每周检查一次。特别是在 CMS 升级、主题更换或模板修改后,结构化数据容易意外损坏。

常见错误与避坑指南

标记与页面内容不一致

这是最严重的错误。Google 明确规定:结构化数据中的信息必须与页面上用户可见的内容一致。典型违规场景:

  • Product Schema 中标价 $49,页面上显示 $99
  • Article Schema 中的 author 是一个真实的人名,但文章实际上是 AI 生成的
  • FAQ Schema 中的问答在页面上根本不可见(用 CSS display:none 隐藏)

后果:Google 可能发出手动操作(Manual Action),直接移除你的所有富片段资格,甚至降低页面排名。

过度标记

不是标记越多越好。常见的过度标记行为:

  • 给每个页面都加上 FAQ Schema,即使页面并没有问答内容
  • 在一个页面上堆叠 5-6 种不相关的 Schema 类型
  • 为页面中一句话的内容创建 HowTo Schema

原则:只标记页面上确实存在且对用户有价值的内容。 Schema 是内容的机器可读描述,不是凭空创造内容。

缺少必填属性

每种 Schema 类型都有必填(Required)和推荐(Recommended)属性。Google 的 Rich Results Test 会明确标出缺失项。常见遗漏:

  • Article 缺少 image(Google 强烈推荐,影响 Discover 和 Top Stories 展示)
  • Product 缺少 offers(没有价格信息的 Product Schema 几乎没有价值)
  • VideoObject 缺少 thumbnailUrl(视频富片段的强制要求)

嵌套错误

Schema 类型之间有嵌套关系(如 Article 中嵌套 Person 作为 author)。常见错误:

  • 把嵌套类型写成字符串而非对象:"author": "Linus" 应改为 "author": {"@type": "Person", "name": "Linus"}
  • 嵌套层级不符合 Schema.org 规范:比如在 Product 中直接嵌套 FAQPage(FAQ 应该是页面级类型,不应嵌套在 Product 内)

未考虑 技术 SEO 基础

结构化数据不是孤立存在的。如果页面本身有技术问题——被 robots.txt 屏蔽、返回 404、加载时间超过 5 秒——再完美的 Schema 标记也没有意义。确保你的技术 SEO 基础健全,再在上面叠加结构化数据。

翼果洞察

结构化数据在 2026 年的价值已经分化成两个层面:

第一层是传统层面——富片段、点击率、SERP 占位。这个价值依然存在,但因为 Google 收紧了 FAQ 和 HowTo 的展示条件,ROI 在下降。

第二层是 AI 层面——帮助 AI 搜索引擎理解你的内容实体、属性和关系。这个价值正在快速上升。当 AI Overviews 需要引用一个产品的价格时,JSON-LD 中的 price 字段比页面上一句 "售价 99 美元" 更容易被正确提取。

实操建议:优先部署 BreadcrumbList + Article/Product + Organization 这三层基础 Schema,覆盖全站。然后针对重点页面补充 FAQ、HowTo、VideoObject 等细分类型。不要追求标记数量,追求标记与内容的一致性和完整性。

最后一个容易被忽视的点:定期用 curl 或无头浏览器检查你的 JSON-LD 是否出现在服务端返回的 HTML 中。如果你的结构化数据是客户端注入的,Googlebot 能看到,但 AI 爬虫看不到——和 SSR 渲染的问题如出一辙。

在AI里面继续讨论: