你的页面在 Google 眼里是什么?一段文字、几张图片、一个标题——仅此而已。搜索引擎能 "读" 网页,但不一定能 "理解" 网页。结构化数据(Structured Data)就是你主动告诉搜索引擎 "这段内容是什么、关于谁、属于哪个类别" 的方式。
具体来说,Schema Markup 是基于 Schema.org 词汇表的一套标记规范。你把它嵌入 HTML,搜索引擎就能精确提取页面中的实体、属性和关系——而不是靠猜。
2026 年,结构化数据的价值远不止 "拿个富片段"。当 AI 搜索引擎(ChatGPT、Gemini、Perplexity)需要从海量网页中提取事实来生成回答时,结构化数据为它们提供了最可靠的信号源。它已经从 SEO 加分项变成了 AI 可见性的底层基础设施。
为什么结构化数据在 2026 年比以往更重要
富片段带来的直接收益
最直观的好处:结构化数据让你的搜索结果 "变大"。Google 会根据你标记的 Schema 类型,在搜索结果中展示评分星级、价格区间、FAQ 折叠、操作步骤、视频缩略图等富片段(Rich Snippets)。
数据说话:Google 官方文档明确指出,结构化数据是触发富媒体搜索结果的前提条件。多项行业研究表明,带富片段的结果比纯文本结果的点击率(CTR)平均高出 20-30%。在竞争激烈的 SERP 中,这个差距可以决定你是被点击还是被忽略。
AI 搜索引擎的新依赖
传统搜索引擎花了二十年学会从非结构化文本中提取信息。AI 搜索引擎更聪明,但也更 "懒"——它们优先消费已经结构化的数据,因为提取成本最低、准确度最高。
当 AI Overviews 需要回答 "这款产品多少钱" 时,它不会去解析你页面里的一段描述文字,而是直接读取 Product Schema 中的 price 属性。当 ChatGPT 需要判断一篇文章的作者是否可信时,Article Schema 中的 author 和 publisher 字段提供了最直接的信号。
这意味着:没有结构化数据的页面,在 AI 搜索中被正确引用的概率显著降低。结构化数据正在成为 AIO 优化的重要组成部分。
E-E-A-T 信号的机器可读表达
Google 的 E-E-A-T 框架(Experience, Expertise, Authoritativeness, Trustworthiness)评估内容质量时,需要判断 "谁写的、在哪发布的、凭什么可信"。结构化数据让这些信号变得机器可读:
author字段关联到作者实体(Person Schema),包含职位、隶属机构、社交链接publisher字段关联到组织实体(Organization Schema),包含品牌名、Logo、官网datePublished和dateModified表明内容的时效性citation和isBasedOn标明内容的来源和依据
这些字段不是排名因素本身,但它们帮助 Google 的质量评估系统更快、更准确地判断你的内容是否可信。
Google 支持的 8 种常用 Schema 类型
Schema.org 定义了数百种类型,但 Google 目前明确支持并可能触发富媒体结果的只有几十种。以下是实际使用频率最高、收益最明确的 8 种,附完整的 JSON-LD 代码示例。
1. Article — 文章
适用于博客文章、新闻报道、深度分析。正确标记后可在 Google 搜索和 Google News 中获得增强展示(标题、发布时间、作者头像等)。
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "Schema Markup 结构化数据完全指南",
"description": "从基础概念到 AI 搜索实战,覆盖 8 种 Google 支持的结构化数据类型。",
"image": "https://example.com/schema-guide-cover.jpg",
"author": {
"@type": "Person",
"name": "Linus",
"url": "https://seo.yiguotech.com/about"
},
"publisher": {
"@type": "Organization",
"name": "翼果科技",
"logo": {
"@type": "ImageObject",
"url": "https://seo.yiguotech.com/logo.png"
}
},
"datePublished": "2026-03-05",
"dateModified": "2026-03-05"
}
</script>
要点:headline 不要超过 110 个字符。image 建议宽度不低于 1200px。如果是新闻类内容,可用 NewsArticle 替代 Article。
2. Product — 商品
适用于电商产品页。正确标记后可触发价格、库存状态、评分等富片段,对点击率影响最直接。
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Product",
"name": "Ahrefs SEO 工具套件",
"image": "https://example.com/ahrefs-product.jpg",
"description": "一站式 SEO 工具平台,覆盖关键词研究、外链分析、排名追踪等核心功能。",
"brand": {
"@type": "Brand",
"name": "Ahrefs"
},
"offers": {
"@type": "Offer",
"url": "https://example.com/ahrefs",
"priceCurrency": "USD",
"price": "99",
"priceValidUntil": "2026-12-31",
"availability": "https://schema.org/InStock"
},
"aggregateRating": {
"@type": "AggregateRating",
"ratingValue": "4.7",
"reviewCount": "3200"
}
}
</script>
要点:offers 中的 price 必须与页面可见价格一致,否则会被 Google 判为误导性标记(Misleading Structured Data)并触发手动操作(Manual Action)。
3. FAQPage — 常见问题
适用于页面中包含问答对的内容。正确标记后,问答会以折叠形式直接展示在搜索结果中,大幅增加 SERP 占位面积。
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [
{
"@type": "Question",
"name": "什么是结构化数据?",
"acceptedAnswer": {
"@type": "Answer",
"text": "结构化数据是一种标准化的格式,用于向搜索引擎提供页面内容的明确信息。它基于 Schema.org 词汇表,通过 JSON-LD 格式嵌入 HTML 页面。"
}
},
{
"@type": "Question",
"name": "Schema Markup 会直接影响排名吗?",
"acceptedAnswer": {
"@type": "Answer",
"text": "Schema Markup 本身不是排名因素,但它能触发富片段、提升点击率,间接影响排名表现。同时,它帮助搜索引擎更准确地理解内容,提高内容与查询的匹配度。"
}
}
]
}
</script>
要点:2023 年起 Google 收紧了 FAQ 富片段的展示条件,目前仅对政府和医疗权威网站保留 SERP 中的 FAQ 展示。但 FAQ Schema 仍然有助于 AI 搜索引擎理解你的问答结构,不建议因为富片段缩水就移除标记。
4. HowTo — 操作步骤
适用于教程、指南、操作流程类内容。正确标记后可展示分步骤的操作指引。
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "HowTo",
"name": "如何在网站中添加 Schema Markup",
"description": "使用 JSON-LD 格式为网页添加结构化数据的完整步骤。",
"step": [
{
"@type": "HowToStep",
"name": "确定页面类型",
"text": "根据页面内容选择合适的 Schema 类型,如 Article、Product 或 FAQPage。"
},
{
"@type": "HowToStep",
"name": "编写 JSON-LD 代码",
"text": "按照 Schema.org 规范编写 JSON-LD 代码块,填入页面的具体属性值。"
},
{
"@type": "HowToStep",
"name": "嵌入 HTML 页面",
"text": "将 JSON-LD 代码块放入页面的 <head> 或 <body> 中的 <script type='application/ld+json'> 标签内。"
},
{
"@type": "HowToStep",
"name": "测试并验证",
"text": "使用 Google Rich Results Test 验证标记是否正确,修复所有错误和警告。"
}
]
}
</script>
要点:与 FAQ 类似,HowTo 的 SERP 富片段展示也在收紧。但作为内容结构的机器可读描述,它对 AI 搜索的价值依然明确。
5. Organization — 组织
适用于公司官网首页或 "关于我们" 页面。帮助 Google 知识面板(Knowledge Panel)展示品牌信息。
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Organization",
"name": "翼果科技",
"url": "https://seo.yiguotech.com",
"logo": "https://seo.yiguotech.com/logo.png",
"description": "专注 SEO 与 AI 搜索优化的技术顾问团队。",
"sameAs": [
"https://www.linkedin.com/company/yiguotech",
"https://twitter.com/yiguotech"
],
"contactPoint": {
"@type": "ContactPoint",
"telephone": "+65-XXXX-XXXX",
"contactType": "customer service",
"availableLanguage": ["Chinese", "English"]
}
}
</script>
要点:sameAs 字段关联品牌的社交媒体主页,帮助 Google 建立品牌实体图谱。这对 AI 搜索引擎判断品牌权威性也有帮助。
6. LocalBusiness — 本地商家
适用于有实体经营地址的企业。标记后可增强 Google 本地搜索和地图的展示。
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "LocalBusiness",
"name": "翼果科技新加坡办公室",
"image": "https://seo.yiguotech.com/office.jpg",
"address": {
"@type": "PostalAddress",
"streetAddress": "1 Raffles Place",
"addressLocality": "Singapore",
"postalCode": "048616",
"addressCountry": "SG"
},
"geo": {
"@type": "GeoCoordinates",
"latitude": 1.2847,
"longitude": 103.8510
},
"telephone": "+65-XXXX-XXXX",
"openingHoursSpecification": {
"@type": "OpeningHoursSpecification",
"dayOfWeek": ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday"],
"opens": "09:00",
"closes": "18:00"
}
}
</script>
要点:LocalBusiness 有大量子类型(Restaurant、Dentist、AutoRepair 等),优先使用更具体的子类型。地址信息必须与 Google Business Profile 中的注册信息一致。
7. BreadcrumbList — 面包屑导航
适用于任何有层级结构的网站。标记后搜索结果中的 URL 会以面包屑路径展示,提升用户对页面位置的理解。
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "BreadcrumbList",
"itemListElement": [
{
"@type": "ListItem",
"position": 1,
"name": "首页",
"item": "https://seo.yiguotech.com"
},
{
"@type": "ListItem",
"position": 2,
"name": "干货观点",
"item": "https://seo.yiguotech.com/categories/seo-secrets"
},
{
"@type": "ListItem",
"position": 3,
"name": "Schema Markup 结构化数据指南"
}
]
}
</script>
要点:最后一项(当前页面)不需要 item 属性。面包屑标记应与页面上实际可见的面包屑导航一致。这是实施成本最低、收益最确定的 Schema 类型之一,建议所有网站优先部署。
8. VideoObject — 视频
适用于嵌入视频内容的页面。标记后可在搜索结果中展示视频缩略图、时长、上传日期等信息。
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "VideoObject",
"name": "Schema Markup 入门教程",
"description": "5 分钟学会用 JSON-LD 为网页添加结构化数据。",
"thumbnailUrl": "https://example.com/video-thumbnail.jpg",
"uploadDate": "2026-03-01",
"duration": "PT5M30S",
"contentUrl": "https://example.com/video.mp4",
"embedUrl": "https://www.youtube.com/embed/xxxxx"
}
</script>
要点:duration 使用 ISO 8601 时长格式(PT5M30S = 5 分 30 秒)。如果视频托管在 YouTube,embedUrl 比 contentUrl 更实用。2025 年起 Google 要求视频页面的主要内容必须是视频本身,纯文本页面附带一个嵌入视频不会触发视频富片段。
JSON-LD 为什么是推荐格式
Schema Markup 有三种实现格式:JSON-LD、Microdata 和 RDFa。Google 官方明确推荐 JSON-LD,理由很直接:
- 与 HTML 解耦:JSON-LD 作为独立的
<script>块嵌入页面,不需要修改现有的 HTML 结构。Microdata 和 RDFa 需要在 HTML 标签上添加属性(itemscope、itemprop、typeof),侵入性强,维护成本高。 - 便于动态生成:JSON-LD 是标准 JSON,可以通过后端模板、CMS 插件或 JavaScript 动态注入,适合自动化。
- 不影响渲染:JSON-LD 不参与页面渲染,不会影响 CSS 布局或 JavaScript 行为。
- 调试友好:JSON 格式的错误比散布在 HTML 属性中的标记更容易定位和修复。
唯一例外:BreadcrumbList 在某些场景下也可以用 Microdata 实现,因为面包屑本身就是 HTML 结构的一部分。但如果你的站点已经统一使用 JSON-LD,保持一致即可。
在不同平台上实施结构化数据
WordPress
WordPress 生态有成熟的 Schema 插件。Yoast SEO 和 Rank Math 都内置了结构化数据功能,能自动为文章、页面、作者生成 Article、Person、Organization 等基础 Schema。对大多数站点来说,安装插件 + 正确配置 = 完成 80% 的工作。
需要自定义 Schema(比如 Product、FAQ)时,可以用 Rank Math 的 Schema 模板功能,或直接在主题的 header.php / footer.php 中注入 JSON-LD 代码块。
Shopify
Shopify 的默认主题会自动生成 Product 和 BreadcrumbList Schema。但默认实现通常不够完整——缺少 aggregateRating、brand、sku 等重要属性。建议:
- 在
theme.liquid或产品模板中手动补全 JSON-LD - 或使用 Schema 专用 App(如 JSON-LD for SEO by Little Stream Software)
- 用 Google Rich Results Test 逐页验证,确保无缺失属性
自定义站点(Headless CMS / SSR 框架)
如果你的站点使用 Next.js、Nuxt.js 或其他 Headless 架构,结构化数据需要在构建层或渲染层注入。关键原则:JSON-LD 必须出现在服务端渲染的 HTML 中,不能依赖客户端 JavaScript 动态插入。
原因很简单:AI 爬虫不执行 JavaScript。如果你的 JSON-LD 是通过 useEffect 或 onMounted 在客户端注入的,Googlebot 能看到(因为 Google 会渲染 JS),但 GPTBot、ClaudeBot 完全看不到。这与 JS 渲染对 SEO 的影响是同一个底层问题。
在 Next.js 中,推荐在 Server Component 或 generateMetadata 中输出 JSON-LD;在 Nuxt.js 中,使用 useHead 或 useSchemaOrg 组合式函数。确保 HTML 源代码(View Source)中能直接看到完整的 <script type="application/ld+json"> 块。
结构化数据与 AI 搜索:被低估的连接
传统 SEO 语境下,结构化数据的价值主要是富片段和点击率。但在 AI 搜索时代,它的角色发生了质变。
AI 搜索引擎如何消费结构化数据
AI 搜索引擎(Google Gemini、ChatGPT Search、Perplexity)生成回答时需要从网页中提取 "事实"。它们的提取管道大致分两层:
- 结构化层:优先读取 JSON-LD、HTML 表格、定义列表(
<dl>)等结构化内容 - 非结构化层:对自然语言段落进行 NER(命名实体识别)和关系提取
结构化层的提取成本低、准确率高,因此在 AI 系统的信息提取优先级中天然排在前面。一个标记了 Product Schema 且包含 price、brand、aggregateRating 的页面,比一段描述了同样信息的自然语言段落,更容易被 AI 正确引用。
对 AI Overviews 的具体影响
AI Overviews 在生成搜索结果摘要时,会引用网页内容作为事实来源。结构化数据在这个过程中的作用包括:
- 实体消歧:Schema 中的
@type帮助 AI 区分 "Apple(公司)" 和 "apple(水果)" - 属性提取:
price、datePublished、author等字段让 AI 直接获取结构化事实,无需从文本中推断 - 可信度信号:
publisher、author与已知实体的关联度影响 AI 的引用倾向
结合页面的语义化 HTML 结构和清晰的 Schema 标记,你的内容在 AI 搜索中被正确理解和引用的概率会显著提高。这不是理论推测——Google 在 2025 年更新的结构化数据开发者文档中已经明确提到,结构化数据帮助 Google "理解页面内容并在搜索功能中展示"。
Schema 与内容可提取性
AI 搜索优化的核心之一是可提取性(Extractability)——你的内容能否被 AI 系统干净地提取为独立事实。结构化数据天然服务于这个目标:
- FAQ Schema 中每个问答对 = 一个可独立提取的事实单元
- HowTo Schema 中每个步骤 = 一个可独立引用的操作指令
- Product Schema 中每个属性 = 一个无需推断的结构化事实
这与 AIO 优化中强调的 "内容分块" 原则高度一致。Schema Markup 本质上就是在告诉 AI:"这块内容的边界在哪,它的类型是什么,核心属性是哪些。"
测试与监控
结构化数据写完了不等于生效了。验证和持续监控是不可跳过的环节。
Google Rich Results Test
Rich Results Test 是 Google 官方提供的在线测试工具。输入 URL 或直接粘贴代码,它会告诉你:
- 检测到了哪些 Schema 类型
- 是否符合富片段展示的要求
- 有哪些错误(Error)和警告(Warning)
错误必须修复(否则富片段不会触发),警告建议修复(缺少推荐属性会降低展示效果)。
Schema Markup Validator
Schema Markup Validator(由 Schema.org 官方维护)比 Rich Results Test 更严格——它不仅检查 Google 支持的类型,还验证所有 Schema.org 规范的合规性。如果你的标记需要同时服务于 Google、Bing 和 AI 搜索引擎,建议两个工具都用。
Google Search Console 增强功能报告
Google Search Console 的 "增强功能"(Enhancements)板块会持续监控你整个站点的结构化数据状态。它会报告:
- 每种 Schema 类型的有效页面数
- 出现错误的页面清单
- 最近的变化趋势(新增错误或错误修复)
建议每周检查一次。特别是在 CMS 升级、主题更换或模板修改后,结构化数据容易意外损坏。
常见错误与避坑指南
标记与页面内容不一致
这是最严重的错误。Google 明确规定:结构化数据中的信息必须与页面上用户可见的内容一致。典型违规场景:
- Product Schema 中标价 $49,页面上显示 $99
- Article Schema 中的
author是一个真实的人名,但文章实际上是 AI 生成的 - FAQ Schema 中的问答在页面上根本不可见(用 CSS
display:none隐藏)
后果:Google 可能发出手动操作(Manual Action),直接移除你的所有富片段资格,甚至降低页面排名。
过度标记
不是标记越多越好。常见的过度标记行为:
- 给每个页面都加上 FAQ Schema,即使页面并没有问答内容
- 在一个页面上堆叠 5-6 种不相关的 Schema 类型
- 为页面中一句话的内容创建 HowTo Schema
原则:只标记页面上确实存在且对用户有价值的内容。 Schema 是内容的机器可读描述,不是凭空创造内容。
缺少必填属性
每种 Schema 类型都有必填(Required)和推荐(Recommended)属性。Google 的 Rich Results Test 会明确标出缺失项。常见遗漏:
Article缺少image(Google 强烈推荐,影响 Discover 和 Top Stories 展示)Product缺少offers(没有价格信息的 Product Schema 几乎没有价值)VideoObject缺少thumbnailUrl(视频富片段的强制要求)
嵌套错误
Schema 类型之间有嵌套关系(如 Article 中嵌套 Person 作为 author)。常见错误:
- 把嵌套类型写成字符串而非对象:
"author": "Linus"应改为"author": {"@type": "Person", "name": "Linus"} - 嵌套层级不符合 Schema.org 规范:比如在
Product中直接嵌套FAQPage(FAQ 应该是页面级类型,不应嵌套在 Product 内)
未考虑 技术 SEO 基础
结构化数据不是孤立存在的。如果页面本身有技术问题——被 robots.txt 屏蔽、返回 404、加载时间超过 5 秒——再完美的 Schema 标记也没有意义。确保你的技术 SEO 基础健全,再在上面叠加结构化数据。
翼果洞察
结构化数据在 2026 年的价值已经分化成两个层面:
第一层是传统层面——富片段、点击率、SERP 占位。这个价值依然存在,但因为 Google 收紧了 FAQ 和 HowTo 的展示条件,ROI 在下降。
第二层是 AI 层面——帮助 AI 搜索引擎理解你的内容实体、属性和关系。这个价值正在快速上升。当 AI Overviews 需要引用一个产品的价格时,JSON-LD 中的
price字段比页面上一句 "售价 99 美元" 更容易被正确提取。实操建议:优先部署 BreadcrumbList + Article/Product + Organization 这三层基础 Schema,覆盖全站。然后针对重点页面补充 FAQ、HowTo、VideoObject 等细分类型。不要追求标记数量,追求标记与内容的一致性和完整性。
最后一个容易被忽视的点:定期用
curl或无头浏览器检查你的 JSON-LD 是否出现在服务端返回的 HTML 中。如果你的结构化数据是客户端注入的,Googlebot 能看到,但 AI 爬虫看不到——和 SSR 渲染的问题如出一辙。