背景:根据 OpenAI 自己的介绍,今天带来的是 ChatGPT Pro 和 OpenAI o1 System Card。
OpenAI 为期 12 天的“ship-mas”活动已正式开始,ChatGPT 目前每周拥有超过 3 亿用户,他们将在 12 月 5 日开始的 12 天内展示一些新功能、产品和演示,此时距离 2022 年 ChatGPT 爆炸性发布两周年仅剩几天。
第一日简单总结
两大重磅发布:
-
O1(正式版): O1 AI 模型的完整版本现已发布。在 O1-Preview 的基础上,此版本在以下方面进行了重大改进:
-
智能: 在数学竞赛、编码挑战和 GPT QA Diamond 等基准测试中,O1 的表现优于 GPT-4.0 和 O1 预览版。
-
速度: 与预览版相比,O1 的响应速度明显加快。
-
多模态: O1 现在可以处理和理解来自多种来源的信息,包括文本和图像。这一点通过一个涉及手绘图的空间数据中心设计问题得到了证明。
-
指令遵循: O1 在理解和执行用户指令方面表现出更强的能力。
-
-
ChatGPT Pro: 面向 ChatGPT 高级用户的全新订阅层级,提供:
-
无限模型访问: 用户可以无限次访问所有 OpenAI 模型,包括最先进的模型。
-
O1 Pro 模式: 此独家模式解锁了 O1 模型更强大的功能,尤其适用于需要更高准确性和可靠性的复杂问题。
-
高级语音模式: Pro 层级包含增强的语音交互功能。
-
ChatGPT Pro 定价和可用性:
-
ChatGPT Pro 的价格为每月 200 美元。
-
Pro 订阅从今天开始提供。
即将推出的功能:
-
ChatGPT Pro: OpenAI 计划为 ChatGPT Pro 订阅者推出更多功能,包括对计算量更大的任务的支持。
-
O1 增强功能: 未来的更新将为 O1 带来新的工具和功能,例如网页浏览、文件上传以及与结构化输出、函数调用、开发者消息和 API 图像理解等功能的 API 集成。
第一天亮点:
-
O1 通过回答有关罗马皇帝的历史问题,展示了其比预览版快 60% 的速度。
-
通过分析空间数据中心设计的手绘图,展示了 O1 的多模态功能。
-
O1 Pro 模式成功解决了一个具有挑战性的化学问题,突出了其增强的解决问题的能力。
对于 SEO 优化人的思考
O1 和 ChatGPT Pro 的出现,对 SEOer 来说既是挑战也是机遇。谷歌或者 Bing 的 SEO 优化人员,不要气馁,要认识到 AI 的局限性,发挥人类的创造力和深度思考能力,将 AI 作为辅助工具,而不是完全依赖它。
1. AI 搜索替代简单搜索,SEOer 的价值何在?
-
深度问题仍需人类参与: AI 虽然强大,但仍无法完全替代人类的深度思考和创造力。例如,对于需要结合行业经验、用户心理和商业目标的复杂 SEO 问题,AI 只能提供参考,最终决策仍需人类参与。
-
引导 AI 创造更有价值的信息: SEOer 可以利用自身经验和专业知识,引导 AI 生成更符合用户需求、更具深度和洞察力的内容。例如,通过提供高质量的语料库、设计更有效的提示词等,帮助 AI 更好地理解用户搜索意图,生成更优质的 SEO 内容。
-
关注 AI 无法触及的领域: SEO 不仅仅是关键词和内容,还包括用户体验、网站架构、品牌建设等方面。SEOer 可以将更多精力投入到这些 AI 难以替代的领域,例如提升网站加载速度、优化移动端体验、建立高质量的外部链接等。
SEOer 需要具备更强的分析能力、策略思维和内容创作能力,才能应对 AI 搜索带来的挑战。
2. 多步推理 + 多模态 = SEO 新机遇
O1 的多模态能力和强大的推理能力,为 SEO 开辟了新的可能性:
-
更丰富的 SEO 策略: SEO 优化人员可以结合文本、图像、视频等多种形式的内容,制定更全面、更有效的 SEO 策略。例如,可以利用 O1 分析图片和视频中的信息,挖掘潜在的关键词和主题,通过思考,生成更具吸引力的多媒体内容。
-
更精准的用户洞察: 通过分析用户在搜索引擎、社交媒体等平台上的多模态数据,SEOer 可以更深入地了解用户的需求和行为,从而制定更精准的 SEO 策略。
3. 自动化解决 SEO 问题
到了现在,比如 Windsurf 和 Cursor 的出现,AI 的发展确实可以帮助 SEOer 自动化解决一些重复性、机械性的 SEO 问题,例如:
-
自动生成 SEO 报告: ChatGPT Pro 可以自动生成网站流量分析报告、关键词排名报告等,节省 SEOer 的时间和精力。
-
自动优化网站内容: AI 可以根据 SEO 最佳实践,自动优化网站内容的标题、描述、关键词密度等,提高内容的搜索引擎友好度。
-
自动检测和修复 SEO 问题: AI 可以自动检测网站存在的 SEO 问题,例如 broken links、duplicate content 等,并提供修复建议。
12 Days of OpenAI Day 1 中文翻译
欢迎来到 OpenAI 的 “12 天惊喜”!我们将尝试一些科技公司从未做过的事情:在接下来的 12 个工作日里,每天都会发布或演示我们研发的新成果。从今天开始,我们将为您带来一系列令人惊喜的创新,希望您会喜欢。我们会尽量做到简短有趣,将我们最近的工作成果作为节日礼物送给您。
今天我们将发布两项重要内容。首先是 O1 的完整版本。我们一直在努力改进,并认真听取了您的反馈。您喜欢 O1 预览版,但希望它更智能、更快、更具多模态能力,并且更擅长遵循指令。我们为此付出了巨大努力,相信科学家、工程师和程序员都会爱上这个新模型。
从性能指标来看,O1 相较于 GPT-4.0 和 O1 预览版,在数学竞赛、编码和 GPT QA Diamond 等方面都有了显著提升。O1 是 AI 领域向前迈出的一大步。虽然它在很多方面都有改进,但我们最关注的还是其 “原始智能”。例如,人们广泛使用 O1 进行编码,其编码性能尤为突出。
今天发布的第二项内容是针对 ChatGPT 的 “超级用户”。许多人 已经 离不开 ChatGPT,他们需要的计算能力远超每月 20 美元所能提供的。因此,我们推出了一个新的订阅等级——ChatGPT Pro。Pro 用户可以无限次使用我们的模型和功能,例如高级语音模式。它还包含一项名为 “O1 Pro 模式” 的新功能。O1 目前是世界上最智能的模型,而 O1 Pro 模式则更胜一筹。对于那些极具挑战性的问题,O1 Pro 模式能提供更出色的解决方案。
在竞赛数学和 GPT QA Diamond 等方面,这些改进可能看起来并不明显,但在处理复杂工作流程、真正挑战模型极限时,O1 Pro 模式的优势就显露无疑了。用户非常重视可靠性,Pro 模式的答案可靠性远超 O1,这是一个巨大的进步。
ChatGPT Pro 的定价为每月 200 美元,现已发布。在接下来的 12 天里,我们还会陆续推出其他功能,相信您一定会喜欢。ChatGPT Pro 的核心优势在于无限次使用模型和全新的 O1 Pro 模式。
为了展示 O1 的能力,我们用一个关于公元二世纪罗马皇帝的历史问题对它进行了测试。O1 的响应速度比 O1 预览版快了约 60%——O1 思考了大约 14 秒,而 O1 预览版则需要 33 秒。完成部署后,响应速度还会更快。
在多模态能力方面,我们展示了一个涉及空间数据中心设计的问题,该设计包含太阳能电池板和冷却系统。O1 成功分析了手绘图,理解了 1GW 的功率需求,并计算出所需的冷却面板面积——大约 242 万平方米,约占旧金山陆地面积的 2%。O1 在 MMU 和 Math Vista 等标准基准测试中取得了最先进的成绩。
为了展示 ChatGPT Pro 模式的能力,我们用一个极具挑战性的化学问题对它进行了测试。对于复杂问题,模型可能需要几分钟才能给出答案,但在这次测试中,它仅用了 53 秒就解决了这个问题,并在考虑了各种候选答案后,正确识别出 “视黄醛” 是正确答案。
我们正在继续为 ChatGPT Pro 等级开发更多功能,包括为那些想要进一步拓展模型能力的用户提供更多计算密集型任务。我们还在向 O1 添加更多工具,例如网络浏览、文件上传,并将 O1 引入 API,并提供结构化输出、函数调用、开发者消息和 API 图像理解等新功能。
明天,我们将为开发者带来惊喜,敬请期待!希望您能像我们一样喜欢 O1 和 Pro 模式。在接下来的日子里,我们还将分享更多激动人心的进展。
最后,演讲以一个轻松的时刻结束——一个以圣诞节为主题的笑话,关于圣诞老人试图让他的语言模型用 “驯鹿强化” (reinforcement 的谐音)来解决数学问题。
Bilibili 视频 - 来自宝玉的翻译版本:
12 Days of OpenAI Day 1 英文原稿整理
Welcome to the 12 Days of OpenAI. We're going to try something that, as far as we know, no tech company has done before. Every weekday for the next 12 days, we are going to launch or demo some new thing that we've built. We think we've got some great stuff for you starting today, and we hope you'll really love it. We'll try to make this fun and fast, and not take too long, but it'll be a way to show you what we've been working on - a little holiday present from us.
Today we actually have two things to launch. The first one is the full version of O1. We have been very hard at work and listened to your feedback. You liked O1 Preview but wanted it to be smarter, faster, multimodal, and better at instruction following, among other things. We've put a lot of work into this, and we think scientists, engineers, and coders will really love this new model.
Looking at performance metrics, you can see the jump from GPT-4.0 to O1 Preview across math competition, coding, GPT QA Diamond, and you can see that O1 is a pretty big step forward. While it's better in many other ways, raw intelligence is something we care about. Coding performance, in particular, is an area where people are using the model extensively.
The second launch today addresses our power users of ChatGPT. Many people really use it a lot and want more compute than $20 a month can buy. So we're launching a new tier - ChatGPT Pro. Pro has unlimited access to our models and features like advanced voice mode. It also includes a new feature called O1 Pro mode. O1 is currently the smartest model in the world, except for O1 being used in Pro mode. For the hardest problems, O1 Pro mode lets you do even better.
Looking at competition math and GPT QA Diamond, these improvements may look small, but in complex workflows where you're really pushing the limits of these models, it's quite significant. One thing people really wanted was reliability, and you can see how the reliability of answers from Pro mode compares to O1 - it's an even stronger improvement.
ChatGPT Pro is priced at $200 a month and launches today. Over these 12 days, we have some other features to add that we think you'll really love. The key offerings are unlimited model use and the new O1 Pro mode.
To demonstrate O1's capabilities, we tested it with a history question about Roman emperors of the second century. O1 responded about 60% faster than O1 Preview - O1 thought for about 14 seconds while O1 Preview took about 33 seconds. These response times should be even faster once we finish deploying.
For multimodal capabilities, we demonstrated a problem involving a space data center design with solar panels and cooling systems. The model successfully analyzed the hand-drawn diagram, understood the 1GW power requirement, and calculated the cooling panel area needed - approximately 2.42 million square meters, about 2% of San Francisco's land area. O1 has achieved state-of-the-art performance on standard benchmarks like MMU and Math Vista.
For ChatGPT Pro mode, we demonstrated its capabilities with a challenging chemistry problem. The model can think up to a few minutes for complex problems, but in this case, it solved the problem in 53 seconds, correctly identifying retinochisen as the answer after considering various candidates.
We're continuing to work on more features for the ChatGPT Pro tier, including more compute-intensive tasks for those who want to push the model further. We're also adding tools to O1 such as web browsing, file uploads, and bringing O1 to the API with new features like structured outputs, function calling, developer messages, and API image understanding.
Tomorrow, we'll be back with something great for developers, and we'll keep going from there. We hope you'll enjoy O1 and Pro mode as much as we do, and we have a lot more exciting developments to share in the coming days.
The presentation concluded with a lighthearted moment - a Christmas-themed joke about Santa trying to get his language model to solve a math problem using "reindeer-forcing" (a play on "reinforcement"). lol.
YouTube 原版视频:OpenAI o1 and o1 pro mode in ChatGPT — 12 Days of OpenAI: Day 1