谷歌如何重振旗鼓并反超 OpenAI

谷歌如何重振旗鼓并反超 OpenAI

Hacker News 摘要

原标题:How Google got its groove back and edged ahead of OpenAI

谷歌在人工智能竞赛初期曾落后于 OpenAI 旗下的 ChatGPT,但通过推出强大的 Gemini 模型以及对搜索引擎进行多年来最大的改革,成功实现了反超。

逆袭的开端与 Nano Banana

谷歌重回领先地位的一个关键转折点源于一次深夜的尝试。2025年8月的一个凌晨,谷歌项目经理 Naina Raisinghani 将 DeepMind 实验室的一项新成果上传到了 AI 模型评测平台 LM Arena。为了完成上传,她随手用朋友给自己起的绰号拼凑了一个名字:Nano Banana。

这款具备极速图像生成能力的工具迅速登顶性能排行榜,并在社交平台 X 上引发热议。到9月,谷歌的 Gemini 应用程序已成为苹果应用商店下载量最高的应用。随后在11月,谷歌发布了迄今为止最强大的 Gemini 模型,其多项性能指标超过了 ChatGPT,重新夺回了 AI 领军者的地位。

长期布局:芯片与研究的积累

谷歌能够反超,离不开其深厚的科研根基和对硬件的巨额投入:

自主研发芯片:谷歌早在多年前就意识到 AI 需要极高的计算能力,并开始设计自己的芯片,即张量处理单元(TPU)。这些芯片比传统的通用芯片更省电。

最新硬件优势:谷歌最新的芯片名为 Ironwood,显著降低了运行 AI 模型的成本。2025年12月,有消息称谷歌正洽谈向 Meta 出售价值数十亿美元的芯片,这一消息一度导致英伟达的股价下跌。

深厚的研究背景:谷歌拥有由 Jeff Dean 联合创立的 Google Brain 和 Demis Hassabis 领导的 DeepMind 实验室。尽管两家机构早期由于文化差异存在整合困难,但最终在联合开发最强模型上达成了统一。

谨慎过后的追赶之路

谷歌早期在聊天机器人领域采取了非常谨慎的态度。研究人员担心技术产生的错误信息或歧视性言论会损害公司声誉。这种谨慎让一些人才流向了 OpenAI。

当 OpenAI 的 ChatGPT 在五天内吸引百万用户时,谷歌内部感到极大的压力。谷歌随后推出了基于 LaMDA 模型的 Bard,但首秀却因为在演示视频中回答错了一个关于詹姆斯·韦伯空间望远镜的问题,导致谷歌母公司 Alphabet 的股价暴跌。

此后,谷歌联合创始人 Sergey Brin 回到公司,深入参与技术细节。谷歌通过 27 亿美元的交易重新招募了 Daniel De Freitas 和 Noam Shazeer 等顶尖研究人员,加强了 Gemini 的研发力量。

搜索引擎的彻底变革

为了应对 AI 对搜索业务的威胁,谷歌启动了名为 Project Magi 的项目,由 Liz Reid 领导:

1. AI Overviews:在搜索结果顶部提供简短的 AI 生成摘要。

2. AI Mode:一种类似于聊天机器人的搜索选项,能够直接回答复杂查询。

3. 多模态训练:与 ChatGPT 早期主要针对文本训练不同,Gemini 从一开始就针对文本、代码、音频、图像和视频进行了原生多模态训练。

商业与竞争现状

谷歌的 AI 战略已经开始产生实质性收益,包括搜索广告、消费者订阅版本以及为企业提供的付费服务。

用户增长:截至2025年10月,Gemini 的月活跃用户数已超过 6.5 亿,而同年7月这一数字为 4.5 亿。

法律反垄断的转机:有趣的是,AI 的兴起反而帮助了谷歌的法律诉讼。联邦法官在裁定谷歌在搜索领域存在垄断时,认可了 AI 聊天机器人正在成为一种新的搜索竞争形式。

未来态势:谷歌首席执行官 Sundar Pichai 在2025年12月的内部备忘录中表示,谷歌正以极佳的姿态结束这一年。虽然 OpenAI 依然拥有庞大的用户群且在不断更新 ChatGPT 版本,但谷歌凭借垂直整合的成本优势和强大的收入基础,已在竞争中占据了重要先机。


原文:https://www.wsj.com/tech/ai/google-ai-openai-gemini-chatgpt-b766e160

评论:https://news.ycombinator.com/item?id=46528389

Report Page