19f61a5588
feat: 调整目录名称
182 lines
9.9 KiB
Markdown
182 lines
9.9 KiB
Markdown
## 5 分钟直出 46 页论文!谷歌 Deep Research 完爆 OpenAI,最强 Gemini 2.5 加持
|
||
|
||

|
||
|
||
【新智元导读】谷歌 Deep Research 重大升级,搭载全球顶尖 Gemini 2.5 Pro 模型。5 分钟生成 46 页学术论文、复杂报告转为 10 分钟播客。性能超 OpenAI DR 40%,价格仅为其 1/10。
|
||
|
||
今早,谷歌 Deep Research 迎来史上最强升级,正式搭载了 Gemini 2.5 Pro 全球顶尖模型。
|
||
|
||
这一次,新版本在以下方面得到显著的提升:
|
||
|
||

|
||
|
||
谷歌 CEO 劈柴哥转发力挺。首席科学家、Gemini 负责人 Jeff Dean 也出来为 Deep Research 站台。
|
||
|
||
可见谷歌内部对这款产品的重视程度。
|
||
|
||

|
||
|
||
相较于 OpenAI DR,谷歌在整体性能上飙升超 40%。此外,在指令遵循、全面性、完整性、写作质量方面,谷歌 Deep Research 性能跃升很大。
|
||
|
||

|
||
|
||
在内部测试中,谷歌 DR 生成的报告深受评估者青睐,程度远超其他领先 DR 工具 2 倍多。
|
||
|
||
这意味着,不论你需要分析复杂问题,还是撰写高质量报告,DR 都能得心应手,节省数小时的时间。
|
||
|
||
不过,这次的升级将率先为 Gemini Advanced 订阅用户开放,仅需 19.99 美元,要比 OpenAI DR(200 美元/月)整整便宜 10 倍。
|
||
|
||

|
||
|
||
只需登录网页版、安卓版、或是 iOS 版 GeminiApp,均可第一时间体验新功能。
|
||
|
||
而现在,已经有一大批网友开启测试,效果足够惊艳。
|
||
|
||
5 分钟搞定 46 页论文 + 播客
|
||
|
||
量子物理学家、AI 研究科学家 ChrisUniverse 第一时间对 Gemini 2.5 Pro 驱动的 Deep Research 做了测试。
|
||
|
||

|
||
|
||
体验之后他被深深震撼到了,「我们正处于技术和信息爆炸的奇点,速度前所未有。」他写道。
|
||
|
||
作为一名物理学家,ChrisUniverse 让谷歌 DR 研究了过去五年纳米技术的突破。
|
||
|
||

|
||
|
||
仅仅这一个提示,谷歌 DR 就自己找到并研究了 339 个网站,生成了一篇长达 46 页的完整学术论文。
|
||
|
||
论文列举了 5 个全球知名的纳米技术实验室,详细总结了他们过去五年的重要技术突破以及未来的计划。
|
||
|
||

|
||
|
||
论文地址:
|
||
|
||
https://docs.google.com/document/d/1uxexZharvJJ8ScVFmhrDrFfiYtiSmQ9oeYkZBBxwDZ8/edit?tab=t.0
|
||
|
||
除此之外,论文中还通过表格对这五家研究机构做了详细的横向对比。
|
||
|
||

|
||
|
||
如果担心 AI 的幻觉问题,那也没关系,谷歌 DR 在结尾列出了十几页的数据来源链接。
|
||
|
||
这还不算完,如果你看到这份 46 页的论文比较头疼,那么再加一句提示词,谷歌 DR 立马帮你把论文转成一个 10 分钟的播客!
|
||
|
||
这样你就可以把一篇枯燥的学术论文变成一个类似真人的对话访谈,听着理解其中内容。
|
||
|
||

|
||
|
||
更厉害的是,所有这些过程一共还不到 5 分钟!
|
||
|
||
ChrisUniverse 表示,现在自己了解了全球顶尖的 5 家纳米科技公司,包括它们的核心实验室、突破性成果,以及未来 5 年的重点方向。
|
||
|
||
「这些信息要是放在 2 年前,可能得花我几天甚至几周时间去研究,说不定还更久。」他说。
|
||
|
||
ChrisUniverse 自己也没想到谷歌 DR 如此好用,已经好到让他无话可说了。
|
||
|
||

|
||
|
||
另一位 AI 大佬 Kol Tregaskes 提供一个话题——如何让 AGI 与人类价值观对齐,谷歌 DR 在极短时间内,直出 46 页报告。
|
||
|
||

|
||
|
||
他表示,这次改进比 Gemini 2.0 版本加持 DR 报告长度更多,而且与 OpenAI DR 相当。这从侧面印证了,谷歌基准测试中,DR 的完整性是最强的。
|
||
|
||

|
||
|
||
而且,在报告文末,一共引用了 138 参考链接,在生成过程中查阅了足足 179 个参考网站,对于人类来说,一个时间根本看不完。
|
||
|
||

|
||
|
||
报告地址:https://docs.google.com/document/d/1e4qMho\_5p-yfCx6Dqx8BhjW79qEg4C30uj1f1SKCA8k/edit?tab=t.0
|
||
|
||
沃顿商学院教授 Ethan Mollick 将课堂一项作业扔给谷歌 DR——为一种采用新型光谱技术、成本 75 美元的食物热量检测设备进行定价及总体可获取市场(TAM)分析。
|
||
|
||
他惊喜地发现,Gemini 2.5 加持的 DR 不仅完美完成分析,还提供更多深度洞察。
|
||
|
||
要知道,这类分析通常消耗数小时。
|
||
|
||

|
||
|
||

|
||
|
||

|
||
|
||

|
||
|
||
虽然一片叫好之声,网友 Giulio Leone 也指出了谷歌 DR 的一点问题。
|
||
|
||
他表示,虽然 Gemini 2.5 Pro 加持的 DR 非常强大,但一旦达到 token 数量限制,报告就会中断。
|
||
|
||
Giulio 认为,谷歌应该让报告的生成可以无缝衔接,否则会在严肃的研究中受限。
|
||
|
||

|
||
|
||
胜券在握,DeepMind 注定会赢?
|
||
|
||
不难看出,在 AI 激烈角逐中,谷歌 DeepMind 正以无可匹敌的优势崭露头角。
|
||
|
||
从数据到硬件,从模型到人才战略,他们似乎已经掌握了通往 AGI 的所有关键要素。
|
||
|
||

|
||
|
||
几天前,Artificial Analysis 一份报告中,展示了谷歌在应用、基础模型、云服务、加速器硬件四大关键领域全面开花。
|
||
|
||

|
||
|
||
网友@ai_for_success 分析称,谷歌 DeepMind 具备了海量的数据优势,依托谷歌生态系统的庞大资源,为训练更强大、更智能 AI 提供坚实基础。
|
||
|
||
而目前,DeepMind 拥有业界公认的最优模型阵容,涵盖了多个领域。
|
||
|
||
比如,综合性能最强的旗舰模型 Gemini 2.5 Pro;推理模型 Gemini 2.0 Flash 兼具速度与实用性;Veo 2 成为视频生成领域的翘楚。
|
||
|
||
不仅如此,他们还手握 TPU 这张王牌,专为深度学习任务优化,性能和效率远超传统 GPU。
|
||
|
||
再加上谷歌自身庞大的分发渠道,能够让 DeepMind 的成果无缝集成,迅速抵达全球用户。Google Cloud 更是为 AI 提供高效部署平台。
|
||
|
||
这不,一年一度 Google Cloud Next 今晚将在拉斯维加斯召开,届时还会带来更多新品。
|
||
|
||

|
||
|
||
与此同时,谷歌开发者关系负责人 Logan Kilpatrick 也在频频暗示这周的重大发布。
|
||
|
||

|
||
|
||

|
||
|
||
在人才方面,谷歌 DeepMind 更是通过激进的「竞业禁止协议」,牢牢地锁住了 AI 顶尖人才。
|
||
|
||
据 BI 爆料,DeepMind 部分英国员工在离职后,需遵守长达 6-12 个月的竞业协议,在此期间不得为竞争对手工作。
|
||
|
||
为了确保这些人才不流向对手,他们甚至还会为部分员工提供「花园休假」(garden leave),即在竞业期继续支付薪水,但员工务虚工作。
|
||
|
||

|
||
|
||
与其让人才立即跳槽至对手公司,谷歌宁愿花钱让他们休假一年。
|
||
|
||
一位前 DeepMind 员工无奈地表示,「在 AI 这个圈子,一年后再入职,谁会签你」?
|
||
|
||
的确,在 AI 日新月异的当下,6 个月空窗期就可能让人错误无数机会,更不用说整整一年。
|
||
|
||
就连微软 AI 副总 Nando de Freitas 曾公开抨击了这种做法,称其为「滥用权力」。
|
||
|
||

|
||
|
||
谷歌这种做法,无非只有一个目的,在 AGI 竞赛中拔得头筹。
|
||
|
||
前谷歌员工甚至表示,「当前 AI 热潮如同『太空竞赛』,这是我职业生涯中看到如此疯狂的战争。领先 6 个月或是 1 年,可能就意味着一切」。
|
||
|
||
大模型、人才、数据、硬件,谷歌 DeepMind 几乎在这场终极赛的每个环节,都占据了制高点。
|
||
|
||
AGI 终点尚不明朗,但至少现在,他们已经手握胜券的所有筹码。
|
||
|
||
参考资料:
|
||
|
||
https://x.com/GeminiApp/status/1909721519724339226
|
||
|
||
https://x.com/testingcatalog/status/1909725934846116209
|
||
|
||
https://x.com/ChrisUniverseB/status/1909744703504793952
|
||
|
||
> 来源:新浪财经 APP
|