OpenAI Atlas测试报告（二）

fjmyhfvclm2025-11-02 22

今天分享的是：OpenAI Atlas测试报告（二）

报告共计：51页

OpenAI Atlas及同类AI浏览器测试报告总结

2025年10月24日，郎瀚威及猫猫头团队发布了OpenAI Atlas测试报告（二），对OpenAI Atlas、谷歌Gemini浏览器插件、Perplexity Comet、Genspark浏览器四款AI产品，围绕视频特定信息提取、简历转为网站、旅行储蓄预算规划、创业公司融资调研、查看日历预订餐厅五项复杂任务展开测试，旨在探索各产品在长流程、高难度场景下的执行能力边界。

测试结果显示，四款产品整体正确率差异明显。OpenAI Atlas、Perplexity Comet、Genspark浏览器的正确/错误比例均为4/1，表现较好；谷歌Gemini浏览器插件则为2/3，在多项任务中存在短板。耗时方面，谷歌Gemini插件平均仅34秒，效率突出，但Perplexity Comet和Genspark浏览器在核心任务中展现了更强的执行力。

具体任务表现上，视频特定信息提取任务中，Perplexity Comet和Genspark浏览器成功提取全部7个功能点，而OpenAI Atlas与Gemini插件因无法直接读取视频内容导致失败；简历转为网站任务中，Perplexity Comet和Genspark浏览器能生成可下载文件，OpenAI Atlas和Gemini插件仅提供代码或简陋页面；旅行储蓄预算规划任务中，OpenAI Atlas和Genspark浏览器完成Excel格式预算表并给出省钱建议，Gemini插件因功能限制未完成分析；创业公司融资调研任务中，四款产品均成功筛选目标公司，Genspark浏览器速度最快且信息筛选精准，Gemini插件存在信息缺失问题；查看日历预订餐厅任务中，仅OpenAI Atlas打通全流程，其余三款均因系统限制或功能不足失败。

用户反馈与市场格局方面，OpenAI Atlas发布后引发广泛讨论，但舆论多被段子和梗图主导，用户对Chrome迁移成本、隐私策略、平台限制等问题存在顾虑。Perplexity作为竞品，虽用户社群活跃但影响力有限，面临底层模型方产品化带来的竞争压力。

测试团队认为，AI浏览器的核心竞争力已从信息交付转向执行力，底层模型能力提升后，产品迭代速度加快。当前市场仍处于用户习惯培育阶段，巨头与创业公司各有优势，Wrapper型产品面临价值压缩挑战，未来行业将向PC端联网AI助手和本地化AI助手两大方向发展。

以下为报告节选内容