
今天分享的是:OpenAI Atlas测试报告(二)
报告共计:51页
OpenAI Atlas及同类AI浏览器测试报告总结
2025年10月24日,郎瀚威及猫猫头团队发布了OpenAI Atlas测试报告(二),对OpenAI Atlas、谷歌Gemini浏览器插件、Perplexity Comet、Genspark浏览器四款AI产品,围绕视频特定信息提取、简历转为网站、旅行储蓄预算规划、创业公司融资调研、查看日历预订餐厅五项复杂任务展开测试,旨在探索各产品在长流程、高难度场景下的执行能力边界。
测试结果显示,四款产品整体正确率差异明显。OpenAI Atlas、Perplexity Comet、Genspark浏览器的正确/错误比例均为4/1,表现较好;谷歌Gemini浏览器插件则为2/3,在多项任务中存在短板。耗时方面,谷歌Gemini插件平均仅34秒,效率突出,但Perplexity Comet和Genspark浏览器在核心任务中展现了更强的执行力。
具体任务表现上,视频特定信息提取任务中,Perplexity Comet和Genspark浏览器成功提取全部7个功能点,而OpenAI Atlas与Gemini插件因无法直接读取视频内容导致失败;简历转为网站任务中,Perplexity Comet和Genspark浏览器能生成可下载文件,OpenAI Atlas和Gemini插件仅提供代码或简陋页面;旅行储蓄预算规划任务中,OpenAI Atlas和Genspark浏览器完成Excel格式预算表并给出省钱建议,Gemini插件因功能限制未完成分析;创业公司融资调研任务中,四款产品均成功筛选目标公司,Genspark浏览器速度最快且信息筛选精准,Gemini插件存在信息缺失问题;查看日历预订餐厅任务中,仅OpenAI Atlas打通全流程,其余三款均因系统限制或功能不足失败。
用户反馈与市场格局方面,OpenAI Atlas发布后引发广泛讨论,但舆论多被段子和梗图主导,用户对Chrome迁移成本、隐私策略、平台限制等问题存在顾虑。Perplexity作为竞品,虽用户社群活跃但影响力有限,面临底层模型方产品化带来的竞争压力。
测试团队认为,AI浏览器的核心竞争力已从信息交付转向执行力,底层模型能力提升后,产品迭代速度加快。当前市场仍处于用户习惯培育阶段,巨头与创业公司各有优势,Wrapper型产品面临价值压缩挑战,未来行业将向PC端联网AI助手和本地化AI助手两大方向发展。
以下为报告节选内容
)

)
)
)
)
)
(渲染对什么要求高))
(地包天牙齿矫正能改善下巴前突吗))
)
)
)
)
)
)
