
讲的是美国科技谷歌的大发展,或将影响到我们的未来!
前些天,谷歌没有任何铺垫地扔出王炸时,围观者的直观感受是:它似乎真的弄懂了我们所在的这个物理世界!

业界还在猜测GPT-5何时降临。包括SamAltman和马斯克在内的对手们,不得不向谷歌AIStudio页面的更新按下了点赞键。Gemini3并不是只为了在对话框里陪你聊天而生的,它带着一种名为“DeepThink”的深度思考能力和令人咋舌的视觉感知力,直接在技术的最前沿撕开了一道口子。
这场发布没有华丽的发布会,只有ModelCard里那两行几乎可以用“残酷”来形容的数据对比,宣告了硅谷旧秩序的暂时终结。


很长一段时间以来,大模型在人类眼中多少带点“高智商低能”的意思。这就是AI届著名的“视觉盲区”问题。
我们来看一组数据:ScreenSpot-Pro测试。这是一个衡量AI能否看懂操作系统界面的标尺。在此之前,即便是强如GPT-5.1,在这个项目上的得分也只有可怜的3.5%。
说得难听点,在面对复杂的计算机图形界面时,此前的顶尖模型和“盲人”并没有本质区别。而Gemini3.0Pro在这个项目上交出的答卷是72.7%。

这不是百分之10或20的提升,这是整整20倍的维度跨越。这个数据的现实投射极其惊人,意味着AI不再需要依赖人类把屏幕上的信息“翻译”成文本喂给它,它长了“眼睛”,能直接看懂软件的UI逻辑,能理解按钮之间的层级关系。
这种复刻不是简单的代码生成,而是深入到了“调整薯条咸度”这种令人发指的细节层面。在这个理解力的加持下,前端开发的概念正在变得模糊。以前你需要手写CSS和JavaScript来调整网页布局,现在,按照网友实测的效果,你可能只需要说一句“给我做一个3D星系”,几秒钟后,一个有着完整银河旋臂、粒子会缓缓旋转的交互式页面就已经生成在你的浏览器里。

更有趣的是那种“一次成型”的确定性。无论是复杂的SVG动画——比如那只著名的骑着独轮车还玩着杂耍的秘书鸟,还是带有物理风速调节功能的虚拟风扇,Gemini3基本摆脱了过去那种需要人类反复抽卡、修修补补的窘境。只要提示词给到位,它不仅能直出UI,甚至能直接注入“灵魂”,把原本枯燥的界面文案改写得动人心弦。
这就不难理解为什么谷歌敢把这一定义为“智能新纪元”。当模型真正看懂了屏幕,能够理解核电站仿真图里的能量流向,甚至搞定三体运动般的混沌可视化时,它离真正的通用人工智能(AGI)就不再那么遥不可及了。


如果说视觉上的突破是给AI装上了眼睛,那其背后运算逻辑的升级,则是给大脑换了更高频的CPU。
这一轮比拼中,谷歌极其隐晦地秀了一把“家里有矿”的优越感。在全世界AI创业公司还在为英伟达的显卡发货期焦虑掉头发时,论文里轻描淡写地提到了一句:Gemini3Pro是完全基于谷歌自家的TPU(张量处理单元)训练的。这些拥有恐怖高带宽内存的定制芯片,不仅省去了等待GPU的时间,更为处理海量参数提供了算力冗余。

这带来的直接结果,就是模型智力水平的暴涨。有一个让学术界倍感压力的测试叫做:人类最终大考,这原本是为了探测现有AI的智力天花板而设计的。在Gemini3出现之前,ClaudeSonnet4.5拿了13.7%,GPT-5.1也不过是26.5%。这个分数的低迷曾让人类稍感安心,仿佛硅基生命离完全理解人类学术巅峰还有很长的路要走。
但Gemini3一上来,在标准模式下就轰出了37.5%。但这还不够,谷歌还藏了一手绝活——“DeepThink”(深度推理模式)。当你打开这个开关,模型会在后台进行类似人类的高强度反思和推演,分数瞬间飙升到41.0%。

这15个百分点的差距,在数学领域表现得尤为露骨。美国数学邀请赛(AIME2025)历来是检验逻辑推理的硬骨头,Gemini3在配合代码执行的情况下,直接拿了个满分。
100%的准确率,甚至没有任何容错的空间。
即便把代码工具拿掉,让模型“裸考”,它的正确率也高达95%,依然稳稳压过GPT-5.1和Claude一头。


现在的程序员用Cursor也就是图个代码补全的爽快,说白了是给人类装了一副“外骨骼”,核心操作还是人。但谷歌想得更远,它直接推出了“自动驾驶”。Antigravity被定义为“智能体优先”(Agent-first)的平台,这里的核心逻辑不再是辅助,而是并行。
这听起来有点像科幻小说里的分身术。在Antigravity的后台,并不只有一个AI在工作。当你下达开发指令时,系统会瞬间分裂出几个不同角色的Agent。那个拿下数学满分的Gemini3.0Pro充当“大脑”,负责总体的逻辑架构。而那个视力72.7%的Gemini2.5ComputerUse则充当“手眼”,它能自己控制浏览器去点点点,验证UI有没有错位,甚至能在终端里自己跑测试代码。

你可以想象这样一个场景:你只说了一句“我要做一个3D飞船游戏”。后台瞬间就忙开了:AgentA正在写飞船的物理碰撞逻辑,AgentB已经在浏览器里测试飞船能不能飞,AgentC正在旁边吭哧吭哧地画贴图。这三个“人”是同时开工的,互不干扰却又协同作战。对于那些还在用传统IDE一个文件一个文件敲代码的开发者来说,这种降维打击确实让人有一种无力感。
这也就是为什么沃顿商学院的教授会感慨:即便你不是程序员,你也得关注Gemini3。因为未来所谓的操作电脑,本质上都会变成写代码,而现在,AI正在接管“写”这个动作。

当然,要说谷歌就此彻底“终结程序员”还为时尚早。虽然在直出漂亮应用和游戏方面Gemini3表现得惊艳全场,但在SWE这种考验超长程、超复杂后端逻辑的硬核测试中,它拿到的76.2%还没有超过77.2%。
对于开发者而言,比拼“代码手速”的时代结束了,比拼“审美品味”和“脑洞”的时代开始了。因为如果一个prompt就能生成魔兽世界般的宏大场景,那你唯一的限制,真的就只剩下想象力了。
)
)
)
)
)
)
)
)
)
)
)
)
)
)
)
)