智谱开源 AutoGLM:与豆包一起对抗互联网巨头围剿(智谱开源大模型) 99xcs.com

最近,字节跳动的豆包手机被其他互联网巨头封杀一事,可谓是闹得沸沸扬扬。

久久小常识(www.99xcs.com)™

作为首款内置了 AI Agent 功能的手机,豆包手机实现了一句话帮用户发微信、点外卖和购物比价,但是万万没想到国民 App 们一个接一个地拒绝豆包手机登录,甚至有些 App 还会将登录的账号临时封禁,因为它们不希望豆包手机从 App 中获取用户数据,影响自己未来的商业利益。

久久小常识(www.99xcs.com)™

但是老狐却认为,这种违背用户主观意愿,强行封杀豆包手机的行为,实属有些拖行业发展的后腿。

罗永浩也发微博吐槽:技术革命是谁都拦不住的,不管试图阻拦它的是各大 App,还是各小 App。不要说是公司,即使是各大国和各小国,也一样拦不住。

久久小常识(www.99xcs.com)™

幸运的是,面对互联网巨头的竞争,豆包手机并非“孤身一人”,同样作为中文 AI 大模型技术的先行者,智谱早在 2023 年就加入了 AI Agent 的 Phone Use 战局。

2024 年,AutoGLM 项目正式启动,专注研究 AI Agent 的 Phone Use 能力。

同年 10 月,AutoGLM 发布了全球首个能自动操作手机的 Agent,被视为第一个具备 Phone Use 能力的 AI Agent;11 月,AutoGLM 实现了人类历史上首个由 AI 全自动发送的红包。

久久小常识(www.99xcs.com)™

今年 8 月,智谱直接上架了面向大众的 AutoGLM 2.0 云机版,为用户带来了永远在线的虚拟手机,不仅用起来更方便,而且和用户隐私数据实现了双向隔离,完全不用担心隐私问题。

久久小常识(www.99xcs.com)™

而在今天,智谱更是玩了个大的,直接宣布 AutoGLM 完全开源,任何人只需下载开源文件,就能够拥有自己的 AI Agent。

不过考虑到可能有朋友对此了解得不多,所以老狐就趁着这个机会,来为大家介绍一下 AutoGLM 是什么,以及开源的意义是什么。

久久小常识(www.99xcs.com)™

AutoGLM 是什么?

了解智谱开源的 AutoGLM 能够做什么之前,我们需要先了解 AutoGLM 是什么。

AutoGLM 并非我们熟悉的 GLM、DeepSeek 等大模型,而是大模型和一系列工具的集合,如果将大模型比作大脑,胳膊和手脚比作工具,那么 AutoGLM 就可以理解为是一个人。

久久小常识(www.99xcs.com)™

以往使用 AI 时,尽管 AI 会讲详细的步骤,但是最终操作手机的依然是人,而 AutoGLM 则能够直接帮你操作手机。

久久小常识(www.99xcs.com)™

所以只要用户用自然语言描述任务,AutoGLM 就能理解用户的意图是什么,在没有外界干预的情况下,就可以看懂手机屏幕的内容并模拟人操作手机,让 AI 从原本只能调取 App 提供的 API 接口,变成真正可以学会使用手机,自动做完一堆我们不愿意自己点点点的动作。

下面老狐就用几个真实的案例为大家介绍一下,AutoGLM 能够帮我们做什么。

当我们上午忙于工作时,只需要对 AutoGLM 说一句:“打开美团,帮我点一个XX外卖”,AutoGLM 就可以自动打开美团,搜索外卖商家的名称,在菜单中找到需要下单的菜品,直接完成加购、下单的操作,只需要我们此时确认付款即可。

久久小常识(www.99xcs.com)™

当第二天早上有会议的时候,如果不确定自己堵车半小时还能不能赶上开会,就可以问 AutoGLM:「第二天早上需要开会,平常过去要 1 小时,假如堵车半小时,7 点出门能不能赶上」,AutoGLM 会先打开日历查看开会的时间,然后再通过 AI 运算告诉你能不能赶上会议。

久久小常识(www.99xcs.com)™

当我们需要筹备周末的旅行计划时,我们可以告诉 AutoGLM 打开小红书,帮我们整理某个地方的旅游攻略,它就会打开小红书搜索此地的旅游攻略,然后告诉我们可以参考哪些旅游攻略游玩。

久久小常识(www.99xcs.com)™

当然,老狐今天举的这些例子还只是冰山一角,因为 AutoGLM 目前已经支持了 50 多款主流的中文应用,几乎涵盖了日常生活需要 AI Agent 操作的全部应用。

久久小常识(www.99xcs.com)™

同时,AutoGLM 还支持泛化能力,这意味着 AutoGLM 也可以迅速学会操作当前不在列表中的 App,这只是时间问题。

久久小常识(www.99xcs.com)™

AutoGLM 开源的意义

不得不说的是,在 AI 圈愈发盛行「贷款营销」风气——用还没有做出的东西搞宣传的当下,智谱完全算是一股清流。

因为智谱开源的 AutoGLM 不仅仅是一个能运行的 Demo,而是一整套 Phone Agent 框架和技术栈,换句话说,任何一家厂商、开发者都能够在自己的设备上完美复现智谱官方的 AutoGLM 2.0 应用的运行效果,一点都不带掺假的。

久久小常识(www.99xcs.com)™

写稿时,老狐就留意到已经有闲鱼卖家上架了 100 元远程帮你配置 AutoGLM 的服务,这下不得不佩服人家的执行力了...

久久小常识(www.99xcs.com)™

但是如果你不想花这 100 元,那你也可以花几分钟时间自己配置一下,因为AutoGLM 的部署流程非常简单,只需要按照教程的内容,逐一在终端中输入后,就能轻松完成功能的部署。

此外,如果你的本地设备算力有限,还可以采用云端服务器部署 AI 模型,算是为社区使用 AutoGLM 扫平了一切障碍。

所以对于手机厂商来说,AutoGLM 的开源意味着他们做 AI 原生手机的技术门槛大幅降低,不必再自己训练 Phone Use 模型,毕竟每一代模型动辄百亿级的 AI 预训练投入,是如今已然饱和、严重内卷的手机市场的厂商难以承受的负担。

久久小常识(www.99xcs.com)™

同时,由于 AutoGLM 是完全开源的方案,手机厂商不需要担心被闭源 AI 方案的技术供应商卡脖子,完全可以放心、深度地融入自家产品生态,而且因为 AutoGLM 支持本地、私有化部署,功能运行产生的数据、日志都可以留在用户手机中,满足用户日益提高的隐私保护需求。

对于开发者来说,AutoGLM 的开源同样意义重大。

原本需要用户长线完成的一系列交互操作,如今可以使用 AutoGLM 框架实现全流程的自动化操作,不需要从零造轮子,而是可以将精力聚焦在具体的业务流程编排中,安心打磨产品。

久久小常识(www.99xcs.com)™

其次,作为业内最早、Phone Use 能力表现最稳定的开源方案,AutoGLM 为学术研究、工业研究提供了一块堪称完美、可复现的试验田,不仅能够在 AutoGLM 的基础上,通过接入不同的模型、算法,测试验证 Agent 系统设计的性能,还可能因此创造出新的人机交互范式。

所以智谱开源 AutoGLM 的举动,实实在在地加速了 AI Agent 手机生态的发展,让生态从封闭、重复造轮子走向开放、共创,原本只有极个别 AI 厂商具有的能力,现在进化为全行业共同拥有、共同打磨的技术底座,彻底打破技术垄断。

老狐还认为,这不但会加速 AI Agent 手机生态的发展,让人人都能用上易用、好用的手机 Agent,也可能会使未来全能的个人 AI Agent 可以更快地到来。

久久小常识(www.99xcs.com)™

结尾

总而言之,作为一个致力于让手机从单纯的「工具」进化成处理琐碎事务的「助理」为目标的产品,AutoGLM 确实做到了,它的的确确可以让用户的日常生活变得更轻松、便捷。

久久小常识(www.99xcs.com)™

从行业角度来看,智谱开源 AutoGLM 的行为既是移动平台新一轮技术革命的开始,也是推动 AI Agent 手机生态发展的关键推动力。

所以,老狐大胆预测:AutoGLM 将会成为 AI Agent 手机时代的一个标志性起点。