创造历史!IBM Granite登顶斯坦福大学基础模型透明度指数(创造历史4二战汉化) 99xcs.com

IBM Granite模型系列在斯坦福大学发布的2025年“基础模型透明度指数”(Stanford Foundation Model Transparency Index)名列第一,并创下该指数的历史最高分。

久久小常识(www.99xcs.com)™

北京,2025年12月16日——基础模型如今无处不在,正在改变商业和日常生活的更多领域,比如,为聊天机器人、代码助手和地理空间模型等各类AI工具提供动力。值得一问的是:我们真的了解它们是如何构建的吗?

这正是斯坦福大学基础模型研究中心所探索的问题。日前,该中心发布了第三份年度基础模型透明度指数报告(Stanford Foundation Model Transparency Index,FMTI)。IBM于2024年开源了其Granite花岗岩模型,但对开发者和最终用户来说,开放性本身并不等同于透明度。FMTI根据数据来源、风险评估、开放权重、外部可复现性、事件报告协议和数据使用政策等100项指标,对主流基础模型的透明度进行评分。斯坦福团队根据评估框架对主要AI公司的模型进行评分,并在FMTI发布前给予公司回应评级的机会。

今年斯坦福评估了13家公司的模型,综合所有领域得分后,IBM Granite 3.3以95%的透明度得分高居榜首,领先第二名23个百分点,较41%的平均分高出54个百分点。

久久小常识(www.99xcs.com)™

展开全文

FMTI从上游、模型和下游三大领域对模型进行评分,IBM Granite在每个领域及总分上均处于领先地位。

在15个主要透明度维度中,IBM Granite有10个维度获得满分100分,包括数据获取、计算能力和下游缓解措施。

对IBM而言,将透明度融入模型核心不仅是道德决策,更是明智的商业选择。IBM模型始终将透明度前置,并贯穿其生命周期。就像全球企业的供应链决策一样,企业需要确保其使用的产品值得信赖。FMTI结果揭示了这一趋势,即企业级模型往往更具透明度。

此外,今年FMTI的整体平均分下降了17分,这意味着其他头部AI公司的模型透明度有所降低。IBM院士、IBM研究院人工智能安全负责人Kush Varshney表示:"尽管许多AI公司对模型透明度的重视不足,IBM始终甚至更加专注于透明度。"数据对比鲜明:在数据属性(Data Properties)维度,IBM获得了满分100分,而其他八家公司得分为零,该类别平均分仅为14分。

除总分下降外,FMTI报告还揭示另一趋势:2025年发布模型透明度报告的公司数量比2024年减少了一半。斯坦福大学基础模型研究中心自行收集了其余数据。

久久小常识(www.99xcs.com)™

在FMTI的14个主要透明度维度中,IBM Granite有10个维度获得满分。在全部14个维度上,其得分均超过所有评估模型平均值。

今年的FMTI结果新增了AI智能体的信息检索能力标准,并首次纳入中国公司的模型。指数编制团队指出,FMTI还进行了模型的开放性评估,不仅包括模型的访问路径数量,还包括是否支持第三方的模型风险研究、跨智能体的互操作性协议等。

IBM是与斯坦福大学合作提供模型信息的公司之一。在提交Granite 3.3的相关数据后,IBM已发布新一代Granite 4.0系列模型。后者基于标准 Apache 2.0 许可证开源,是全球首个获得 ISO 42001 认证的开放模型,并进行了加密签名,确保其符合国际公认的安全、治理和透明度最佳实践。

斯坦福大学Hazy Research实验室的一项近期研究表明,开源的Granite 4.0微型和小型模型在消费级硬件上运行时,也能高效地处理多种AI任务。在他们看来,IBM Granite 4.0系列模型指明了AI行业的发展方向。

IBM院士、IBM研究院人工智能安全负责人Kush Varshney表示:"正如我们不愿食用成分不明的食品或饮料,各行业企业都应该确保大语言模型的透明度。IBM Granite所提供的正是‘从农场到餐桌‘的透明度体验。"

关于IBM

IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175 个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000 家政府和企业实体依靠 IBM 混合云平台和红帽 OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。