首页
新闻
百科
科技
健康
娱乐
时尚
美容
登录
标签
DeltaNet
线性注意力回归!Kimi新模型引爆,MiniMax却悄悄换回传统架构(注意力模型的应用)
MiniMax团队发布了其新的2300亿参数模型M2,但出人意料地放弃了线性注意力,回归了常规注意力机制然而,上周,Kimi团队发布了其全新的Kimi Linear模型,再次将线性注意力拉回舞台中央。 虽…
注意力
DeltaNet
MiniMax
团队
模型
fjmyhfvclm
1月前
24
0