首页 > 每日活动 > 每日活动 > MiniMax发布新一代开源模型,首次大规模实现线性注意力机制

MiniMax发布新一代开源模型,首次大规模实现线性注意力机制

发布时间:2025-01-17 22:24:14来源: 13253963632

1月15日,澎湃科技获悉,AI独角兽企业MiniMax上海稀宇科技有限公司(以下简称“MiniMax”)发布并开源新一代01全新系列模型。该系列模型包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax称该系列模型可以实现高效超长文本输入。MiniMax认为,2025年将是Agent高速发展的关键年份,无论是单Agent系统还是多Agent系统,都需要更长的上下文来支持持续记忆和大量通信。

据了解,MiniMax-01系列模型首次大规模实现线性注意力机制,传统Transformer架构不再是唯一的选择。

MiniMax-01系列模型核心性能在多项任务评测结果显示结果

目前领先的大语言模型大都基于Transformer架构,而Transformer核心的自注意力机制是其计算成本的重要来源。为了优化计算效率,MiniMax研究社区提出了稀疏注意力、低秩分解和线性注意力等许多技术。通过使用线性注意力,原生Transformer的计算复杂度可从二次复杂度大幅下降到线性复杂度,在处理长输入的时候具有非常高的效率。

据了解,该模型的参数量高达4560亿,其中单次激活459亿。模型综合性能比肩海外顶尖模型,同时能够高效处理全球最长400万token的上下文,是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。

MiniMax认为,2025年将是Agent高速发展的关键年份,无论是单Agent系统还是多Agent系统,都需要更长的上下文来支持持续记忆和大量通信。MiniMax-01系列模型的推出,正是为了满足这一需求,迈出建立复杂Agent基础能力的第一步。

此外,MiniMax声称受益于架构的创新、效率的优化、集群训推一体的设计以及内部大量并发算力复用,得以用业内最低的价格区间提供文本和多模态理解的API,标准定价是输入token1元/百万token,输出token8元/百万token。

目前,MiniMax-01系列开源模型已应用于MiniMax旗下产品海螺AI,并在全球范围内上线,企业与个人开发者可前往MiniMax开放平台使用API。

每日活动更多>>

吴迎秋:不要将广本P7看成是一款“快赢”的车 为什么说刚上市的钛3,打了iCAR V23一闷棍? 力压合资燃油SUV拿下销量第一,吉利星越L凭什么? 家庭旗舰SUV终极对决:问界M8以价换量,理想L9还能守住王座吗? 静谧雅致 逐心而愈 劳斯莱斯闪灵与健康生活的诗意共鸣 2025年上海市总工会幼儿园工作人员招聘公告(3人) 2025年上海市卫生和健康发展研究中心(上海市医学科学技术情报研究所)工作人员招聘公告(简章)(1人) 挪威科学家用了铝导体替代铜导体 可减轻电动汽车重量 通用汽车田纳西州工厂停产凯迪拉克XT6 Foretellix:迈向高级自动驾驶——基于数据驱动的自动驾驶开发验证工具链 起亚下调2030年全球销量目标至419万辆 车窗觉醒:追得OMTD光电膜开启汽车美学的\"第四幕\" 3月乘用车市场“爆发”,自主品牌狂揽63%份额,新能源渗透率回升至51% 底特律盖世之夜—重新定义中国市场价值 上市定档 吉利熊猫mini元气熊官图发布 2025广汽科技日:广汽星灵安全守护体系发布,昊铂HL正式上市 “一个温暖的家,一辆白内的它”-MAZDA EZ-6白内焕新登场 上海车展合资车将现“绝地反击”?一汽-大众要用技术绞杀新势力 吉利熊猫 mini 元气熊官图惊艳发布!全新外观,4 月 15 日盛大上市 合资新能源的“价格屠夫”,长安马自达EZ-6如何以实力突围? 上汽集团如何以“平权”重构全球汽车产业格局 上汽集团与地平线深化合作,打造全新智驾体验车型 新款大众探歌正式上市!三款车型齐发,2680 毫米轴距诚意满满 “老大”上汽和它的供应商伙伴们 特斯拉中国下架Model S/X,所以是被小米搞得吗? 换1.5T,外观大变,丰田新一代卡罗拉SUV明年首发 上海车展提前看,款款都是王炸车型 比亚迪全民智驾体验日全国巡展开启|加速高阶智驾普及 2025上汽之夜 预见你的需求 才是真正的智能 别克GL8陆尚亮相,百公里油耗只有6.68升?30万级市场稳了!