MiniMax的困境与破局:在大模型竞赛中挣扎与探索
日期:2025-06-09 20:46:41 / 人气:38
在AI大模型竞争日益激烈的当下,曾经被冠以“AI六小龙”称号的MiniMax,如今已滑落为“AI四小强”,面临着诸多挑战与困境,但也在不断探索破局之路。
一、推理模型竞赛滞后,MiniMax面临多重压力
1. 推理模型上线延迟,影响估值与发展
在智谱AI、月之暗面和阶跃星辰相继上线自研推理模型后,MiniMax筹备半年多的文本推理模型也即将发布。然而,这一延迟使得MiniMax在市场竞争中处于劣势。外界对其高估值和后续融资是否可持续产生质疑,2024年3月其拿下6亿美元A轮融资后估值达25亿美元,虽传闻当前估值超40亿美元,但迟迟未上推理模型让资本市场开始重估其估值体系。

2. 应用侧与B端受影响,用户与业务拓展受阻
缺失推理模型导致MiniMax在应用侧难以吸引并聚拢更多用户,国内应用坚持不接入DeepSeek更是放大了这一难题。对比腾讯元宝,因率先接入DeepSeek月活用户跃升至行业TOP3。在B端,无法提供推理模型选项可能使公司被迫将更多模型调用需求推向对手,如字节曾靠性价比优势分润走MiniMax部分AI儿童玩具公司的语音模型调用需求。
二、闫俊杰的冒险赌注:架构创新与多模态探索
1. 押注MoE与Linear Attention架构
曾经MiniMax创始人兼CEO闫俊杰在2023年下半年将80%以上的研发和算力资源投入到MoE(混合专家模型),2024年1月其上线的abab6成为国内首个MoE大模型,推动了MoE架构在大模型领域的发展。如今,他又将筹码押在Linear Attention上,早于DeepSeek R1发布近一周推出MiniMax - 01并开源,尝试使用线性注意力架构,公司内部也从Transformer架构逐步更换为线性架构。
2. 追赶推理模型浪潮,目标原生多模态深度推理
R1的发布让MiniMax意识到推理能力的重要性,模型研发团队整个春节期间赶工,目标是做出比R1更好、甚至达到o1或o3相近水准的推理模型,且实现多模态推理能力。闫俊杰试图赶在DeepSeek前面,推出原生多模态深度推理模型,但目前爆料其即将发布的推理模型仅具备文本理解能力,后续是否会加入视觉理解仍留悬念。
三、应用布局豪赌分散精力,战略调整聚焦技术迭代
1. 广泛布局与目标未达,引发人员变动
AI六小龙中MiniMax布局广泛,既做To C又做To B,既做国内又做海外。2024年公司围绕娱乐和生产力工具赛道推出多款产品,还挖来前今日头条用户产品负责人张前川,但最终未能实现收入过亿美元和产品日活过千万的目标。这导致公司后续人员变动和组织架构调整,负责商业化的合伙人兼副总裁魏伟离职,产品负责人张前川淡出公司事务。
2. 重新聚焦技术迭代,应对竞争挑战
经历豪赌后的闫俊杰吸取教训,认识到技术品牌的重要性,不再将用户规模和商业化视作重点,而是重新将技术迭代确立为MiniMax的最重要目标。然而,当下大模型赛道进入淘汰赛,资金持续承压,外界对大模型公司的考核标准从交付MaaS变成交付结果,竞争焦点偏向解决用户问题。MiniMax不仅要解决内部人才和资源问题,还要在竞争中做出技术亮点并保持领先地位。
四、竞争加剧,MiniMax需直面强大对手
当下大模型赛道竞争激烈,字节、阿里、腾讯等已提前上线图像推理模型,而MiniMax延期后的推理模型即将直面DeepSeek R2和GPT - 5的竞争,后两者有望在今年下半年上线。MiniMax想要继续留在牌桌上,需应对诸多挑战,但其寄望于新的原生多模态推理模型重回舞台中央,未来能否成功仍有待时间检验。
MiniMax在大模型竞赛中经历了从领先到滞后的过程,面临着估值、应用、竞争等多方面的压力。闫俊杰的冒险赌注和战略调整体现了公司在困境中寻求突破的努力,但在强大的竞争对手面前,MiniMax需要更加聚焦和高效地发展,才能在这场激烈的竞争中赢得一席之地。
作者:欧皇娱乐
新闻资讯 News
- 那艺娜巡演靠“抽象”出圈,会成...06-30
- "最美郭芙"傅明宪新疆度假晒美照...06-30
- “内衣 CEO” 宋智孝综艺 “暴...06-30
- 甜到冒泡!黄子韬分享陪妻子徐艺...06-30