单张显卡也能训大模型?无问芯穹”三个盒子”重构AI算力效能边界

2025年WAIC现场,当无问芯穹联合创始人夏立雪说出”一部手机可装载与GPT-3.5同等性能的小型AI”时,台下科技从业者的目光瞬间聚焦——这个曾被视为算力”吞金兽”的大模型时代,正迎来颠覆性的效能革命。

在智能时代加速逼近AGI(通用人工智能)的当下,算力资源的有限性与智能需求的爆发式增长形成尖锐矛盾。传统路径依赖”堆卡式”算力扩张,却受限于成本、地域与异构资源的调度难题。而无问芯穹此次发布的”三个盒子”方案,以”云-边-端”全场景覆盖的系统性设计,为破解这一困局提供了关键钥匙。

大盒子:织就全国算力网,让”沉睡”算力醒过来

所谓”大盒子”,是无问芯穹打造的”无穹AI云”——面向万卡至十万卡级超大规模算力集群的智算网络。其核心突破在于构建了一张深度覆盖全国的”广域算力网”,通过自主研发的”一网三异”调度架构(支持异构芯片、异构架构、异构网络),已接入26个省市、53个核心数据中心的庞大资源池,整合超15种主流芯片架构,总算力规模突破25000P。

这张网的特殊之处在于,它不仅实现了算力的”物理连接”,更完成了”化学融合”。传统算力中心常因任务波动陷入”闲时闲置、忙时过载”的困境,而无穹AI云通过智能调度算法,能将非理想状态的算力(如夜间低负载时段、区域冗余资源)转化为稳定、高效的AI服务能力。目前,该平台已在上海、杭州、北京等AI产业聚集区落地,支撑着包括上海模速空间(全球最大AI孵化器)在内的关键场景——仅后者日均Token调用量就突破100亿,相当于每天处理3000万本《红楼梦》的文本量。

更值得关注的是其”平台+自营”的开放模式:既支持独立智算中心无缝接入,又能为企业构建自有运营平台并融入全国网络。这种灵活性让无穹AI云成为区域算力基建的”操作系统”,真正激活了分散在全国的算力”孤岛”。

中盒子:百卡集群也能玩转大模型,消费级显卡也能”凑份子”

如果说”大盒子”解决了超大规模算力的”怎么用”,那么”中盒子”无界智算平台则聚焦百卡至千卡级集群的”怎么用好”。作为无穹AI云的能力延伸,它专为高校、科研机构及中小AIDC中心设计,已在100多个大型研发场景中验证了可靠性:从3000卡沐曦GPU集群支撑百亿模型600小时稳定训练,到云南移动2000张昇腾卡实现千亿模型商用推理,无界平台用”算优算稳”的实际表现,为中小算力主体打开了参与大模型研发的窗口。

但最震撼的突破在于其最新发布的”全球首个跨地域全分布式联合强化学习服务”。这项技术打破了传统训练必须依赖集中式算力的限制,允许将分散在各地AIDC的零散算力(甚至单张消费级显卡)与中等规模集群结合,共同完成大模型的联合训练。想象一下:一家只有8张消费级GPU的初创团队,也能通过与全国其他零散算力节点协同,参与千亿参数大模型的训练——这在过去几乎是天方夜谭。

这一创新不仅降低了大模型训练的门槛,更重新定义了算力资源的价值:每一份算力,无论规模大小,都能在智能时代的”算力共同体”中找到自己的位置。

小盒子:端侧跑大模型,让AI”长”在设备里

如果说云与中盒子解决了”哪里算”的问题,”小盒子”无垠终端智能则回答了”如何让AI离用户更近”。其核心是”端模型+端引擎+端硬件”的一体化解决方案,目标是将大模型能力深度嵌入手机、PC、汽车等终端设备。

与无问芯穹合作的上海创智院,推出了全球首款端侧本征模型”无穹天权Infini-Megrez2.0″。这款模型的神奇之处在于”以小搏大”:它仅用7B内存占用(相当于手机存储的零头),就能达到云级21B参数模型的智能水平;实际计算量更压缩至3B规模,让终端设备无需依赖云端即可运行复杂任务。更突破性的是,它通过创新的”休眠时段自主运行”技术,让AI PC、手机等设备在用户无感知的待机状态下,仍能持续执行大模型任务——一台设备每年可多释放1000多小时有效工作时间,相当于多了近两个月的”智能待机时间”。

这意味着,未来你的手机可能在充电时自主完成视频剪辑的智能配音,笔记本电脑在合盖休眠时仍在帮你生成会议纪要,汽车的智能座舱能在停车等待时自动规划最优路线……大模型不再是”云端巨兽”,而是真正”长”在了用户的设备里。

效能跃升:用”三个盒子”叩响AGI之门

为什么无问芯穹要打造这套”三个盒子”体系?其背后是对智能时代”资源拐点”的深刻洞察。从传统算法到AI1.0、AI2.0,计算资源始终是智能突破的核心驱动力,但资源的有限性(芯片产能、地域分布、能耗限制)却像一条”隐形红线”,阻碍着AGI的脚步。

无问芯穹给出的解法是”效能跃升”:不是盲目追求更大的模型或更多的卡,而是通过技术创新,让每一份算力发挥更大价值。其提出的”AI应用落地价值空间=场景尺度×计算资源×智能效率”公式,正是”三个盒子”的设计纲领——大盒子扩大计算资源的覆盖广度,中盒子提升集群资源的利用深度,小盒子挖掘终端资源的场景精度,三者共同指向”用有限资源撬动无限智能”的目标。

从云端到终端,从万卡集群到单张显卡,无问芯穹的”三个盒子”正在重构AI算力的效能边界。当大模型不再是少数巨头的专属,当终端设备真正具备”智能自主”能力,我们或许离那个”一部手机装下AGI”的时代,又近了一步。正如夏立雪所说:”智能时代的尺度,正在计算资源与智能效率的双重牵引下极速压缩。”而无问芯穹的”三个盒子”,正是这场变革中最有力的推手之一。

为您推荐