WAIC2025 的展厅里,具身智能机器人的舞蹈表演吸引着观众的手机镜头,而不远处的国产算力展区却略显冷清。这种热闹与冷清的反差,恰如当下 AI 产业的真实写照:台前的应用繁花似锦,幕后的算力根基却仍在艰难生长。无问芯穹 CEO 夏立雪站在自家展台前,望着往来的稀疏人群,语气坚定:“算力就像水电,用户需要的不是巨型发电站,而是即插即用的插座。” 这位清华电子系博士创立的公司,在两年内融资近 10 亿元,正试图用 “三个盒子” 改写算力分配的规则,也为国产芯片的突围寻找新路径。

算力结构的重塑,正在颠覆行业的游戏规则。当生成式 AI 从模型训练的 “暴力时代” 进入产业落地的 “推理时代”,算力需求的天平正在倾斜。夏立雪团队观察到一个关键变化:训练与推理的算力需求比,正从 1:9 向 5:5 转变。这意味着,除了科技巨头动辄万卡级的超大集群,更多中小团队需要的是灵活、弹性的算力资源。“就像城市电网,既要有三峡大坝这样的超级工程,也得有遍布街角的充电桩。” 夏立雪打了个比方。这种结构性转变,让国产芯片看到了弯道超车的机会 —— 在推理场景中,经过深度优化的国产方案,完全能与英伟达等国际巨头正面抗衡。
国产芯片的 “好用”,成了破局的关键。夏立雪坦言,国产芯片在绝对性能上与顶尖 GPU 仍有差距,但在特定场景下的优化空间巨大。无问芯穹正在做的,就是为不同芯片打造一门 “世界语”:通过软件层的适配,让开发者无需修改代码,就能在国产芯片上顺畅运行模型。“用户不该关心用的是哪款芯片,只需要知道能不能完成任务。” 这种 “屏蔽硬件差异” 的思路,已在多个案例中得到验证:某自动驾驶团队使用国产芯片部署推理模型,经过优化后延迟降低 40%,成本仅为原方案的三分之一。更重要的是,当开发者习惯了这种 “无感切换”,国产芯片的生态壁垒便会逐渐瓦解。
算力计费模式的创新,正在激活生态的毛细血管。从按 GPU 时长收费到按 token 计费,再到红杉资本提出的 “按结果付费”,算力定价的演变折射出产业落地的迫切需求。夏立雪认为,按 token 计费是当前阶段的最优解 —— 它像一把尺子,让开发者能清晰衡量投入与产出。但他更看好未来的分层模式:“就像广告从按曝光收费到按点击转化收费,AI 算力也会走向‘保效果’与‘按用量’并存。” 无问芯穹推出的 “三个盒子”,正是这种思路的实践:大盒子服务国家级超算中心,中盒子适配智算中心,小盒子扎根终端设备,各自对应不同的计费场景,最低可支持三五人团队的轻量化使用。
国产算力生态的闭环,仍需跨越三道门槛。夏立雪指出,当前最大的挑战在于 “软硬协同”:算法工程师不懂芯片架构,硬件设计师不理解模型需求,导致大量算力空转。他的团队正在做的,就是当 “翻译官”—— 把算法需求拆解成芯片能理解的指令,让每平方毫米的硅片都物尽其用。其次是生态打通,需要让习惯了英伟达体系的开发者愿意尝试国产方案,这需要从工具链到社区支持的全链条适配。最后是商业模式的可持续,不能依赖政策补贴,而要通过效率提升形成正向循环。“当国产芯片的综合成本降到国际水平的 70%,市场自然会用脚投票。”
展望未来,夏立雪用 “短期高估、长期低估” 评价 AI 的产业化能力。他认为,当前的泡沫终将散去,但 AI 在多智能体协作中的潜力尚未被充分认知。“就像互联网早期没人能想到外卖会重构餐饮行业,AI 的真正变革可能藏在那些尚未被发明的应用场景里。” 对国产芯片而言,这意味着巨大的机会 —— 当推理需求渗透到工厂、医院、农场等千行百业,定制化、场景化的解决方案将成为主流,而这正是国产芯片可以深耕的土壤。
离开 WAIC 展厅时,夜色已浓,夏立雪的手机收到一条消息:某创业团队用他们的中盒子部署了电商客服大模型,推理成本降低 60%。他笑了笑,转发给团队群。在算力革命的浪潮中,这样的微小进步或许并不起眼,但正是无数个这样的瞬间,正在悄然改写国产芯片的命运。从 “发电站” 到 “插座” 的跨越,不仅是技术的迭代,更是思维的转变 —— 当算力真正成为普惠的公共资源,国产芯片的春天或许就不远了。