本文字数:3331|预计6分钟读完

芯模适配,做广做深。


“你要么买不到卡,要么拿到卡用不起来。”

范式创始人、CEO戴文渊,向《21CBR》提了个判断,算力极度稀缺,将是未来5-10年的常态。

怎么把每张能用的卡开发到极致,怎么助推国产算力从“能用”走向“好用”,正是戴文渊和他的范式,所深耕的生意。

他在一线,每天都感受着国产算力的生态爆发。今年1-3月,范式的Token调用量,同比激增近6倍。

AI产业化这条路,戴文渊已跑了十几年。这位上交大毕业生,曾经的ACM程序设计竞赛冠军、百度最年轻的T10科学家,所选的路,从来不是人多的那条。


范式创始人、CEO戴文渊

很多人说,市值约160亿港元的范式,是家让人看不懂的公司。

大模型时代,范式先喊出AIGS(以生成式AI重构软件),而后于2025年实现集团化升级,核心主业转向以算力为中心,并拓展消费电子、能源等新业务方向。

戴文渊确立AI Platform、API业务、Agentic AI业务为全新的“三驾马车”,算力这盘大棋,他到底准备怎么下?

在与《21CBR》记者2个小时的对谈里,戴文渊分享了范式全新的蓝图故事。

1

芯模搭桥

市面上,各种国产算力和模型越来越多,但芯模的双向奔赴,并非易事。

“Hugging Face上两三百万个模型,如果你把它们全下载下来,直接放国产卡上,可能99.99%的模型都跑不起来。”戴文渊向《21CBR》表示。

不同模型需分别适配国产芯片,手动调试耗时长、重复劳动多;即便买到了算力卡,也可能因缺乏配套的模型生态,难以充分利用。

格局越是分散,做AI时代的“安卓”,越有机会,这是范式的切入点。

基于过往的“先知平台”,戴文渊孵化出AI Platform业务,其聚合范式十年来在AI工程化、行业建模和算力调度上的核心能力,三大新品齐头并进。


其中,ModelHub XC(信创模盒)致力于解决“多芯片×多模型”的适配难题,于2025年9月发布,手里有个重要武器EngineX,将适配从过去的手动变成自动化处理。

ModelHub XC初期只有几百款适配模型,成长速度远超预期,“10万模”提前4个月刚完成,每周新适配的数量以几千为单位增加

戴文渊有信心,明年更进一步,冲击百万级规模。届时,信创模盒有望同全球最大模型社区HuggingFace,掰一掰手腕。

范式同步开发HAMi vGPU,实现异构算力的统一切分、隔离和调度,其价值在于,能将一张昂贵的GPU卡切得很细,甚至切到1%的算力粒度,让开发者只为需要的资源付费。


这样,就让算力像蛋糕一样,吃多少切多少。

“直接给一台国产卡的裸机,对绝大多数开发者而言,无从落地AI应用。”

戴文渊向《21CBR》解释,每款国产卡都可以选择哪些模型,每个模型应该选怎样的卡去跑,怎样选型性价比会更高,这里范式可以提供很多增值服务。

当芯、模的调度各有了一根指挥棒,怎么让这两个平台产品无缝联动起来,需要一个AI云

范式又推出“PhanthyCloud”,一个面向企业级大模型应用的智能云底座,将GPU动态调度等能力,通过云的形式输出。


按戴文渊的话来说,范式搭建的整个AI平台,就是解决两个关键词。

一是“用不起来”,比如客户买了某个国产卡,下载了Hugging Face某个模型,发现跑不了;二是“用不起”,对方兜里只有100万元,服务器少说得200万元,怎么替对方花小钱办大事。

他用“苹果IOS和安卓”,就现在的阵营打了个类比:

英伟达GPU,在用烟囱式的方式做CUDA垂直生态,有点类似iOS;新兴的国产GPU单打独斗,性能未必能抗衡,抱团组合,力量更大。

范式要搭的就是“安卓”式的算力平台,能让同样的 芯片跑更多模型,同样模型可选型更高效的算力。

2

做广做深

范式的“三驾马车”,AI Platform是压舱石,侧重国内、中大型客户。

在此之上,长出来的API和Agentic AI两大业务,前者要敲开众多中小客户的门,国内外市场两手抓;后者往产业纵深方向走,赋能千行百业。

在戴文渊眼里,API业务有机会成为第二增长曲线,甚至超过平台业务体量。


背后的拉动力仍在于,算力和模型需求激增。

“今年大家普遍有个感受,用AI做个PPT、写个稿,越来越慢了。”戴文渊解释,Token供不应求,所有AI公司产出的Token,都会迅速被市场消化掉。

4月底,范式宣布,斥资4亿元采购GPU服务器及相关配套设备,重点投入API业务线。

大手笔备足“弹药”,在于扩张速度足够可观:范式2026年1-3月的Token收入,超2025年全年总和,季度内每月调用量均环比翻倍

API业务,按Token使用量付费,支持B端客户、消费电子终端、开发者快速集成模型与算力资源,兼顾C端运营,妥妥的“Token工厂”。


早在2023年,范式就在做Token出海。

“当时的想法是业务需要出海,考虑到做中小客户或C端会更容易,选择了把Token卖向海外。”

戴文渊透露,从20 23-2025年,这块业务量每年都在翻番增长,进入2026年,随着智能体大爆发,就远不止翻番了,而是数倍、数十倍地往上翻

本质上,AI Platform和API业务,都是范式围绕算力,自身核心能力的端到端输出,只是形式不同,前者按云平台的做法,后者用Token方式。


到Agentic AI业务这里,范式的输出方式、身份变了,从主导者变合伙人,它要找更多的“搭子”,一起做生意,以按结果收费的形式,来分享业务的收益。

能源领域,戴文渊已围绕电力交易场景,跑出较成熟的案例。

“未来电力的增长,必然要靠新能源,一个最大问题,在于绿电不稳定,尤其风电。”

他解释,范式的全链路电力交易AI解决方案,在于用AI精准预测风光发电的出力波动,预判缺口、动态调配,再联动电力市场交易,让每度不稳定的电,在合适的时间、价格被利用。


范式已与国内储能龙头海博思创,合资成立能量晶体公司。这个特别的名字,在《变形金刚》里有出现,是让汽车人和霸天虎争抢的奇特能量。

今年2月,范式成立智慧能源业务板块“范式方舟”,释放做大版图的信号。

深挖行业场景的Agentic AI业务,可复制性强,一旦跑通一个,能力及模式可快速复用。

“天花板足够高”“政策环境对科技企业足够开放”,这是戴文渊评判是否下场的两个标准,他还盯上了“AI+文娱”。


5月20日,范式宣布牵手欢喜传媒,这是家深耕影视内容的头部公司,合作张艺谋、王家卫等大量名导。

根据协议,双方拟成立合资公司为合作平台,探索文娱智能化,还签下API大单,三年采购不低于2亿美元的API服务。

“我们要找更多伙伴一起合伙创业,大家挣了钱一起分。”戴文渊说。

3

再造范式

“现在升级到范式集团,业务视野要更开阔,要关注C端,关注海外。”

戴文渊向《21CBR》表示,放眼望去,如果要找一家参照对标的公司,范式现阶段比较像Nebius

Nebius市值约580亿美元(6月5日),其有两块核心业务,专为AI工作负载设计的Neocloud(新云)以及Token Factory,可对应范式的AI 云平台及API业务。


范式最大的护城河,在于平台生态形成转换成本。在Token业务严重供不应求的当下,竞争的核心不在于“长板”有多长,而在“有没有短板”。

“想象下你要造个车,买不到原材料橡胶,车就会缺轮子,哪怕你能造出最好的玻璃、最好的发动机引擎,也实现不了。”

戴文渊以此来强调,AI公司的最大挑战,在于能否把所有短板快速补齐,任何一个环节有短板,都无法实现端到端交付;确保中立第三方的定位,则是实现的前提。

“做到没有短板”,也是他提给团队的要求,对系统级能力的重视,体现在产品迭代上。


以前起码几十人的开发团队,速度按月计,到如今,借助内部AI开发平台,创新周期缩短到按小时计,早上开会讨论产品思路,晚上基本原型就能出来。

在范式,戴文渊不属于“爱给员工上课的CEO”那列,他也不认为自己“厉害”。

“员工应该比CEO厉害,应该由他们来告诉我,这个世界多了哪些新的东西,启发他们用新的模式,做出了优秀的产品。”他说,应该要向员工学习

“AI能写所有软件的时候,离AGI就不再遥远。”

他判断,行业的下一个里程碑,是AI for AI,即AI开始自我驱动,届时,其发展将不再受限于科学家的精力。按业内乐观的估计,最快2年内能看到相关进展。

完成从“第四范式”到“范式集团”的跨越,2025年,范式营收71.35亿元,全年首度扭亏为盈,2026年在手订单超89亿元。


在戴文渊看来,范式的自我认知很清晰,无可避免的是,市场对跳向AI 2.0的范式,认知的转变仍存一定偏差,很多人仍认定这是家SaaS公司。

我们早在2023年就提出用AI重构SaaS,又怎么可能把自己做成一家会被AI替代的公司?”戴文渊反问道。

新的周期里,如何证明自己,范式需要时间。

回看已走的路,戴文渊觉得,所有AI行业从业者,都是幸运的。只是,同行们常有的兴奋交织焦虑的情绪,他很少有。

“你看到了趋势,知道未来在哪,也知道自己能抵达那边,你就不会焦虑。”

图片来源:范式智能,除标注外

若您对文章内容有建议或异议,请联系编辑部。

办公电话:020 87399753