黄仁南宫28官网- 南宫28官方网站- APP下载勋说‘Scaling Law被低估100倍’AI推理的token战争会压垮中小企业吗?
2026-03-18南宫28官网,南宫28官方网站,南宫28APP下载
黄仁勋提出“scaling law被低估100倍”,核心是强调AI推理需求爆发远超预期,但中小企业可通过开源生态、成本下降趋势及新型商业模式缓解压力,而非必然被“token战争”压垮。
黄仁勋认为,当前算力需求呈“双重指数级增长”,尤其是AI推理环节的token消耗量远超预期。他提出三大规模法则:预训练、强化学习(后训练)和推理,其中推理是AI落地的核心场景,其消耗的token量可能达训练阶段的1000倍以上(例如智能体生成代码需数万token/次)。
原因:智能体(Agent)的普及(如OpenClaw三周下载量超Linux三十年)推动实时交互需求激增,企业为生成token需持续投入算力。
单价暴跌:截至2025年底,百万token价格低至0.028美元(≈0.2元人民币),阿里、腾讯等云服务商已实现“1元购百万token”。
总量激增:因单价下降刺激使用量,企业AI月度支出仍增长36%(IDC数据),形成“效率提升→用量暴增→总成本未降”的杰文斯悖论。
DeepSeek-R1等开源推理模型出现,中小企业无需自研大模型,通过微调即可适配垂直场景,大幅节省训练成本。
黄仁勋强调:开源模型(如DeepSeek-R1)推动“技术平权”,让AI从“高技能”变为“水电煤”式基础设施。
架构创新:类似DeepSeek-R1的模型通过优化推理架构,单token计算量降低50%,响应速度提升5倍。
边缘计算:本地化部署降低云端依赖,例如自动驾驶、工业机器人通过边缘设备处理实时决策。
算力租赁模式(如鸿博股份、首都在线)允许中小企业按token消耗量付费,避免重资产投入。
云厂商推出“缓存命中优惠”,对高频重复查询大幅降价(如阿里云输入缓存0.028美元/百万token)。
传统IT运维向“AI运维”转变,需掌握提示词工程、模型微调等技能,否则效率红利无法释放。
高风险行业(如法律、医疗)因AI幻觉可能承担更高纠错成本(参考律师用ChatGPT伪造案例被罚事件)。
这意味着拥有高效推理能力的企业可将token转化为服务溢价(如智能客服替代人工)。
黄仁勋提出“AI五层架构”:能源层(电力)是底层约束,芯片层(算力)是核心,应用层(智能体)创造价值。
中小企业需关注“电算协同”(如绿电+数据中心),降低单位token能耗成本。
短期:拥抱开源模型+算力租赁,优先在容错率高的场景试水(如营销文案、基础客服)。
长期:培养复合型人才(行业知识+AI工具使用),布局边缘计算与能源优化。
本质:token战争非零和博弈,而是推动企业从“人力密集型”转向“智能密集型”——一如黄仁勋所言:


