黄仁南宫28官网- 南宫28官方网站- APP下载勋说‘Scaling Law被低估100倍’AI推理的token战争会压垮中小企业吗？

2026-03-18

　　南宫28官网,南宫28官方网站,南宫28APP下载

黄仁南宫28官网- 南宫28官方网站- 南宫28APP下载勋说‘Scaling Law被低估100倍’AI推理的token战争会压垮中小企业吗？

　　黄仁勋提出“scaling law被低估100倍”，核心是强调AI推理需求爆发远超预期，但中小企业可通过开源生态、成本下降趋势及新型商业模式缓解压力，而非必然被“token战争”压垮。

　　黄仁勋认为，当前算力需求呈“双重指数级增长”，尤其是AI推理环节的token消耗量远超预期。他提出三大规模法则：预训练、强化学习（后训练）和推理，其中推理是AI落地的核心场景，其消耗的token量可能达训练阶段的1000倍以上（例如智能体生成代码需数万token/次）。

　　原因：智能体（Agent）的普及（如OpenClaw三周下载量超Linux三十年）推动实时交互需求激增，企业为生成token需持续投入算力。

　　单价暴跌：截至2025年底，百万token价格低至0.028美元（≈0.2元人民币），阿里、腾讯等云服务商已实现“1元购百万token”。

　　总量激增：因单价下降刺激使用量，企业AI月度支出仍增长36%（IDC数据），形成“效率提升→用量暴增→总成本未降”的杰文斯悖论。

　　DeepSeek-R1等开源推理模型出现，中小企业无需自研大模型，通过微调即可适配垂直场景，大幅节省训练成本。

　　黄仁勋强调：开源模型（如DeepSeek-R1）推动“技术平权”，让AI从“高技能”变为“水电煤”式基础设施。

　　架构创新：类似DeepSeek-R1的模型通过优化推理架构，单token计算量降低50%，响应速度提升5倍。

　　边缘计算：本地化部署降低云端依赖，例如自动驾驶、工业机器人通过边缘设备处理实时决策。

　　算力租赁模式（如鸿博股份、首都在线）允许中小企业按token消耗量付费，避免重资产投入。

　　云厂商推出“缓存命中优惠”，对高频重复查询大幅降价（如阿里云输入缓存0.028美元/百万token）。

　　传统IT运维向“AI运维”转变，需掌握提示词工程、模型微调等技能，否则效率红利无法释放。

　　高风险行业（如法律、医疗）因AI幻觉可能承担更高纠错成本（参考律师用ChatGPT伪造案例被罚事件）。

　　这意味着拥有高效推理能力的企业可将token转化为服务溢价（如智能客服替代人工）。

　　黄仁勋提出“AI五层架构”：能源层（电力）是底层约束，芯片层（算力）是核心，应用层（智能体）创造价值。

　　中小企业需关注“电算协同”（如绿电+数据中心），降低单位token能耗成本。

　　短期：拥抱开源模型+算力租赁，优先在容错率高的场景试水（如营销文案、基础客服）。

　　长期：培养复合型人才（行业知识+AI工具使用），布局边缘计算与能源优化。

　　本质：token战争非零和博弈，而是推动企业从“人力密集型”转向“智能密集型”——一如黄仁勋所言：