KDay.world
Day 184/1000观察时代
DAY 183 / 1000观察时代7 分钟阅读

1%性能差5倍成本差,AI竞赛逻辑正在被改写

开源模型用重构成本结构的方式,把战场从精度拉到普及

技术前沿AI竞赛开源模型成本优势法律AI教育框架

精度的1%差距,成本的500%代价。

HUMAN PERSPECTIVE

人的视角:有温度的观察与独立判断

47%的差距,1000%的效率

北京海淀区某栋写字楼的电梯里,一个穿格子衫的工程师正盯着手机屏幕。屏幕上是CNBC的报道标题:中国智谱的GLM 5.2模型在关键代理基准测试中仅落后Anthropic的Opus 4.8一个百分点。他看完后没说话,把手机揣进口袋,电梯门开了,他走进一家便利店买了瓶可乐。

这个画面是我朋友上周拍到的。他当时站在那工程师旁边,瞟了眼屏幕,然后给我发了条微信:“你猜他为什么买可乐?”

我说:“庆祝?”

“不是。他说压力太大了,需要糖分。”

一个百分点的差距听着像胜利在望,但那个工程师知道,真正的战场根本不在技术精度上——而在成本、在落地、在“谁能让更多普通人用上”。


开源正在做的事情,不是追赶,是重构

CNBC这篇报道的核心数据其实只有两个数字:

GLM 5.2落后Opus 4.8——1个百分点。但成本——只有五分之一。

这个对比意味着什么?坦白说,它意味着整个AI竞赛的逻辑正在被改写。

过去两年,大家比的是“谁的模型更聪明”。OpenAI和Anthropic烧掉几十亿美元训练最强大的闭源模型,然后按token收费。这是一个典型的“高端市场”策略——只有付得起钱的公司才能用最好的AI。

但智谱的策略完全不同:把模型的性能做到足够好(不是最好),然后把价格砍到让所有人用得起。

这听起来像是“性价比”的老故事——中国制造业最擅长的那种。但区别在于,在AI领域,“足够好”和“最好”之间的差距正在急剧缩小。

一个百分点。在某些任务上,人类连这个差距都感知不到。但五倍的成本差距,每个CFO都能看懂。

更关键的是,美国政府对Anthropic和OpenAI模型的出口限制,正在把大量海外客户推到开源模型面前。这不是“退而求其次”,而是“有更好选择”。当一个开源模型只差1%但便宜80%时,选择闭源模型需要的不是技术判断,而是品牌忠诚度——而企业采购从来不讲品牌忠诚。


真正的锁定,从来不在模型本身

说到品牌忠诚度,我最近看到另一个案例,来自法律行业。

Reed Smith律师事务所最近在康奈尔大学启动了一个“AI领导力项目”,专门培训合伙人如何使用AI。听起来很正常对吧?但注意细节——他们不是在教律师怎么用AI写法律文书,而是在教他们怎么应对AI对计费模式的颠覆。

传统律所的商业模式是按小时收费。一个合伙人一小时收1000美元,他一天工作10小时就赚1万美元。效率越高,赚得越少——这是整个行业的底层矛盾。

AI来了之后,一个初级律师需要花3小时完成的合同审查,AI能在30秒内搞定。问题来了:律所怎么收费?还按小时算?那客户会说“你只用了30秒,凭什么收我3小时的钱”。不按小时算?那整个商业模式需要重构。

这才是真正的危机。AI不是来替代律师的,AI是来摧毁“按小时收费”这个商业逻辑的。

Reed Smith的做法是:先让合伙人理解这个危机,然后重新设计服务模式。比如从“按小时收费”转向“按结果收费”或“订阅制”。但这需要合伙人彻底改变思维方式——而改变一个50岁合伙人的思维方式,比训练一个AI模型难得多。

这个案例让我想到一个更深层的问题:当AI的成本降到几乎为零时,哪些行业会被迫重新定义“价值”?

法律行业只是第一个。接下来会是咨询、审计、教育、医疗——所有“按知识收费”的行业都会面临同样的拷问。


教育的尽头,不是知识,是判断

这就引出了第三个信息点:国际教育转型学会发布的“AI就绪毕业生”框架。这个框架把学生分成六种角色——学习者、研究员、综合者等——并列出30项技能。

听起来很学术,但核心意思其实就一句话:未来教育的目标不是让学生“知道更多”,而是让他们“判断得更好”。

当AI可以记住所有法律条文、所有医学案例、所有历史事件时,“知道”已经不值钱了。值钱的是:知道什么值得问,知道什么答案是错的,知道什么时候该相信AI,知道什么时候该怀疑AI。

这个转变对教育体系的冲击是根本性的。现在的教育体系本质上是在培养“人形搜索引擎”——学生被要求记住大量知识,然后在考试中复述出来。但AI已经是更好的搜索引擎了,而且成本几乎为零。

那么问题来了:当知识变得免费时,我们还需要学校吗?

我的答案是:需要,但需要彻底重构。学校的核心价值将从“传授知识”转向“训练判断力”——这包括批判性思维、伦理判断、跨领域整合能力。这些是AI还没学会的东西,也是人类最后的护城河。

当然,说这话的我,去年还在用ChatGPT帮自己写周报。所以这个判断有多靠谱,我自己也不确定。


一个百分点的隐喻

回到开头那个工程师。他喝完可乐后,回到工位上继续调参。他告诉我朋友,团队的目标不是追平Opus,而是在成本不变的情况下,把性能再提升5%

不是10%,不是20%,就是5%。

这是一个非常务实的数字。因为当成本已经降到五分之一时,再降成本的意义不大——边际效益递减。真正的战场是:在保持低成本的前提下,把性能提升到“足够覆盖90%场景”的水平。

一旦达到这个临界点,闭源模型的高价策略就会彻底崩塌。企业会问:我为什么要花5倍的钱买一个只多1%性能的模型?除非那1%恰好是我的核心场景——但对绝大多数企业来说,不是。

这就是我说的“重构性价比”:不是用更低的价格复制同样的东西,而是用更聪明的架构让同样价格的东西更好用。

一个百分点,听着微不足道。但它背后是整个产业逻辑的转向——从“谁更聪明”到“谁更实用”,从“谁烧钱最多”到“谁活得最久”。

这件事让我想起2006年的一个数据点:当时诺基亚的研发预算是苹果的10倍,但苹果做出了iPhone。优势从来不是靠规模堆出来的,而是靠重新定义战场打出来的。

现在,智谱和越来越多中国AI公司正在做的事情,就是重新定义战场。他们不跟OpenAI比谁更聪明,他们比谁让更多人用上AI。

而一个百分点,就是他们告诉大家:“我们够好了。现在,轮到你们做选择了。”

策展来源与事实依据(3)
CNBC

China's Zhipu is closing in on top U.S. AI models with Anthropic and OpenAI held back

中国智谱的GLM 5.2模型在关键代理基准测试中仅落后Anthropic的Opus 4.8一个百分点,成本却仅为五分之一。由于美国政府对Anthropic和OpenAI模型的限制,开源模型成为有吸引力的替代方案,智能性价比成为关键指标。

查看原始事实依据
Artificial Lawyer

Reed Smith to School Partners on AI – Is This Useful?

Reed Smith在康奈尔大学启动“AI领导力项目”,旨在帮助合伙人应对AI对法律行业的颠覆。文章讨论AI如何改变法律行业的生产方式(如计费模式、培训等),并质疑传统商学院是否足以应对这些变革。

查看原始事实依据
EdSurge

International Society for Transforming Education Expands its “AI-Ready Graduate” Framework

国际教育转型学会发布了扩展版“AI就绪毕业生”框架,涵盖学习者、研究员、综合者等六种角色及30项技能,旨在帮助K-12学生使用AI增强人类技能,超越基础技术理解。

查看原始事实依据

分享这篇观察

生成分享图发布到社交平台

讨论与共鸣(0)

加载评论中...

后参与讨论