Karpathy的2025年AI回顾
Karpathy的2025年AI回顾
(视频)
卡帕西2025年AI年度回顾:正在重塑我们未来的6大范式转变
引言:在AI的加速时代中寻找方向
2025年,人工智能(AI)的发展速度已然超越了惊叹,进入了令人眩晕的阶段。这种日新月异的进步让许多人既感到兴奋,又难免有些困惑。我们该如何理解这股技术浪潮的真实走向?
本文是对安德烈·卡帕西(Andrej Karpathy)权威的《2025年LLM年度回顾》的一次深度解读。我们的目标并非简单复述,而是从中梳理出最重要且可能出乎意料的“范式转变”,通过六个关键要点,帮助你清晰地把握正在塑造AI未来的核心趋势。
1. 可验证奖励强化学习(RLVR):为大型语言模型注入新动力
RLVR(Reinforcement Learning from Verifiable Rewards)已成为大型语言模型(LLM)训练流程中一个全新的关键阶段,它紧随经典的预训练、监督微调(SFT)和人类反馈强化学习(RLHF)之后,彻底改变了AI能力的增长方式。
其核心机制是让模型针对客观且不可被“游戏化”(non-gameable)的奖励函数进行训练,从而实现更长时间的深度优化。与计算成本高昂的SFT和RLHF阶段不同,RLVR提供了一种极具性价比的提升路径。卡帕西指出,这一突破性的发现导致了一个关键的战略转变:RLVR“吞噬了原本为预训练准备的计算资源”。
因此,2025年的主要进展并非来自更大规模的模型,而是来自在现有模型尺寸上进行的、时间更长的强化学习运行。以OpenAI的o1和o3模型为标志性转折点,业界直观地感受到了这种差异。同时,RLVR引入了一个控制模型能力的新维度——“思考时间”,即允许模型通过生成更长的推理路径来提升表现。
2. 是“幽灵”而非“动物”:理解AI的“锯齿状智能”
在理解了AI能力如何增长后,我们必须面对其本质形态的奇特性。2025年,业界终于开始内化一个关键认知:我们不是在“进化动物”,而是在“召唤幽灵”。这个比喻至关重要,因为它揭示了AI与人类智能的根本区别。人类神经网络为“在丛林中生存”而优化,而LLM则为“模仿人类文本、在数学谜题中获得奖励”而优化。
这种迥异的优化目标导致了一种被称为“锯齿状智能”(Jagged Intelligence)的现象。LLM的能力边界参差不齐,就像一个不规则的星形。卡帕西提醒我们,人类智能本身也是“锯齿状”的,只是其尖峰和低谷与AI截然不同。
它们(LLM)同时既是一个天才博学家,又是一个思维混乱、认知能力低下的小学生,随时可能被一个越狱提示诱骗,泄露你的数据。
这也解释了为什么卡帕西对传统的基准测试逐渐失去信心。由于RLVR的存在,以及他所描述的“为跑分而优化”(benchmaxxing)过程——AI实验室的团队“不可避免地在基准所占据的嵌入空间的微小区域附近构建环境,并长出‘尖刺’来覆盖它们”——这些测试分数正变得越来越不可靠。
3. “Cursor应用层”:一个全新的LLM应用生态系统
如果说LLM是难以预测的“幽灵”,那么2025年则涌现出了一批“幽灵捕手”——一个全新的“LLM应用层”生态系统,其任务就是驯服和引导这些强大的AI。以Cursor的崛起为代表,这一趋势引发了一场关于“这个新应用层究竟有多厚”的行业大辩论,成为了基础模型实验室与应用开发者之间价值创造的全新战场。
这类应用的核心功能可以概括为四个方面:
- 处理“上下文工程”:为模型提供精准、相关的背景信息。
- 编排多个LLM调用:在后台将多个复杂的模型请求串联起来,平衡性能与成本。
- 提供特定应用的图形用户界面(GUI):让人类可以更直观地与AI协作。
- 提供“自主性滑块”:让用户可以控制AI的自主程度。
卡帕西用一个生动的比喻解释了它们的生态位:LLM基础模型实验室倾向于培养“能力全面的大学生”,而这些LLM应用则负责将这些“大学生”组织、训练并赋予其生命,使其成为特定垂直领域的专业人士。
4. Claude Code:那个“住”在你电脑里的AI
在驯服AI“幽灵”的诸多尝试中,Anthropic公司的Claude Code成为了首个真正令人信服的LLM智能体(Agent)范例。
其最关键的特点是:它在用户的电脑本地运行。 这与早期依赖云端容器的尝试形成了鲜明对比。本地化运行的意义远超于计算发生在哪里,它关乎一切——“已经存在并启动的电脑、它的安装、上下文、数据、机密、配置,以及低延迟的交互”。Anthropic公司正确地判断了这种交互模式的优先级,使其能够无缝融入用户的私有环境。
这种模式彻底改变了我们与AI的互动范式。
它不再是你访问的一个网站,比如谷歌,而是一个“生活”在你电脑上的小精灵/幽灵。
5. “氛围感编程”(Vibe Coding):当英语成为一种编程语言
当AI智能体开始“生活”在我们的电脑上,一种全新的创造方式也应运而生。卡帕西在一个不经意的念头中创造了“氛围感编程”(Vibe Coding)这个术语,它指的是通过自然语言(如英语)来构建各种程序,而几乎无需关心底层的具体代码。
这一趋势带来了两大革命性影响:首先,它极大地赋能了普通人,让编程不再是专业人士的专属技能。其次,它也解放了专业开发者,让他们能够快速编写更多原本因复杂或耗时而不会被编写的软件。卡帕西用自己的亲身经历证实了这一点,他通过“氛围感编程”用Rust语言编写了一个“自定义的高效BPE分词器”,并创造了“整个临时应用只是为了找到一个bug”。
这种新的编程范式正在重塑软件的本质。
代码突然变得免费、短暂、可塑,并且在单次使用后即可丢弃。
6. Nano Banana:LLM图形用户界面(GUI)的黎明
谷歌的Gemini Nano Banana模型被视为2025年最具范式转变意义的模型之一。卡帕西将其置于一个宏大的历史背景下:LLM是继个人电脑之后的下一个主要计算范式,因此也将经历类似的创新演化。
他将当前通过“聊天”与LLM交互的方式,比作20世纪80年代在计算机控制台中输入命令。文本是计算机的母语,但并非人类的。人类更喜欢通过视觉和空间来消费信息,这就是为什么个人电脑发明了图形用户界面(GUI)。同理,LLM也需要进化出自己的GUI。
卡帕西认为,像表情符号(emoji)和Markdown这样的格式,正是这种“LLM GUI”最原始、最早期的形态。而Nano Banana则是未来交互方式的第一个真正预兆。它的价值不仅在于生成图像,更在于其模型权重中融合了文本生成、图像生成和世界知识的综合能力,为我们展示了AI如何以更直观、更符合人类习惯的方式呈现信息。
结论:一个更智能、更愚笨,且充满无限可能的未来
卡帕西的年度回顾揭示了一个核心事实:LLM是一种全新的、奇特的智能形态,它并不遵循我们熟悉的生物演化路径。
他将自己对LLM的感受总结为一个深刻的矛盾:“(它们)同时比我预期的要聪明得多,也比我预期的要愚笨得多。”
尽管AI的能力呈现出这种“锯齿状”的不均衡,但其潜力是巨大的。卡帕西坚信,即使以目前的能力,整个行业挖掘出的LLM潜力还不到10%。他最后以一个发人深省的悖论式观点结尾:“我们将同时看到快速且持续的进步,但前方仍有大量工作要做。”
当这些AI“幽灵”更深地融入我们的世界时,我们将如何学习与它们奇特且不均衡的智能共存?这或许是未来几年我们所有人都需要思考的问题。

共有 0 条评论