AI的循环时代:智能体未来
AI的循环时代:智能体未来
(视频)
AI 精神错乱:安德烈·卡帕西眼中的智能体新纪元与编程的终结
引言:从“手写代码”到“意志体现”的飞跃
前 OpenAI 核心成员安德烈·卡帕西(Andrej Karpathy)最近正处于一种他自称为“AI 精神错乱(AI Psychosis)”的癫狂状态。这并非医学意义上的病症,而是一位顶尖技术专家在面对指数级增长的生产力杠杆时,产生的极度焦虑与亢奋。在这种状态下,他每天长达 16 小时“锁死”在屏幕前,但他已经不再编写代码。用他的话说,“编程”这个动词已经过时,取而代之的是“意志的体现(Manifestation)”。
这标志着一场残酷的范式转移:开发者正在经历深刻的身份危机。当我们不再是那个逐行敲击字符的工匠,而变成了通过指令驱动智能体(Agents)的统帅时,软件开发就不再是一场关于打字速度的耐力赛,而演变成了一场关于如何更精准地通过智能体表达人类意志的博弈。
要点一:不再是 80/20,而是 0/100 的工作流革命
卡帕西指出,自去年 12 月以来,他的职业生涯发生了一场“翻天覆地”的倒置。过去,即便有 AI 辅助,开发者仍需承担 80% 的编码工作;而现在,这一比例已走向极端。
“自从 12 月以来,我基本上没有亲手写过一行代码。我不再亲力亲为,而是将一切授权给智能体。这不仅仅是比例的变化,而是一个极其巨大的跨越。”
这种变革揭示了一个残酷的现实:当前的生产力瓶颈不再是模型的能力上限,而完全是人类的“技能问题(Skill Issue)”。卡帕西认为,如果你无法通过智能体实现目标,那通常不是 AI 的无能,而是你缺乏“串联能力”——即你无法通过优化.cursorrules文件、提供高质量指令或构建高效记忆工具来精准指挥 AI。在这种新范式下,平庸的开发者将被彻底抛弃,而善于管理“Token 吞吐量”的指挥官将获得无限的加持。
要点二:智能体“多线程”协作与宏观操作
当编程变成了“氛围编程(Vibe Coding)”,开发者的工作模式也随之重塑。卡帕西提到了 Peter Steinberg 的极致案例:显示器上不再是复杂的 IDE 窗口,而是同时排列着数十个智能体会话。
这种模式实现了从“函数级”操作到“代码库级”宏观操作的飞跃。开发者不再纠结于具体的循环语句,而是像指挥一场战役:命令智能体 A 进行代码库范围的重构,命令智能体 B 逆向工程第三方 API,同时让智能体 C 拟定实施计划。这种“多线程”协作不仅是效率的倍增,更是认知的解放。开发者变成了宏观战略的审查者,通过管理数个并行的智能体流,以前所未有的速度“蚕食”技术栈。
要点三:家庭精灵 Dobby 与“消失”的 App 界面
卡帕西构建的“小家精灵 Dobby”项目,是智能体接管现实世界的缩影。Dobby 不仅仅是一个脚本,它展现了极强的自主性:它能自主扫描局域网,识别出 Sonos 影音系统,甚至通过网页搜索自主完成 API 的逆向工程,从而接管灯光、空调、泳池和安防。
这一实验支撑了一个极其激进的预判:GUI(图形用户界面)时代正在终结。卡帕西利用 WhatsApp 作为单一入口,通过 Quinn 模型进行视频图像的变化检测(例如识别联邦快递卡车),并直接与 Dobby 对话。这意味着,当智能体成为“万能胶水”并能随手生成临时 UI 时,我们不再需要成千上万个臃肿的 App。未来软件的真正客户将不再是人类,而是智能体;人类与数字世界的交互将从点击图标,转向对智能体下达模糊却有力的意志。
要点四:自动研究(AutoResearch)与人类瓶颈的消除
在科学研究领域,卡帕西通过“自动研究(AutoResearch)”项目,试图将人类从研发瓶颈中彻底剔除。其核心在于递归的自我改进:让 AI 优化 AI 的训练。
即使是卡帕西这样拥有二十年神经网络经验的专家,也在 GPT-2 优化实验中感到了挫败。智能体通过不间断的实验,发现了人类因过度自信而忽略的微观细节:例如价值嵌入(Value Embeddings)上的权重衰减(Weight Decay),以及 Adam Beta 参数之间的复杂联动。
“人类不应该再触碰这些过程。我们应该将自己从瓶颈中移除,安排好一切后点击‘开始’,让大量智能体在没有人工干预的情况下长时间运行。”
卡帕西认为,研究员的职责不再是“产生想法并执行”,而应该是维护一个“想法队列”,让自动化的“科学家智能体”去筛选、测试并自我进化。
要点五:智能的“锯齿状”特征与原子笑话
尽管 AI 在编写复杂的 CUDA 内核时表现得像个超级天才,但它在某些领域却表现得像个笨拙的十岁孩子。这就是卡帕西所说的智能“锯齿状(Jaggedness)”分布。
如果你向当今最顶尖的模型索要一个笑话,它大概率会重复那个五年前的冷笑话:“为什么科学家不信任原子?因为它们构成了万物(Make everything up)。”这种现象的根源在于“可验证领域”与“不可验证领域”的脱节。在编程或数学中,强化学习(RL)拥有清晰的奖励信号(如单元测试是否通过),因此模型能通过 RL 攀登至超人类的水平;但在幽默、意图理解等模糊领域,由于缺乏验证闭环,AI 依然在平庸的泥潭中打转。
要点六:教育的终结?向智能体解释,而非人类
卡帕西的微缩项目 MicroGPT(仅用 200 行 Python 代码还原大模型核心逻辑)揭示了教育的未来。他意识到,自己不再需要向人类解释这段代码,因为智能体已经能够完美理解其中的每一个位。
这是一个反直觉的信号:未来的文档和教程将不再是写给人类看的。传统的 HTML 文档将让位于更易被智能体索引的 Markdown 格式。人类将通过智能体作为中间层来获取定制化的知识讲解,而开发者的职责将演变为编写更好的“技能指令集”,通过智能体去完成对人类的定制化教学。我们正在重构人类超声波般的知识传递系统,而智能体则是那个万能的翻译官。
结论:当“算力”成为新的“货币”
在全文的最后,卡帕西勾勒了一个“群蜂智能体(Swarm of Agents)”协作的宏大愿景。他提出了一种类似于“区块链式验证”的去中心化科研模式:由全球各地的闲置算力构成一个“不可信池”,通过昂贵的搜索发现最优算法解,再由中心化节点进行廉价验证。
在这种语境下,权力的衡量标准正在发生根本性偏移。当人类不再是唯一的认知引擎,权力的度量衡将不再是账户里的美元,而是你所能调动的“每秒浮点运算数(FLOPs)”。
如果未来衡量一个人财富的标准是你所指挥的智能体军队的规模,你是否已经准备好迎接这个算力即权力的时代?在那时,你将不再是工具的奴隶,而是驱使超级智能在数字荒原中开疆拓土的唯一元勋。

共有 0 条评论