我们正处于指数增长的尾声:Anthropic CEO Dario Amodei 深度对话 Dwarkesh Patel
“我们正处于指数增长的尾声。再过几年,数据中心里就会有一个’天才之国’。问题不是这会不会发生,而是发生之后我们要怎么办。”
嘉宾简介: Dario Amodei 是 Anthropic 的联合创始人兼 CEO。他曾在 OpenAI 担任研究副总裁,2021 年因对 AI 安全理念的分歧离开并创立 Anthropic。在这场长达两个半小时的深度对话中,他与独立播客主持人 Dwarkesh Patel 探讨了 AI 发展最核心的问题。
核心要点:
- Scaling laws 正在接近物理极限,但新技术路线正在打开新空间
- “数据中心里的天才之国”可能在几年内成为现实
- AI 实验室真正的盈利模式仍不明朗
- 开源 vs 闭源的辩论被严重简化了
- 中美 AI 竞争不是零和博弈
我们到底在 Scale 什么?
对话一开始,Dwarkesh 就抛出了一个尖锐的问题:如果 scaling laws 真的在放缓,Anthropic 的整个赌注是不是就输了?
Dario 的回答出乎意料地坦诚。他承认,纯粹靠增加模型参数和训练数据的传统 scaling 路线确实在遇到递减收益。“如果你只是不断把模型做大,每一代的进步幅度确实在缩小。”
但他紧接着指出,这个观察遗漏了几个关键维度:
“人们总是把 scaling 等同于’把模型做大’。但实际上有多种 scaling 的维度——训练时间计算、推理时间计算、数据质量、算法效率。当一个维度遇到瓶颈时,其他维度往往正在打开。”
他举了一个具体的例子:Claude 在推理时间(inference-time compute)上的投入带来了巨大的能力提升。“当你给模型更多’思考时间’,让它在回答问题之前先做推理链,效果的提升是惊人的。这是一种全新的 scaling 维度,三年前我们几乎没有探索过。”
Dwarkesh 追问:这是不是意味着 diffusion(扩散模型)的路线是一种”cope”(自我安慰)?
Dario 不同意这种表述:“不同的技术路线解决不同的问题。语言模型的 scaling 解决推理能力,diffusion 解决生成质量。说某条路线是’cope’是一种过于简化的思维方式。我们内部同时在推进多条路线。“
天才之国
对话的核心议题是 Dario 此前提出的”数据中心里的天才之国”(a country of geniuses in a data center)这个概念。
“想象一下,如果你把一百万个顶尖科学家放在一起,让他们全天候工作,而且他们之间的沟通速度是光速级别的。“Dario 描述道,“这就是我认为 AI 在未来几年可能达到的状态。”
这个愿景听起来像科幻小说,但 Dario 用了很长的篇幅来论证它的可行性路径:
- 单模型能力:当前最好的模型已经在许多专业任务上达到了人类专家水平
- 多模型协作:Agent 系统让多个 AI 实例可以分工合作
- 持续学习:模型能够从新数据中不断改进,而不需要重新训练
- 工具使用:AI 可以操作计算机、调用 API、搜索信息
“每一项单独来看都不算revolutionary。但当你把它们组合在一起,效果是指数级的。这不是线性叠加,而是能力的乘法效应。”
Dwarkesh 挑战道:如果这一切即将成真,为什么 Anthropic 不去疯狂购买更多算力?
Dario 的回答揭示了 AI 行业一个很少被讨论的现实:“算力不是你想买就能买的。GPU 供应受限、数据中心建设需要时间、电力供应有瓶颈。这不是一个钱能解决的问题。整个行业都在争夺同样有限的资源。“
商业模式的困惑
也许整场对话中最诚实的部分,是关于 AI 实验室如何赚钱的讨论。
“我们目前的收入增长确实很快,“Dario 承认,“但我也会坦率地说,AI 实验室的最终商业模式还不完全清楚。我们现在主要靠 API 调用收费,但如果模型变得越来越便宜,这个模式的天花板在哪里?”
他分享了 Anthropic 内部对定价策略的思考:
- 推理成本在快速下降:每一代模型的单位推理成本大约降低 80%
- 但总投入在快速增加:训练下一代模型需要的资本支出在指数增长
- 中间存在一个巨大的张力:你的产品在变便宜,但你的成本在变贵
“这有点像半导体行业的早期。英特尔在 70 年代也不知道自己最终会成为什么样的公司。我们现在处于类似的阶段——技术在快速进步,但商业模式还在探索中。”
Dwarkesh 犀利地指出:这不就是说,如果事情往最好的方向发展(AGI 出现),你们反而可能赚不到钱?
Dario 停顿了一下:“这是一个非常好的问题。如果 AI 真的变得极其强大、极其便宜、极其普遍——那确实,单纯靠卖 API 调用可能不是最终答案。但在那个世界里,AI 创造的总价值是如此巨大,我相信会有新的商业模式涌现。“
开源的悖论
关于开源 vs 闭源 AI 的讨论,Dario 给出了一个比通常的辩论更加nuanced的观点。
“我不是反对开源。Anthropic 自己也开源了很多研究成果。“他首先澄清立场。“但我认为,在 AI 安全领域,‘全部开源’和’全部闭源’都不是正确答案。”
他的核心论点是关于能力边界的:
当模型的能力低于某个危险阈值时,开源是好的——它促进创新、降低门槛、增加透明度。但当模型跨过那个阈值,能够帮助制造生物武器或发动大规模网络攻击时,无条件开源就变成了一个严肃的安全问题。
“问题不在于开源本身好不好。问题在于,我们是否有能力在开源之后撤回?答案是不能。一旦权重公开,就永远公开了。所以我们需要在发布之前做好判断。“
中美不是零和
对话的最后部分转向了地缘政治。Dario 对中美 AI 竞争的看法令人意外地乐观:
“很多人把中美 AI 竞争描述成一场零和博弈——一方赢,另一方就必须输。我不同意这种框架。”
他的论据是:AI 的好处不像石油或领土,不是有限的资源。如果中国和美国都能从 AI 中获益,世界总财富会增加。
但他也承认了一个深层张力:“我们确实需要确保,最强大的 AI 系统不会被用于危险目的。这需要国际合作,而不是军备竞赛的心态。“
快问快答
| 问题 | 回答 |
|---|---|
| AGI 最快什么时候到来? | 2-3年内可能出现”虚拟科学家”级别的AI |
| Claude 的宪法是谁写的? | 主要是 Amanda Askell 和她的团队 |
| 你最担心的AI风险? | 生物武器滥用和大规模监控 |
| 如果不做AI你会做什么? | 回去做神经科学研究 |
| 你用 Claude 做什么? | 写邮件、头脑风暴、代码审查 |
🔗 本文由 AI 基于播客逐字稿精深度改写,仅供学习参考
📖 本文由 AI 基于播客逐字稿深度改写,仅供学习参考
来源:Dwarkesh Patel · 原始视频