苏格拉底式 AI Coding：模糊提问的力量

“我知道我一无所知。” —— 苏格拉底

我是 Quentin，OpenClaw 拼车的维护者。这篇分享一种有点反直觉、但用过都回不去的提示词范式——苏格拉底式 AI Coding。

它的核心论断是：模糊但引导性的提问，往往比明确具体的指令产生更好的代码。

听起来不像真的。我们写 prompt 的训练里第一条不就是「写得越具体越好」吗？为什么模糊反而更好？这篇会系统性地解释这个现象，并给出可实践的方法论。

拼车前置：这种范式会增加单次推理的深度，token 消耗显著增加。OpenClaw 拼车一行接通 Max 20× 配额：
curl -fsSL https://cp.bizq.net/setup.sh | bash -s -- claude-max-20x

一、苏格拉底方法的本质

公元前 5 世纪，苏格拉底发明了一种独特的教学方法：不直接给出答案，而是通过提问引导学生自己发现真理。

❌ 不说："答案是 X"
✅ 而问："如果是 Y，会怎样？那 Z 呢？"
🎯 目标：激发批判性思维，让学生主动推理而非被动接受

迁移到 AI Coding：

传统模式——指令 + 执行：

人类：在第 42 行添加 if (x > 0) 检查
AI  ：好的，已添加

AI 是工具。

苏格拉底模式——问题 + 探索 + 设计：

人类：这里有个边界情况没处理，怎么办？
AI  ：让我先理解代码逻辑……
      发现了问题：x 可能为负数
      参考了现有模式：其他地方都用了 validate_input
      建议方案：添加统一的输入验证

AI 是合作者。

维度	传统方法	苏格拉底方法
人类角色	设计者	提问者
AI 角色	执行者	思考者
知识传递	显性告知	引导重建
输出质量	局部正确	全局最优

二、五大核心机制

1. 避免过度约束陷阱

明确指令可能基于错误的假设。

# ❌ 错误指令："在 StreamStartEvent 添加 error 字段"
class StreamStartEvent:
    model: str
    error: str | None  # 违反单一职责！
 
# ✅ 苏格拉底式："HTTP 失败了，怎么记录？"
# AI 推理 → 发现应该创建独立的 StreamErrorEvent

原理：模糊 prompt 给 AI 空间去发现更好的方案。指令式则把方案锁死在你头脑里那个不一定对的版本上。

2. 强制深度理解

模糊 prompt 无法直接执行——AI 必须先理解代码库。

指令式	苏格拉底式
”改第 42 行"	"这里有 bug，怎么修？”
→ 定位行号	→ 理解代码逻辑
→ 修改代码	→ 识别问题根因
→ 完成	→ 查找相似模式
	→ 设计完整方案
	→ 多文件协同修改
	→ 验证和测试

深度理解产生高质量代码。

3. 信任倒置

传统：

人类：我已经想好了，你照做
AI  ：好的（即使发现问题也不敢质疑）

苏格拉底：

人类：有个问题，你帮我想想？可能可以这样，但不确定
AI  ：让我分析一下……发现了更好的方案

关键：用户的「不确定」给了 AI 独立思考的许可。

4. 模式发现

AI 从代码库中主动识别和对齐架构模式。

# AI 扫描代码库，发现模式：
 
# 模式 1: 三态事件流
FunctionCallStartEvent → FunctionCallCompleteEvent → FunctionCallErrorEvent
 
# 模式 2: 缺失的对称性
StreamStartEvent → StreamCompleteEvent → ??? (缺 ErrorEvent)
 
# 推理：补充 StreamErrorEvent 以对齐模式

价值：保证新代码与现有架构一致。这是单纯指令式 prompt 几乎不可能做到的。

5. 隐性知识传递

明确指令中，用户的推理过程被丢失了。

# 用户头脑中的推理链：
# 1. HTTP 失败时 curl 也要记录
# 2. try 失败后拿不到 curl
# 3. 所以要在 try 之前准备
# 4. StreamStartEvent 也要提前 yield
 
# ❌ 明确指令："把 curl_command 移到 try 之前"
# → AI 只得到结论，不知道为什么
 
# ✅ 苏格拉底式："HTTP 失败了，curl 怎么记录？"
# → AI 被迫重建推理链，获得深度理解

原理：重建推理过程 > 被告知结论。这正是苏格拉底教学法的精髓。

三、真实案例：StreamErrorEvent 的诞生

背景

HTTP 请求失败时，curl 命令没有被记录，导致无法手动复现问题。

传统指令式方案（错误示范）

用户："在 StreamStartEvent 添加 error 字段"

AI 执行：

class StreamStartEvent:
    model: str
    provider: str
    error: str | None = None  # ❌ 违反单一职责

问题：

StreamStartEvent 既表示「开始」又表示「错误」
语义混乱
与 FunctionCallErrorEvent 模式不一致
难以在下游区分正常 / 失败

苏格拉底式方案（实际发生）

用户："你看最新的 logs, 它 http 失败了。但我在想，失败的话，
是不是也可以搞一个 event? 比如 stream start event?
但是可能不太好？或者叫 stream error event?
是不是也可以把 curl 给 yield 出来？"

AI 推理过程：

理解问题域：HTTP 失败 → curl 用于调试 → 当前丢失
代码探索：找到事件循环、events.py
模式发现：FunctionCall 有三态，Stream 只有两态——缺 ErrorEvent
方案设计：创建独立的 StreamErrorEvent，对齐模式
完整实现：

# 1. 定义事件
class StreamErrorEvent(LLMEvent):
    error_type: str
    error_message: str
    curl_command: str | None
 
# 2. 修改 handler
async def execute(self):
    curl = self.http_debug.last_curl_command
    yield StreamStartEvent(curl=curl)
 
    try:
        stream = await create(...)
        async for event in stream:
            yield event
    except Exception as e:
        yield StreamErrorEvent(error=str(e), curl=curl)
        raise
 
# 3. 添加格式化
def _format_stream_error(self, event):
    return f"❌ 失败\n{event.error_message}\ncURL: {event.curl_command}"
 
# 4. 写测试
async def test_stream_error_event():
    events = []
    try:
        async for e in simulate_failure():
            events.append(e)
    except Exception:
        pass
    assert len(events) == 2  # Start + Error

结果对比

维度	指令式	苏格拉底式
修改文件数	1	4
架构一致性	❌ 违反单一职责	✅ 对齐现有模式
完整性	⚠️ 只改了事件定义	✅ 端到端实现
测试	❌ 无	✅ 包含验证
可维护性	❌ 低	✅ 高

关键洞察：用户的 prompt 虽然模糊（“是不是可以…？”，“但可能不太好？”），但包含了：

问题场景：「http 失败了」
核心需求：「curl 给 yield 出来」
候选方案：「stream error event?」
技术疑问：隐含的「yield 和 raise 能共存吗？」

AI 做的是：验证用户的直觉、解决用户的疑虑、补充缺失的实现。

四、五大实践原则

原则 1：问题导向，而非方案导向

❌ 方案导向："在 X 位置添加 Y"
✅ 问题导向："X 有问题，怎么解决？"
              "日志显示 X 失败了，怎么调试？"

原则 2：暴露不确定性

核心思想：你的纠结和疑虑，恰恰是 AI 最需要的信息。

❌ 过度自信（假装确定）：
   "做 A，然后做 B，最后做 C"

✅ 暴露纠结（真实的思考过程）：
   "我在想是不是要重构这个继承体系……
   拆成组合模式可能更清晰，但工作量很大……
   要不要保留原有接口？新老并存可能更安全？
   但维护两套代码又很难受……
   你觉得怎么权衡比较好？"

为什么纠结反而更好？

暴露了多个备选方案（AI 可以评估）
展示了权衡维度（工作量 vs 架构清晰度）
提供了约束条件（需要向后兼容）
给了 AI 设计空间（而非强制执行）

你的纠结迫使 AI 进行多维度分析，而非盲目执行。

原则 3：提供上下文，而非指令

❌ 无上下文指令：
   "修改第 42 行"

✅ 丰富上下文：
   "日志显示第 42 行有 NullPointerException"
   "用户反馈这个功能在边界情况下失败"

原则 4：鼓励探索和验证

❌ 强制执行：
   "照我说的做，不要问为什么"

✅ 鼓励质疑：
   "你觉得这样做有什么问题？"
   "有没有更好的实现方式？"

原则 5：分层渐进

第一层：What（问题是什么）
   "HTTP 请求失败了"

第二层：Why（为什么重要）
   "需要调试，但拿不到 curl 命令"

第三层：How（可能的方向）
   "是不是可以在失败时也 yield 一个 event？"

五、Prompt 模板

模板 1：问题诊断

[观察到的现象]
[相关日志/错误信息]
[已经尝试的方案]
可能的原因是什么？怎么解决？

示例：

HTTP 请求在生产环境随机失败
错误日志：ConnectionResetError
已尝试：增加 timeout，问题依然存在
可能的原因是什么？怎么解决？

模板 2：架构设计

需求：[要实现的功能]
约束：[性能/兼容性/可维护性要求]
疑问：[不确定的点]
怎么设计比较好？

示例：

需求：支持流式 LLM 调用的错误处理
约束：需要记录调试信息，不能影响原有异常传播
疑问：错误时如何 yield event？会不会和 raise 冲突？
怎么设计比较好？

模板 3：模式对齐

发现：[观察到的情况]
问题：[与现有代码的不一致]
参考：[现有的类似实现]
如何对齐？

示例：

发现：新增的 StreamStartEvent 只有 start 和 complete
问题：FunctionCall 有 start/complete/error 三态
参考：FunctionCallErrorEvent 的实现
如何对齐？

六、何时用苏格拉底式 / 何时用指令式

✅ 苏格拉底式推荐场景

架构设计任务：“这个模块应该怎么拆分？”
问题诊断任务：“这个 bug 的根因是什么？”
模式对齐任务：“如何让这段代码符合现有架构？”
完整功能开发：“需要实现 X 功能，怎么做比较好？”
不确定最佳方案：“我想用 A 方案，但担心性能问题”

✅ 指令式推荐场景

简单机械修改：“把变量名从 foo 改成 bar”、“删除第 42 行”
格式化操作：“格式化这个文件”、“修复这个拼写错误”
已知确定方案：“添加这个 import 语句”、“更新版本号到 2.0”

原则：复杂、设计性、不确定的任务用苏格拉底；简单、机械、明确的任务用指令式。

七、四个常见反模式

反模式 1：伪苏格拉底

# ❌ 看似在问，实则在命令
"你不觉得应该在这里加个 try-except 吗？"
 
# ✅ 真正的苏格拉底式
"这里可能会抛异常，怎么处理比较好？"

反模式 2：过度模糊

# ❌ 太模糊，缺少上下文
"优化一下"
 
# ✅ 模糊但有方向
"这个函数在高并发下很慢，profile 显示大部分时间在等锁。
有什么优化思路？"

反模式 3：假设 AI 知道隐性背景

# ❌ 假设 AI 知道业务背景
"按之前讨论的方案实现"
 
# ✅ 重新提供上下文
"我们之前讨论过用事件驱动架构。
现在要实现错误处理，基于这个架构怎么做？"

反模式 4：过早优化指令

# ❌ 基于错误假设的指令
"把这个列表改成 set，提升查询性能"
（可能列表需要保持顺序）
 
# ✅ 描述问题，让 AI 分析
"这个查询很慢，数据量是 10 万。怎么优化？"

八、深层洞察

洞察 1：认知负荷的战略性转移

传统分工：

人类：承担设计认知负荷（想清楚怎么做）
AI：承担执行认知负荷（精确编辑代码）

问题：人类的设计能力有限，可能基于不完整的信息。

苏格拉底式分工：

AI：承担设计认知负荷（理解代码库，识别模式，提出方案）
人类：承担评审认知负荷（判断方案是否符合需求）

优势：AI 有完整的代码库视野，设计能力被严重低估。

洞察 2：搜索空间的维度差异

指令式：1 维搜索

用户指令 → 执行路径唯一 → 输出固定

苏格拉底式：N 维搜索

用户问题 → 可探索多个方案 → 选择最优解
        ↓
方案 A：修改 StreamStartEvent（评估：违反 SRP）
方案 B：新增 StreamErrorEvent（评估：对齐模式 ✅）
方案 C：用 try-finally（评估：无法传递错误）

结果：更可能找到全局最优解。

洞察 3：失败模式的优雅降级

指令式失败：

执行错误（语法、逻辑）
难以调试（不知道为什么这样做）
级联失败（一个错误导致多处问题）

苏格拉底式失败：

理解偏差（误解需求）
容易发现（有推理过程可追溯）
局部失败（方案错了，重新推理即可）

关键：苏格拉底式失败更透明，更容易纠正。

九、纠结的艺术

收集了一些「纠结但产生好结果」的真实案例，共同特征：

1. 多维度权衡

不是：A 还是 B？
而是：A 的优点是 X，但缺点是 Y；B 的优点是 Z，但缺点是 W。
     在这个场景下，哪个更合适？

2. 暴露约束条件

不是：做 X
而是：想做 X，但受限于 Y（兼容性 / 性能 / 时间 / 团队水平）

3. 承认不确定性

不是：我觉得应该这样
而是：我觉得这样，但可能不太好？你觉得呢？

4. 展示思考过程

不是：给我方案
而是：我想到了 A、B、C 三个方案，A 的问题是……，
     B 的问题是……，C 看起来还行但我担心……

5. 真实的情感表达

不是：（冷静的技术分析）
而是：真的很纠结……、有点晕……、很担心……、不知道……

十、哲学反思

苏格拉底说：“我知道我一无所知。”

在 AI Coding 中，这句话的含义是：

当人类承认「我不确定最佳方案」时，反而能获得更好的代码。

因为：

承认不确定 → 给 AI 思考空间
AI 思考    → 深度理解代码库
深度理解   → 发现更优方案
更优方案   → 高质量代码

这是一个悖论，也是一个洞察：知道自己不知道，是获得知识的开始。

苏格拉底式 AI Coding 不仅是一种技术方法，更是一种协作哲学：

AI 不是工具，而是思考伙伴
人类不是设计者，而是提问者和评审者
编程不是指令执行，而是对话和探索

这种范式的成熟，将重新定义人类与 AI 的关系：从主人 - 工具，到合作者。

十一、立即开始

明天写 Claude Code 的时候，刻意用一次苏格拉底式 prompt——把你的纠结、疑虑、候选方案都说出来，看看产出是不是真的不一样。

curl -fsSL https://cp.bizq.net/setup.sh | bash -s -- claude-max-20x

最好的代码，来自最好的问题。最好的问题，往往来自最真实的纠结。

更多文档见 https://cp.bizq.net。

Claude Code Vibe Coding 工作流 — 把苏格拉底式提问嵌进规范驱动开发
Claude Code 高阶玩家指南 — 提示词只是起点，工作流才是终点
CLAUDE.md 约束提示词指南 — 项目级约束如何配合苏格拉底式 prompt

Claude Code Vibe Coding 工作流：从规范到落地 Claude Code 必备脚本合集：日常运维一行搞定