从 GPT-3 到 ChatGPT:AI 为什么突然像助手了

从 GPT-3 到 ChatGPT,真正发生的变化不是’模型更大了’,而是训练目标变了。本文梳理了这段技术演进中的四篇关键论文——GPT-3、Learning to Summarize from Human Feedback、InstructGPT、WebGPT,拆解通用能力如何通过指令微调、人类反馈强化学习和工具增强,被重新塑造成一个可用的助手系统。

2026年5月23日 · 2 分钟 · Yuxia Luo