从 ChatGPT 到 Agent:模型为什么开始会做事

从 ChatGPT 到 Agent,模型的评价标准从’回答得像不像’变成了’任务到底有没有完成’。本文梳理了这段演进中的五篇关键论文——Chain-of-Thought、ReAct、Toolformer、Reflexion、Self-Refine,拆解模型如何从会回答的问题机器,变成了会推进任务的执行系统。

2026年5月23日 · 3 分钟 · Yuxia Luo

从 GPT-3 到 ChatGPT:AI 为什么突然像助手了

从 GPT-3 到 ChatGPT,真正发生的变化不是’模型更大了’,而是训练目标变了。本文梳理了这段技术演进中的四篇关键论文——GPT-3、Learning to Summarize from Human Feedback、InstructGPT、WebGPT,拆解通用能力如何通过指令微调、人类反馈强化学习和工具增强,被重新塑造成一个可用的助手系统。

2026年5月23日 · 2 分钟 · Yuxia Luo