大语言模型

从 ChatGPT 到 Agent：模型为什么开始会做事

从 ChatGPT 到 Agent，模型的评价标准从’回答得像不像’变成了’任务到底有没有完成’。本文梳理了这段演进中的五篇关键论文——Chain-of-Thought、ReAct、Toolformer、Reflexion、Self-Refine，拆解模型如何从会回答的问题机器，变成了会推进任务的执行系统。

从 GPT-3 到 ChatGPT：AI 为什么突然像助手了

从 GPT-3 到 ChatGPT，真正发生的变化不是’模型更大了’，而是训练目标变了。本文梳理了这段技术演进中的四篇关键论文——GPT-3、Learning to Summarize from Human Feedback、InstructGPT、WebGPT，拆解通用能力如何通过指令微调、人类反馈强化学习和工具增强，被重新塑造成一个可用的助手系统。