Chain-of-Thought

从 ChatGPT 到 Agent，模型的评价标准从’回答得像不像’变成了’任务到底有没有完成’。本文梳理了这段演进中的五篇关键论文——Chain-of-Thought、ReAct、Toolformer、Reflexion、Self-Refine，拆解模型如何从会回答的问题机器，变成了会推进任务的执行系统。