AI | Yuxia's Blog

从 Agent 到 Code Agent：AI 为什么突然像同事一样干活

从 Agent 到 Code Agent，AI 开始具备交付能力。本文梳理了五篇关键论文——Codex、SWE-bench、SWE-agent、OpenHands、Agentless，拆解代码场景为何成为 agent 最先爆发的领域，以及 AI 如何从’会写代码’演进到’能在真实仓库里执行—验证—修复—交付’的工程闭环。

从 ChatGPT 到 Agent：模型为什么开始会做事

从 ChatGPT 到 Agent，模型的评价标准从’回答得像不像’变成了’任务到底有没有完成’。本文梳理了这段演进中的五篇关键论文——Chain-of-Thought、ReAct、Toolformer、Reflexion、Self-Refine，拆解模型如何从会回答的问题机器，变成了会推进任务的执行系统。

从 GPT-3 到 ChatGPT：AI 为什么突然像助手了

从 GPT-3 到 ChatGPT，真正发生的变化不是’模型更大了’，而是训练目标变了。本文梳理了这段技术演进中的四篇关键论文——GPT-3、Learning to Summarize from Human Feedback、InstructGPT、WebGPT，拆解通用能力如何通过指令微调、人类反馈强化学习和工具增强，被重新塑造成一个可用的助手系统。

给 AI Agent 的大脑装上 git 分支管理

本文介绍agent-memory工具，通过将AI记忆与Git分支一一绑定，实现多任务间上下文自动隔离、错误路径不污染、记忆按需沉淀，大幅提升AI编程的上下文纯净度与协作效率。

从 GPT-1 到 GPT-3：现代大语言模型的技术底座是如何形成的

GPT-1至GPT-3逐步确立了现代大语言模型的三大基础：预训练获得通用能力、从文本中学习任务模式、通过prompt实现零微调的任务调用。

浅浅学习一下大语言模型（LLM）推理框架 - SGLang

本文系统介绍了大语言模型推理框架SGLang，围绕其如何通过RadixAttention、ContinuousBatching、ChunkedPrefill等五大优化技术，解决KVCache内存瓶颈、Prefill/Decode负载不均及调度低效等核心挑战，显著提升高并发LLM推理效率。