从 Agent 到 Code Agent:AI 为什么突然像同事一样干活
从 Agent 到 Code Agent,AI 开始具备交付能力。本文梳理了五篇关键论文——Codex、SWE-bench、SWE-agent、OpenHands、Agentless,拆解代码场景为何成为 agent 最先爆发的领域,以及 AI 如何从’会写代码’演进到’能在真实仓库里执行—验证—修复—交付’的工程闭环。
从 Agent 到 Code Agent,AI 开始具备交付能力。本文梳理了五篇关键论文——Codex、SWE-bench、SWE-agent、OpenHands、Agentless,拆解代码场景为何成为 agent 最先爆发的领域,以及 AI 如何从’会写代码’演进到’能在真实仓库里执行—验证—修复—交付’的工程闭环。
从 ChatGPT 到 Agent,模型的评价标准从’回答得像不像’变成了’任务到底有没有完成’。本文梳理了这段演进中的五篇关键论文——Chain-of-Thought、ReAct、Toolformer、Reflexion、Self-Refine,拆解模型如何从会回答的问题机器,变成了会推进任务的执行系统。
CocoIndex 是一个为 AI Agent 和 LLM 应用设计的声明式增量数据索引框架。Rust 引擎 + Python API,声明目标状态而非编写同步逻辑,只处理变化的增量数据。本文从 What / Why / How 三个维度分析 CocoIndex 的设计哲学和关键技术。
AgentMemory 是一个为 AI 编程智能体设计的持久记忆引擎。它用四层记忆模型模拟人类认知,通过 BM25 + 向量 + 知识图谱的混合检索实现跨会话记忆,支持 12+ 种 Agent,零外部依赖,本地运行。本文从 What / Why / How 三个维度分析这个项目的设计哲学和关键技术。
基于 UIUC 论文 AgileLog 的深度分析:当 AI Agent 成为流数据系统的一等公民,底层共享日志需要支持 forking。论文提出 Continuous Fork 新抽象和 Bolt 系统实现,通过 Diskless 架构、HLI、Tail-Only Updates、Lazy Tail Tree 四项技术实现廉价、隔离、可扩展的 fork。