当 AI Agent 成为调用方,我们需要怎样的日志系统?
基于 UIUC 论文 AgileLog 的深度分析:当 AI Agent 成为流数据系统的一等公民,底层共享日志需要支持 forking。论文提出 Continuous Fork 新抽象和 Bolt 系统实现,通过 Diskless 架构、HLI、Tail-Only Updates、Lazy Tail Tree 四项技术实现廉价、隔离、可扩展的 fork。
基于 UIUC 论文 AgileLog 的深度分析:当 AI Agent 成为流数据系统的一等公民,底层共享日志需要支持 forking。论文提出 Continuous Fork 新抽象和 Bolt 系统实现,通过 Diskless 架构、HLI、Tail-Only Updates、Lazy Tail Tree 四项技术实现廉价、隔离、可扩展的 fork。
Daft 是一个为多模态 AI 工作负载设计的数据引擎。Python API + Rust 引擎,原生支持图片、音频、视频等非结构化数据类型,同一份代码从笔记本无缝扩展到分布式集群。本文从 What / Why / How 三个维度介绍 Daft 的设计哲学和关键技术。
Mooncake通过GlobalIndex实时生成DeletionVector替代低效EqualityDelete,并结合UnionRead将内存Arrow批次、磁盘Parquet与多级删除信息统一查询,实现Postgres到Iceberg的毫秒级实时同步与分析。
本文通过五版链表实现,系统演示Rust所有权、借用、生命周期、Rc/RefCell共享与内部可变性,以及unsafe裸指针等核心机制的演进与权衡。
本文系统讲解Rust异步编程原理与Tokio运行时,涵盖async/await机制、Future状态机实现、Waker唤醒模型、执行器从忙轮询到按需唤醒的演进,以及Tokio适用场景与最佳实践。
本文介绍agent-memory工具,通过将AI记忆与Git分支一一绑定,实现多任务间上下文自动隔离、错误路径不污染、记忆按需沉淀,大幅提升AI编程的上下文纯净度与协作效率。
GPT-1至GPT-3逐步确立了现代大语言模型的三大基础:预训练获得通用能力、从文本中学习任务模式、通过prompt实现零微调的任务调用。
本文系统介绍了大语言模型推理框架SGLang,围绕其如何通过RadixAttention、ContinuousBatching、ChunkedPrefill等五大优化技术,解决KVCache内存瓶颈、Prefill/Decode负载不均及调度低效等核心挑战,显著提升高并发LLM推理效率。
SlateDB是基于Rust和LSM-Tree、专为对象存储设计的嵌入式KV数据库,解决RocksDB在远程存储场景下的局限性。
本文深入对比Arrow、Parquet、ORC三种列存格式,分析其在压缩、编码、读写性能等方面的差异,总结各自优劣及适用场景。