Yuxia's Blog

当 AI Agent 成为调用方，我们需要怎样的日志系统？

基于 UIUC 论文 AgileLog 的深度分析：当 AI Agent 成为流数据系统的一等公民，底层共享日志需要支持 forking。论文提出 Continuous Fork 新抽象和 Bolt 系统实现，通过 Diskless 架构、HLI、Tail-Only Updates、Lazy Tail Tree 四项技术实现廉价、隔离、可扩展的 fork。

当 AI 遇上数据管道：Daft，一个多模态时代的数据引擎

Daft 是一个为多模态 AI 工作负载设计的数据引擎。Python API + Rust 引擎，原生支持图片、音频、视频等非结构化数据类型，同一份代码从笔记本无缝扩展到分布式集群。本文从 What / Why / How 三个维度介绍 Daft 的设计哲学和关键技术。

浅浅学习一下 Mooncake - 如何让 Postgres 的每一次写入，Iceberg 都能实时看见

Mooncake通过GlobalIndex实时生成DeletionVector替代低效EqualityDelete，并结合UnionRead将内存Arrow批次、磁盘Parquet与多级删除信息统一查询，实现Postgres到Iceberg的毫秒级实时同步与分析。

Rust：用链表理解所有权、借用与 unsafe

本文通过五版链表实现，系统演示Rust所有权、借用、生命周期、Rc/RefCell共享与内部可变性，以及unsafe裸指针等核心机制的演进与权衡。

Rust：异步编程 + Tokio

本文系统讲解Rust异步编程原理与Tokio运行时，涵盖async/await机制、Future状态机实现、Waker唤醒模型、执行器从忙轮询到按需唤醒的演进，以及Tokio适用场景与最佳实践。

给 AI Agent 的大脑装上 git 分支管理

本文介绍agent-memory工具，通过将AI记忆与Git分支一一绑定，实现多任务间上下文自动隔离、错误路径不污染、记忆按需沉淀，大幅提升AI编程的上下文纯净度与协作效率。

从 GPT-1 到 GPT-3：现代大语言模型的技术底座是如何形成的

GPT-1至GPT-3逐步确立了现代大语言模型的三大基础：预训练获得通用能力、从文本中学习任务模式、通过prompt实现零微调的任务调用。

浅浅学习一下大语言模型（LLM）推理框架 - SGLang

本文系统介绍了大语言模型推理框架SGLang，围绕其如何通过RadixAttention、ContinuousBatching、ChunkedPrefill等五大优化技术，解决KVCache内存瓶颈、Prefill/Decode负载不均及调度低效等核心挑战，显著提升高并发LLM推理效率。

SlateDB: 面向对象存储重新设计的 RocksDB

SlateDB是基于Rust和LSM-Tree、专为对象存储设计的嵌入式KV数据库，解决RocksDB在远程存储场景下的局限性。

深入理解列存格式：Arrow，Parquet，ORC

本文深入对比Arrow、Parquet、ORC三种列存格式，分析其在压缩、编码、读写性能等方面的差异，总结各自优劣及适用场景。