当 AI 遇上数据管道:Daft,一个多模态时代的数据引擎

Daft 是一个为多模态 AI 工作负载设计的数据引擎。Python API + Rust 引擎,原生支持图片、音频、视频等非结构化数据类型,同一份代码从笔记本无缝扩展到分布式集群。本文从 What / Why / How 三个维度介绍 Daft 的设计哲学和关键技术。

2026年4月26日 · 6 分钟 · Yuxia Luo

给 AI Agent 的大脑装上 git 分支管理

本文介绍agent-memory工具,通过将AI记忆与Git分支一一绑定,实现多任务间上下文自动隔离、错误路径不污染、记忆按需沉淀,大幅提升AI编程的上下文纯净度与协作效率。

2026年4月11日 · 3 分钟 · Yuxia Luo

从 GPT-1 到 GPT-3:现代大语言模型的技术底座是如何形成的

GPT-1至GPT-3逐步确立了现代大语言模型的三大基础:预训练获得通用能力、从文本中学习任务模式、通过prompt实现零微调的任务调用。

2026年3月22日 · 2 分钟 · Yuxia Luo

浅浅学习一下大语言模型(LLM)推理框架 - SGLang

本文系统介绍了大语言模型推理框架SGLang,围绕其如何通过RadixAttention、ContinuousBatching、ChunkedPrefill等五大优化技术,解决KVCache内存瓶颈、Prefill/Decode负载不均及调度低效等核心挑战,显著提升高并发LLM推理效率。

2026年3月15日 · 6 分钟 · Yuxia Luo

Lance - AI时代的数据格式标准?

Lance是一种专为机器学习和AI优化的列式数据格式,通过摒弃RowGroup、引入DataPage及内置索引,解决Parquet在随机访问、超大列、大宽表支持上的不足,更好适配AI工作负载并对接主流AI生态。

2025年4月26日 · 3 分钟 · Yuxia Luo

QCon 北京参会总结

QCon北京大会大模型正在重新定义软件参会总结

2025年4月12日 · 2 分钟 · Yuxia Luo