浅浅学习一下 Mooncake - 如何让 Postgres 的每一次写入,Iceberg 都能实时看见
Mooncake通过GlobalIndex实时生成DeletionVector替代低效EqualityDelete,并结合UnionRead将内存Arrow批次、磁盘Parquet与多级删除信息统一查询,实现Postgres到Iceberg的毫秒级实时同步与分析。
Mooncake通过GlobalIndex实时生成DeletionVector替代低效EqualityDelete,并结合UnionRead将内存Arrow批次、磁盘Parquet与多级删除信息统一查询,实现Postgres到Iceberg的毫秒级实时同步与分析。
本文通过五版链表实现,系统演示Rust所有权、借用、生命周期、Rc/RefCell共享与内部可变性,以及unsafe裸指针等核心机制的演进与权衡。
本文系统讲解Rust异步编程原理与Tokio运行时,涵盖async/await机制、Future状态机实现、Waker唤醒模型、执行器从忙轮询到按需唤醒的演进,以及Tokio适用场景与最佳实践。
本文介绍agent-memory工具,通过将AI记忆与Git分支一一绑定,实现多任务间上下文自动隔离、错误路径不污染、记忆按需沉淀,大幅提升AI编程的上下文纯净度与协作效率。
GPT-1至GPT-3逐步确立了现代大语言模型的三大基础:预训练获得通用能力、从文本中学习任务模式、通过prompt实现零微调的任务调用。
本文系统介绍了大语言模型推理框架SGLang,围绕其如何通过RadixAttention、ContinuousBatching、ChunkedPrefill等五大优化技术,解决KVCache内存瓶颈、Prefill/Decode负载不均及调度低效等核心挑战,显著提升高并发LLM推理效率。
SlateDB是基于Rust和LSM-Tree、专为对象存储设计的嵌入式KV数据库,解决RocksDB在远程存储场景下的局限性。
本文深入对比Arrow、Parquet、ORC三种列存格式,分析其在压缩、编码、读写性能等方面的差异,总结各自优劣及适用场景。
本文系统介绍了Rust语言的核心语法,涵盖变量、数据类型、函数、模式匹配、错误处理、泛型、并发编程及宏等关键特性。
Rust通过所有权、借用和生命周期机制在编译时确保内存安全,无需垃圾回收。