<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>数据格式 on Yuxia&#39;s Blog</title>
    <link>https://luoyuxia.github.io/categories/%E6%95%B0%E6%8D%AE%E6%A0%BC%E5%BC%8F/</link>
    <description>Recent content in 数据格式 on Yuxia&#39;s Blog</description>
    <generator>Hugo</generator>
    <language>zh</language>
    <lastBuildDate>Mon, 13 Oct 2025 21:31:10 +0800</lastBuildDate>
    <atom:link href="https://luoyuxia.github.io/categories/%E6%95%B0%E6%8D%AE%E6%A0%BC%E5%BC%8F/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>深入理解列存格式：Arrow，Parquet，ORC</title>
      <link>https://luoyuxia.github.io/posts/%E6%B7%B1%E5%85%A5%E7%90%86%E8%A7%A3%E5%88%97%E5%AD%98%E6%A0%BC%E5%BC%8Farrowparquetorc/</link>
      <pubDate>Mon, 13 Oct 2025 21:31:10 +0800</pubDate>
      <guid>https://luoyuxia.github.io/posts/%E6%B7%B1%E5%85%A5%E7%90%86%E8%A7%A3%E5%88%97%E5%AD%98%E6%A0%BC%E5%BC%8Farrowparquetorc/</guid>
      <description>本文深入对比Arrow、Parquet、ORC三种列存格式，分析其在压缩、编码、读写性能等方面的差异，总结各自优劣及适用场景。</description>
    </item>
    <item>
      <title>Lance - AI时代的数据格式标准？</title>
      <link>https://luoyuxia.github.io/posts/lance---ai%E6%97%B6%E4%BB%A3%E7%9A%84%E6%95%B0%E6%8D%AE%E6%A0%BC%E5%BC%8F%E6%A0%87%E5%87%86/</link>
      <pubDate>Sat, 26 Apr 2025 18:17:56 +0800</pubDate>
      <guid>https://luoyuxia.github.io/posts/lance---ai%E6%97%B6%E4%BB%A3%E7%9A%84%E6%95%B0%E6%8D%AE%E6%A0%BC%E5%BC%8F%E6%A0%87%E5%87%86/</guid>
      <description>Lance是一种专为机器学习和AI优化的列式数据格式，通过摒弃RowGroup、引入DataPage及内置索引，解决Parquet在随机访问、超大列、大宽表支持上的不足，更好适配AI工作负载并对接主流AI生态。</description>
    </item>
  </channel>
</rss>
