<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>论文 on Yuxia&#39;s Blog</title>
    <link>https://luoyuxia.github.io/tags/%E8%AE%BA%E6%96%87/</link>
    <description>Recent content in 论文 on Yuxia&#39;s Blog</description>
    <generator>Hugo</generator>
    <language>zh</language>
    <lastBuildDate>Sun, 22 Mar 2026 17:04:49 +0800</lastBuildDate>
    <atom:link href="https://luoyuxia.github.io/tags/%E8%AE%BA%E6%96%87/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>从 GPT-1 到 GPT-3：现代大语言模型的技术底座是如何形成的</title>
      <link>https://luoyuxia.github.io/posts/%E4%BB%8E-gpt-1-%E5%88%B0-gpt-3%E7%8E%B0%E4%BB%A3%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%9A%84%E6%8A%80%E6%9C%AF%E5%BA%95%E5%BA%A7%E6%98%AF%E5%A6%82%E4%BD%95%E5%BD%A2%E6%88%90%E7%9A%84/</link>
      <pubDate>Sun, 22 Mar 2026 17:04:49 +0800</pubDate>
      <guid>https://luoyuxia.github.io/posts/%E4%BB%8E-gpt-1-%E5%88%B0-gpt-3%E7%8E%B0%E4%BB%A3%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%9A%84%E6%8A%80%E6%9C%AF%E5%BA%95%E5%BA%A7%E6%98%AF%E5%A6%82%E4%BD%95%E5%BD%A2%E6%88%90%E7%9A%84/</guid>
      <description>GPT-1至GPT-3逐步确立了现代大语言模型的三大基础：预训练获得通用能力、从文本中学习任务模式、通过prompt实现零微调的任务调用。</description>
    </item>
    <item>
      <title>深入理解列存格式：Arrow，Parquet，ORC</title>
      <link>https://luoyuxia.github.io/posts/%E6%B7%B1%E5%85%A5%E7%90%86%E8%A7%A3%E5%88%97%E5%AD%98%E6%A0%BC%E5%BC%8Farrowparquetorc/</link>
      <pubDate>Mon, 13 Oct 2025 21:31:10 +0800</pubDate>
      <guid>https://luoyuxia.github.io/posts/%E6%B7%B1%E5%85%A5%E7%90%86%E8%A7%A3%E5%88%97%E5%AD%98%E6%A0%BC%E5%BC%8Farrowparquetorc/</guid>
      <description>本文深入对比Arrow、Parquet、ORC三种列存格式，分析其在压缩、编码、读写性能等方面的差异，总结各自优劣及适用场景。</description>
    </item>
    <item>
      <title>一篇论文带你回顾数据库过去 20 年的发展</title>
      <link>https://luoyuxia.github.io/posts/%E4%B8%80%E7%AF%87%E8%AE%BA%E6%96%87%E5%B8%A6%E4%BD%A0%E5%9B%9E%E9%A1%BE%E6%95%B0%E6%8D%AE%E5%BA%93%E8%BF%87%E5%8E%BB-20-%E5%B9%B4%E7%9A%84%E5%8F%91%E5%B1%95/</link>
      <pubDate>Sat, 27 Sep 2025 17:17:26 +0800</pubDate>
      <guid>https://luoyuxia.github.io/posts/%E4%B8%80%E7%AF%87%E8%AE%BA%E6%96%87%E5%B8%A6%E4%BD%A0%E5%9B%9E%E9%A1%BE%E6%95%B0%E6%8D%AE%E5%BA%93%E8%BF%87%E5%8E%BB-20-%E5%B9%B4%E7%9A%84%E5%8F%91%E5%B1%95/</guid>
      <description>该论文回顾数据库20年发展，指出技术螺旋演进，关系模型与SQL仍占主导，新兴系统多被其吸收融合，强调开源组件与标准的重要性。</description>
    </item>
    <item>
      <title>VLDB-2025 Best Industry Paper - Ursa: A Lakehouse-Native Data Streaming Engine for Kafka</title>
      <link>https://luoyuxia.github.io/posts/vldb-2025-best-industry-paper---ursa--a-lakehouse-native-data-streaming-engine-for-kafka/</link>
      <pubDate>Wed, 03 Sep 2025 10:12:08 +0800</pubDate>
      <guid>https://luoyuxia.github.io/posts/vldb-2025-best-industry-paper---ursa--a-lakehouse-native-data-streaming-engine-for-kafka/</guid>
      <description>Ursa是兼容Kafka协议的湖仓原生存算分离流引擎，通过将数据直接写入对象存储并内置Compaction服务，降低存储成本并支持高效分析。</description>
    </item>
  </channel>
</rss>
