架构与设计

Provider API 或本地文件
    |
    v
DataSource
    |
    v
DataLakeManager.update
    |
    v
LocalDataLake
    |
    +--> LoadedDataset
    |
    +--> RetrievedPanel
             |
             v
       下游适配器

设计哲学

数据湖结构

本地 V1 存储使用 source/table/year/month 分区的 Parquet 快照,并维护 JSON 元数据。

lake-root/
  tushare/
    daily/
      year=2024/
        month=01/
          snapshots/

读取时可以投影列并过滤日期。LocalDataLake 先使用分区元数据跳过不相关快照,再在读取后做精确日期过滤。

模块结构