地球资源数据云——数据资源详情
本数据集来源于 Macrostrat 平台公开 API 的 strat_names 定义接口,包含 CSV 与 JSON 两种格式,当前共有 51225 条地层名称记录和 79 条关联参考信息。数据围绕地层名称标准化组织,提供 strat_name_id 、 concept_id 、 rank 、不同层级名称字段、年代范围、相关单元数量及参考文献索引等属性,适用于地层名称标准化、术语对照、实体消歧和数据库关联分析。 关键词 : Macrostrat ;地层名称; stratigraphic names ; CSV ; JSON ;标准化 引 言 地层名称标准化是地层数据库整合和跨区域对比的关键环节。由于不同资料来源在命名层级、简称、语言习惯和历史沿革上存在差异,若缺乏统一的名称编码体系,往往难以实现多源数据的有效关联。 Macrostrat 的地层名称定义表为这一问题提供了结构化解决方案。它将地层名称、概念 ID 、层级关系、年代信息和参考文献索引统一封装,能够为地层名词规范化、文献实体识别和跨库数据映射提供底层支撑。 1 数据采集和处理方法 1.1 数据采集方法 数据通过 Macrostrat API v2 的 /defs/strat_names 接口,以 all 参数获取全量定义结果,并分别保存为 CSV 和 JSON 两种格式。 CSV 便于快速浏览和表格处理, JSON 则保留了 success 、 data 和 refs 等完整结构信息。 1.2 数据处理 下载后的文件保存至 “ 03_ 地层名称”目录,命名为 stratigraphic_names.csv 和 stratigraphic_names.json 。 JSON 中保留了 ref_id 与 refs 的映射关系,便于后续引用追踪与元数据关联分析。

本数据集来源于 Macrostrat 平台公开 API 的 strat_names 定义接口,包含 CSV 与 JSON 两种格式,当前共有 51225 条地层名称记录和 79 条关联参考信息。数据围绕地层名称标准化组织,提供 strat_name_id 、 concept_id 、 rank 、不同层级名称字段、年代范围、相关单元数量及参考文献索引等属性,适用于地层名称标准化、术语对照、实体消歧和数据库关联分析。
关键词 : Macrostrat ;地层名称; stratigraphic names ; CSV ; JSON ;标准化
引 言
地层名称标准化是地层数据库整合和跨区域对比的关键环节。由于不同资料来源在命名层级、简称、语言习惯和历史沿革上存在差异,若缺乏统一的名称编码体系,往往难以实现多源数据的有效关联。
Macrostrat 的地层名称定义表为这一问题提供了结构化解决方案。它将地层名称、概念 ID 、层级关系、年代信息和参考文献索引统一封装,能够为地层名词规范化、文献实体识别和跨库数据映射提供底层支撑。
1 数据采集和处理方法
1.1 数据采集方法
数据通过 Macrostrat API v2 的 /defs/strat_names 接口,以 all 参数获取全量定义结果,并分别保存为 CSV 和 JSON 两种格式。 CSV 便于快速浏览和表格处理, JSON 则保留了 success 、 data 和 refs 等完整结构信息。
1.2 数据处理
下载后的文件保存至 “ 03_ 地层名称”目录,命名为 stratigraphic_names.csv 和 stratigraphic_names.json 。 JSON 中保留了 ref_id 与 refs 的映射关系,便于后续引用追踪与元数据关联分析。