地球资源数据云——数据资源详情

国家电网窃电检测

发布时间:2025-08-15 15:31:14资源ID:1813资源类型:免费

中国国家电网公司(SGCC)发布的窃电检测数据集数据集.csv包含2014年1月1日至2016年10月30日用电量的1037列和42,372行。SGCC数据第一列是字母数字的消费者ID。然后从第2列到第1036列给出了每天的用电量。最后一列名为 flag 的是 0 和 1 值中的标签。数据集datasetsmall.csv的小型版本仅包含 2014 年 1 月的用电量。 二元分类: 该数据集的主要目的是对电气盗窃进行二元分类。 不平衡数据集处理:对于探索类平衡方法很有用。 时间序列预测:可用于预测和预测给定日期的电力消耗。 笔记 该数据集包含缺失值。 该数据集的日期格式为 MM/DD/YYYY。 该数据集需要稍微清理。

国家电网窃电检测

摘要概览

中国国家电网公司(SGCC)发布的窃电检测数据集数据集.csv包含2014年1月1日至2016年10月30日用电量的1037列和42,372行。SGCC数据第一列是字母数字的消费者ID。然后从第2列到第1036列给出了每天的用电量。最后一列名为 flag 的是 0 和 1 值中的标签。数据集datasetsmall.csv的小型版本仅包含 2014 年 1 月的用电量。

二元分类: 该数据集的主要目的是对电气盗窃进行二元分类。

不平衡数据集处理:对于探索类平衡方法很有用。

时间序列预测:可用于预测和预测给定日期的电力消耗。

笔记

该数据集包含缺失值。

该数据集的日期格式为 MM/DD/YYYY。

该数据集需要稍微清理。