地球资源数据云——数据资源详情
中国国家电网公司(SGCC)发布的窃电检测数据集数据集.csv包含2014年1月1日至2016年10月30日用电量的1037列和42,372行。SGCC数据第一列是字母数字的消费者ID。然后从第2列到第1036列给出了每天的用电量。最后一列名为 flag 的是 0 和 1 值中的标签。数据集datasetsmall.csv的小型版本仅包含 2014 年 1 月的用电量。 二元分类: 该数据集的主要目的是对电气盗窃进行二元分类。 不平衡数据集处理:对于探索类平衡方法很有用。 时间序列预测:可用于预测和预测给定日期的电力消耗。 笔记 该数据集包含缺失值。 该数据集的日期格式为 MM/DD/YYYY。 该数据集需要稍微清理。

中国国家电网公司(SGCC)发布的窃电检测数据集数据集.csv包含2014年1月1日至2016年10月30日用电量的1037列和42,372行。SGCC数据第一列是字母数字的消费者ID。然后从第2列到第1036列给出了每天的用电量。最后一列名为 flag 的是 0 和 1 值中的标签。数据集datasetsmall.csv的小型版本仅包含 2014 年 1 月的用电量。
二元分类: 该数据集的主要目的是对电气盗窃进行二元分类。
不平衡数据集处理:对于探索类平衡方法很有用。
时间序列预测:可用于预测和预测给定日期的电力消耗。
笔记
该数据集包含缺失值。
该数据集的日期格式为 MM/DD/YYYY。
该数据集需要稍微清理。