地球资源数据云——数据资源详情
中国国家电网公司(SGCC)发布的窃电检测数据集数据集.csv包含2014年1月1日至2016年10月30日用电量的1037列和42,372行。SGCC数据第一列是字母数字的消费者ID。然后从第2列到第1036列给出了每天的用电量。最后一列名为 flag 的是 0 和 1 值中的标签。数据集datasetsmall.csv的小型版本仅包含 2014 年 1 月的用电量。 二元分类: 该数据集的主要目的是对电气盗窃进行二元分类。 不平衡数据集处理:对于探索类平衡方法很有用。 时间序列预测:可用于预测和预测给定日期的电力消耗。 笔记 该数据集包含缺失值。 该数据集的日期格式为 MM/DD/YYYY。 该数据集需要稍微清理。

中国国家电网公司(SGCC)发布的窃电检测数据集数据集.csv包含2014年1月1日至2016年10月30日用电量的1037列和42,372行。SGCC数据第一列是字母数字的消费者ID。然后从第2列到第1036列给出了每天的用电量。最后一列名为 flag 的是 0 和 1 值中的标签。数据集datasetsmall.csv的小型版本仅包含 2014 年 1 月的用电量。
二元分类: 该数据集的主要目的是对电气盗窃进行二元分类。
不平衡数据集处理:对于探索类平衡方法很有用。
时间序列预测:可用于预测和预测给定日期的电力消耗。
笔记
该数据集包含缺失值。
该数据集的日期格式为 MM/DD/YYYY。
该数据集需要稍微清理。
中国国家电网公司(SGCC)发布的窃电检测数据集数据集.
数据格式为 CSV。
该数据集覆盖范围为中国。
时间序列预测:可用于预测和预测给定日期的电力消耗。
在本页登录后即可下载。建议引用格式:地球资源数据云. 国家电网窃电检测. https://www.gis5g.com/dataset/1813