地球资源数据云——数据资源详情
这是 Aurélien Géron 的新书《使用 Scikit - Learn 和 TensorFlow 进行机器学习实践》第二章中使用的数据集。它是实现机器学习算法的一个很好的介绍,因为它需要基本的数据清理,有一个易于理解的变量列表,并且处于玩具和过于麻烦之间的最佳大小。 该数据包含 1990 年加利福尼亚州人口普查的信息。因此,尽管它可能无法像 Zillow Zestimate 数据集那样帮助您预测当前的房价,但它确实提供了一个易于理解的入门数据集,用于教人们机器学习的基础知识。 内容 这些数据涉及在加州某个地区发现的房屋以及基于 1990 年人口普查数据的一些汇总统计数据。请注意,数据未清理,因此需要一些预处理步骤!这些列如下,它们的名称非常不言自明: 经度 纬度 住房年龄中位数 总房间数 总卧室数 人口

这是 Aurélien Géron 的新书《使用 Scikit - Learn 和 TensorFlow 进行机器学习实践》第二章中使用的数据集。它是实现机器学习算法的一个很好的介绍,因为它需要基本的数据清理,有一个易于理解的变量列表,并且处于玩具和过于麻烦之间的最佳大小。
该数据包含 1990 年加利福尼亚州人口普查的信息。因此,尽管它可能无法像 Zillow Zestimate 数据集那样帮助您预测当前的房价,但它确实提供了一个易于理解的入门数据集,用于教人们机器学习的基础知识。
内容
这些数据涉及在加州某个地区发现的房屋以及基于 1990 年人口普查数据的一些汇总统计数据。请注意,数据未清理,因此需要一些预处理步骤!这些列如下,它们的名称非常不言自明:
经度
纬度
住房年龄中位数
总房间数
总卧室数
人口