地球资源数据云——数据资源详情

心脏病的个人关键指标

发布时间:2025-08-15 15:31:07资源ID:885资源类型:免费

心脏病的主要指标 2020年CDC年度40万成年人健康状况调查数据 数据集涵盖什么主题? 根据疾病预防控制中心的数据,心脏病是美国大多数种族(非裔美国人、美洲印第安人和阿拉斯加原住民以及白人)的主要原因之一。大约一半的美国人 (47%) 至少患有心脏病的 3 个关键危险因素中的 1 个:高血压、高胆固醇和吸烟。其他关键指标包括糖尿病状况、肥胖(高体重指数)、体力活动不足或饮酒过多。检测和预防对心脏病影响最大的因素对于医疗保健非常重要。反过来,计算的发展使得机器学习方法的应用能够从数据中检测“模式”,从而预测患者的病情。 数据集来自哪里以及经过了哪些处理? 最初,该数据集来自疾病预防控制中心,是行为风险因素监测系统(BRFSS)的主要组成部分,该系统每年进行电话调查以收集有关美国居民健康状况的数据。作为疾病预防控制中心描述:“BRFSS 于 1984 年成立,覆盖 15 个州,现在收集所有 50 个州以及哥伦比亚特区和三个美国领地的数据。BRFSS 每年完成超过 400,000 名成人访谈,使其成为美国最大的连续进行的健康调查系统世界。”。最新的数据集(截至 2022 年 2 月 15 日)包含 2020 年的数据。它由 401,958 行和 279 列组成。绝大多数专栏都是向受访者询问有关其健康状况的问题,例如“您行走或爬​​楼梯是否有严重困难?” 或“您一生至少吸过100支烟吗?[注:5包=100支烟]”。在这个数据集中,我注意到许多直接或间接影响心脏病的不同因素(问题), 您可以用这个数据集做什么? 如上所述,原始数据集的近 300 个变量减少到大约 20 个变量。除了经典的 EDA 之外,该数据集还可用于应用一系列机器学习方法,尤其是分类器模型(逻辑回归、SVM、随机森林等)。您应该将变量“HeartDisease”视为二元变量(“是” - 受访者患有心脏病;“否” - 受访者没有心脏病)。但请注意,类并不平衡,因此经典模型应用方法并不可取。固定权重/欠采样应该会产生明显更好的结果。根据数据集,我构建了一个逻辑回归模型并将其嵌入到您可能会受到启发的应用程序中:https ://share.streamlit.io/kamilpytlak/heart - condition - checker/main/app.py。您能指出哪些变量对心脏病的可能性有显着影响吗?

心脏病的个人关键指标

摘要概览

心脏病的主要指标

2020年CDC年度40万成年人健康状况调查数据

数据集涵盖什么主题?

根据疾病预防控制中心的数据,心脏病是美国大多数种族(非裔美国人、美洲印第安人和阿拉斯加原住民以及白人)的主要原因之一。大约一半的美国人 (47%) 至少患有心脏病的 3 个关键危险因素中的 1 个:高血压、高胆固醇和吸烟。其他关键指标包括糖尿病状况、肥胖(高体重指数)、体力活动不足或饮酒过多。检测和预防对心脏病影响最大的因素对于医疗保健非常重要。反过来,计算的发展使得机器学习方法的应用能够从数据中检测“模式”,从而预测患者的病情。

数据集来自哪里以及经过了哪些处理?

最初,该数据集来自疾病预防控制中心,是行为风险因素监测系统(BRFSS)的主要组成部分,该系统每年进行电话调查以收集有关美国居民健康状况的数据。作为疾病预防控制中心描述:“BRFSS 于 1984 年成立,覆盖 15 个州,现在收集所有 50 个州以及哥伦比亚特区和三个美国领地的数据。BRFSS 每年完成超过 400,000 名成人访谈,使其成为美国最大的连续进行的健康调查系统世界。”。最新的数据集(截至 2022 年 2 月 15 日)包含 2020 年的数据。它由 401,958 行和 279 列组成。绝大多数专栏都是向受访者询问有关其健康状况的问题,例如“您行走或爬​​楼梯是否有严重困难?” 或“您一生至少吸过100支烟吗?[注:5包=100支烟]”。在这个数据集中,我注意到许多直接或间接影响心脏病的不同因素(问题),

您可以用这个数据集做什么?

如上所述,原始数据集的近 300 个变量减少到大约 20 个变量。除了经典的 EDA 之外,该数据集还可用于应用一系列机器学习方法,尤其是分类器模型(逻辑回归、SVM、随机森林等)。您应该将变量“HeartDisease”视为二元变量(“是” - 受访者患有心脏病;“否” - 受访者没有心脏病)。但请注意,类并不平衡,因此经典模型应用方法并不可取。固定权重/欠采样应该会产生明显更好的结果。根据数据集,我构建了一个逻辑回归模型并将其嵌入到您可能会受到启发的应用程序中:https ://share.streamlit.io/kamilpytlak/heart - condition - checker/main/app.py。您能指出哪些变量对心脏病的可能性有显着影响吗?