地球资源数据云——数据资源详情

糖尿病健康指标数据集

发布时间:2025-08-15 15:31:13资源ID:1732资源类型:免费

糖尿病是美国最流行的慢性疾病之一,每年影响数百万美国人,并给经济带来巨大的经济负担。糖尿病是一种严重的慢性疾病,患者失去有效调节血液中葡萄糖水平的能力,并可能导致生活质量和预期寿命下降。不同的食物在消化过程中分解成糖后,糖就会释放到血液中。这向胰腺发出释放胰岛素的信号。胰岛素有助于体内细胞利用血液中的这些糖来获取能量。糖尿病的一般特征是身体不能产生足够的胰岛素或无法根据需要有效地使用所产生的胰岛素。 对于糖尿病患者来说,心脏病、视力丧失、下肢截肢和肾脏疾病等并发症与血液中长期残留的高糖分有关。虽然糖尿病无法治愈,但减肥、健康饮食、积极活动和接受药物治疗等策略可以减轻这种疾病对许多患者的危害。早期诊断可以导致生活方式的改变和更有效的治疗,使糖尿病风险预测模型成为公众和公共卫生官员的重要工具。 认识到这个问题的严重性也很重要。美国疾病控制与预防中心表示,截至 2018 年,美国有 3420 万糖尿病患者,其中 8800 万处于糖尿病前期。此外,疾病预防控制中心估计,五分之一的糖尿病患者和大约十分之八的糖尿病前期患者不知道自己的风险。虽然糖尿病有不同类型,但 II 型糖尿病是最常见的形式,其患病率因年龄、教育程度、收入、地点、种族和其他健康社会决定因素而异。这种疾病的大部分负担也落在了社会经济地位较低的人身上。糖尿病还给经济带来巨大负担,每年诊断出的糖尿病费用约为 3,270 亿美元,未确诊的糖尿病和糖尿病前期的总费用接近 4,000 亿美元。 内容 行为风险因素监测系统 (BRFSS) 是一项与健康相关的电话调查,由 CDC 每年收集一次。每年,该调查都会收集超过 40 万美国人对健康相关风险行为、慢性健康状况和预防服务使用的反馈。自 1984 年以来每年都会进行一次。该项目使用了 Kaggle 上 2015 年可用数据集的 csv。该原始数据集包含 441,455 个人的回复,并具有 330 个特征。这些特征要么是直接向参与者提出的问题,要么是根据个体参与者的反应计算出的变量。 该数据集包含3个文件: 糖尿病 _ 012 _ 健康 _ 指标 _ BRFSS2015.csv 是一个干净的数据集,包含对 CDC BRFSS2015 的 253,680 份调查回复。目标变量 Diabetes_012 有 3 个类别。0 表示没有糖尿病或仅在怀孕期间,1 表示糖尿病前期,2 表示糖尿病。该数据集中存在类别不平衡。该数据集有 21 个特征变量 糖尿病 _ 二元 _ 5050split _ 健康 _ 指标 _ BRFSS2015.csv 是一个干净的数据集,包含 CDC BRFSS2015 的 70,692 份调查回复。没有糖尿病、患有糖尿病前期或糖尿病的受访者比例为 50 - 50 人。目标变量 Diabetes_binary 有 2 个类别。0 表示没有糖尿病,1 表示糖尿病前期或糖尿病。该数据集有 21 个特征变量并且是平衡的。 糖尿病 _ 二元 _ 健康 _ 指标 _ BRFSS2015.csv 是一个干净的数据集,包含对 CDC BRFSS2015 的 253,680 份调查回复。目标变量 Diabetes_binary 有 2 个类别。0 表示没有糖尿病,1 表示糖尿病前期或糖尿病。该数据集有 21 个特征变量,并且不平衡。 探索以下一些研究问题:

糖尿病健康指标数据集

摘要概览

糖尿病是美国最流行的慢性疾病之一,每年影响数百万美国人,并给经济带来巨大的经济负担。糖尿病是一种严重的慢性疾病,患者失去有效调节血液中葡萄糖水平的能力,并可能导致生活质量和预期寿命下降。不同的食物在消化过程中分解成糖后,糖就会释放到血液中。这向胰腺发出释放胰岛素的信号。胰岛素有助于体内细胞利用血液中的这些糖来获取能量。糖尿病的一般特征是身体不能产生足够的胰岛素或无法根据需要有效地使用所产生的胰岛素。

对于糖尿病患者来说,心脏病、视力丧失、下肢截肢和肾脏疾病等并发症与血液中长期残留的高糖分有关。虽然糖尿病无法治愈,但减肥、健康饮食、积极活动和接受药物治疗等策略可以减轻这种疾病对许多患者的危害。早期诊断可以导致生活方式的改变和更有效的治疗,使糖尿病风险预测模型成为公众和公共卫生官员的重要工具。

认识到这个问题的严重性也很重要。美国疾病控制与预防中心表示,截至 2018 年,美国有 3420 万糖尿病患者,其中 8800 万处于糖尿病前期。此外,疾病预防控制中心估计,五分之一的糖尿病患者和大约十分之八的糖尿病前期患者不知道自己的风险。虽然糖尿病有不同类型,但 II 型糖尿病是最常见的形式,其患病率因年龄、教育程度、收入、地点、种族和其他健康社会决定因素而异。这种疾病的大部分负担也落在了社会经济地位较低的人身上。糖尿病还给经济带来巨大负担,每年诊断出的糖尿病费用约为 3,270 亿美元,未确诊的糖尿病和糖尿病前期的总费用接近 4,000 亿美元。

内容

行为风险因素监测系统 (BRFSS) 是一项与健康相关的电话调查,由 CDC 每年收集一次。每年,该调查都会收集超过 40 万美国人对健康相关风险行为、慢性健康状况和预防服务使用的反馈。自 1984 年以来每年都会进行一次。该项目使用了 Kaggle 上 2015 年可用数据集的 csv。该原始数据集包含 441,455 个人的回复,并具有 330 个特征。这些特征要么是直接向参与者提出的问题,要么是根据个体参与者的反应计算出的变量。

该数据集包含3个文件:

糖尿病 _ 012 _ 健康 _ 指标 _ BRFSS2015.csv 是一个干净的数据集,包含对 CDC BRFSS2015 的 253,680 份调查回复。目标变量 Diabetes_012 有 3 个类别。0 表示没有糖尿病或仅在怀孕期间,1 表示糖尿病前期,2 表示糖尿病。该数据集中存在类别不平衡。该数据集有 21 个特征变量

糖尿病 _ 二元 _ 5050split _ 健康 _ 指标 _ BRFSS2015.csv 是一个干净的数据集,包含 CDC BRFSS2015 的 70,692 份调查回复。没有糖尿病、患有糖尿病前期或糖尿病的受访者比例为 50 - 50 人。目标变量 Diabetes_binary 有 2 个类别。0 表示没有糖尿病,1 表示糖尿病前期或糖尿病。该数据集有 21 个特征变量并且是平衡的。

糖尿病 _ 二元 _ 健康 _ 指标 _ BRFSS2015.csv 是一个干净的数据集,包含对 CDC BRFSS2015 的 253,680 份调查回复。目标变量 Diabetes_binary 有 2 个类别。0 表示没有糖尿病,1 表示糖尿病前期或糖尿病。该数据集有 21 个特征变量,并且不平衡。

探索以下一些研究问题: