地球资源数据云——数据资源详情
参考文献中的原始数据集由 5 个不同的文件夹组成,每个文件夹包含 100 个文件,每个文件代表一个主题/人。每个文件记录了 23.6 秒的大脑活动。相应的时间序列被采样为 4097 个数据点。每个数据点都是不同时间点的脑电图记录值。所以我们总共有 500 个人,每个人在 23.5 秒内有 4097 个数据点。 我们将每 4097 个数据点分为 23 个块,每个块包含 1 秒的 178 个数据点,每个数据点是不同时间点的脑电图记录的值。所以现在我们有 23 x 500 = 11500 条信息(行),每条信息包含 1 秒的 178 个数据点(列),最后一列表示标签 y {1,2,3,4,5}。 响应变量为第 179 列中的 y,解释变量 X1, X2, …, X178 y 包含 178 维输入向量的类别。具体来说,{1, 2, 3, 4, 5} 中的 y: 5 - 眼睛睁开,意味着当他们记录大脑的脑电图信号时,患者睁着眼睛 4 - 闭眼,意味着在记录脑电图信号时患者闭着眼睛 3 - 是的,他们确定了肿瘤区域在大脑中的位置,并记录了健康大脑区域的脑电图活动 2 - 他们记录肿瘤所在区域的脑电图 1 - 记录癫痫发作活动 所有属于第 2、3、4 和 5 类的受试者都是没有癫痫发作的受试者。仅 1 类受试者有癫痫发作。我们创建此版本数据的动机是通过创建 .csv 版本来简化对数据的访问。尽管有 5 个类别,但大多数作者都进行了二元分类,即第 1 类(癫痫发作)与其他类别。

参考文献中的原始数据集由 5 个不同的文件夹组成,每个文件夹包含 100 个文件,每个文件代表一个主题/人。每个文件记录了 23.6 秒的大脑活动。相应的时间序列被采样为 4097 个数据点。每个数据点都是不同时间点的脑电图记录值。所以我们总共有 500 个人,每个人在 23.5 秒内有 4097 个数据点。
我们将每 4097 个数据点分为 23 个块,每个块包含 1 秒的 178 个数据点,每个数据点是不同时间点的脑电图记录的值。所以现在我们有 23 x 500 = 11500 条信息(行),每条信息包含 1 秒的 178 个数据点(列),最后一列表示标签 y {1,2,3,4,5}。
响应变量为第 179 列中的 y,解释变量 X1, X2, …, X178
y 包含 178 维输入向量的类别。具体来说,{1, 2, 3, 4, 5} 中的 y:
5 - 眼睛睁开,意味着当他们记录大脑的脑电图信号时,患者睁着眼睛
4 - 闭眼,意味着在记录脑电图信号时患者闭着眼睛
3 - 是的,他们确定了肿瘤区域在大脑中的位置,并记录了健康大脑区域的脑电图活动
2 - 他们记录肿瘤所在区域的脑电图
1 - 记录癫痫发作活动
所有属于第 2、3、4 和 5 类的受试者都是没有癫痫发作的受试者。仅 1 类受试者有癫痫发作。我们创建此版本数据的动机是通过创建 .csv 版本来简化对数据的访问。尽管有 5 个类别,但大多数作者都进行了二元分类,即第 1 类(癫痫发作)与其他类别。