地球资源数据云——数据资源详情

推文数据集上的种族歧视

发布时间:2025-08-15 15:31:15资源ID:1966资源类型:免费

该数据集对 2023 年 8 月在 Twitter 上发布的仅包含英语种族诽谤的推文进行了全面探索,促进了严格的分析和学术调查。 数据集内容 1.timeline_tweets: 此目录包含 JSON 文件,每个文件代表一条包含种族诽谤的推文。这些文件包括有关推文的基本信息,例如推文文本、用户详细信息、时间戳和 2.conversation_tweets: 在此目录中,您将找到与时间线_tweets文件夹中的特定推文关联的 JSON 文件。这些文件包含对原始推文的回复和评论,提供与种族相关的上下文和对话线索 3. images: 该目录包含从timeline_tweets文件夹中的推文中提取的JPEG图像文件。这些图像是与文本一起共享的视觉内容,它们可以提供额外的上下文来了解推文中种族诽谤的影响。 4. ocr_output: 在此目录中,您将找到包含从“images”文件夹中的图像中提取的文本的文本文件。该文本代表图像中的内容,允许进行文本分析并进一步深入了解包含种族诽谤的推文。

推文数据集上的种族歧视

摘要概览

该数据集对 2023 年 8 月在 Twitter 上发布的仅包含英语种族诽谤的推文进行了全面探索,促进了严格的分析和学术调查。

数据集内容

1.timeline_tweets:

此目录包含 JSON 文件,每个文件代表一条包含种族诽谤的推文。这些文件包括有关推文的基本信息,例如推文文本、用户详细信息、时间戳和

2.conversation_tweets:

在此目录中,您将找到与时间线_tweets文件夹中的特定推文关联的 JSON 文件。这些文件包含对原始推文的回复和评论,提供与种族相关的上下文和对话线索

3. images:

该目录包含从timeline_tweets文件夹中的推文中提取的JPEG图像文件。这些图像是与文本一起共享的视觉内容,它们可以提供额外的上下文来了解推文中种族诽谤的影响。

4. ocr_output:

在此目录中,您将找到包含从“images”文件夹中的图像中提取的文本的文本文件。该文本代表图像中的内容,允许进行文本分析并进一步深入了解包含种族诽谤的推文。