地球资源数据云——数据资源详情
该数据集对 2023 年 8 月在 Twitter 上发布的仅包含英语种族诽谤的推文进行了全面探索,促进了严格的分析和学术调查。 数据集内容 1.timeline_tweets: 此目录包含 JSON 文件,每个文件代表一条包含种族诽谤的推文。这些文件包括有关推文的基本信息,例如推文文本、用户详细信息、时间戳和 2.conversation_tweets: 在此目录中,您将找到与时间线_tweets文件夹中的特定推文关联的 JSON 文件。这些文件包含对原始推文的回复和评论,提供与种族相关的上下文和对话线索 3. images: 该目录包含从timeline_tweets文件夹中的推文中提取的JPEG图像文件。这些图像是与文本一起共享的视觉内容,它们可以提供额外的上下文来了解推文中种族诽谤的影响。 4. ocr_output: 在此目录中,您将找到包含从“images”文件夹中的图像中提取的文本的文本文件。该文本代表图像中的内容,允许进行文本分析并进一步深入了解包含种族诽谤的推文。

该数据集对 2023 年 8 月在 Twitter 上发布的仅包含英语种族诽谤的推文进行了全面探索,促进了严格的分析和学术调查。
数据集内容
1.timeline_tweets:
此目录包含 JSON 文件,每个文件代表一条包含种族诽谤的推文。这些文件包括有关推文的基本信息,例如推文文本、用户详细信息、时间戳和
2.conversation_tweets:
在此目录中,您将找到与时间线_tweets文件夹中的特定推文关联的 JSON 文件。这些文件包含对原始推文的回复和评论,提供与种族相关的上下文和对话线索
3. images:
该目录包含从timeline_tweets文件夹中的推文中提取的JPEG图像文件。这些图像是与文本一起共享的视觉内容,它们可以提供额外的上下文来了解推文中种族诽谤的影响。
4. ocr_output:
在此目录中,您将找到包含从“images”文件夹中的图像中提取的文本的文本文件。该文本代表图像中的内容,允许进行文本分析并进一步深入了解包含种族诽谤的推文。