地球资源数据云——数据资源详情

垃圾邮件数据集

发布时间:2025-08-15 15:31:11资源ID:1389资源类型:免费

此数据集包含电子邮件文本消息的集合,标记为垃圾邮件或非垃圾邮件。每封电子邮件都与一个二进制标签相关联,其中“1”表示该电子邮件是垃圾邮件,“0”表示该电子邮件不是垃圾邮件。该数据集旨在用于训练和评估垃圾邮件分类模型。 文本(Text):该列包含电子邮件的文本内容。它包括电子邮件正文以及任何相关的主题行或标题。 spam_or_not(二进制):此列包含二进制标签,用于指示电子邮件是否为垃圾邮件。“1”代表垃圾邮件,“0”代表非垃圾邮件。 用途: 该数据集可用于各种自然语言处理(NLP)任务,例如文本分类和垃圾邮件检测。研究人员和数据科学家可以使用此数据集训练和评估机器学习模型,以构建有效的垃圾邮件过滤器。

垃圾邮件数据集

摘要概览

此数据集包含电子邮件文本消息的集合,标记为垃圾邮件或非垃圾邮件。每封电子邮件都与一个二进制标签相关联,其中“1”表示该电子邮件是垃圾邮件,“0”表示该电子邮件不是垃圾邮件。该数据集旨在用于训练和评估垃圾邮件分类模型。

文本(Text):该列包含电子邮件的文本内容。它包括电子邮件正文以及任何相关的主题行或标题。

spam_or_not(二进制):此列包含二进制标签,用于指示电子邮件是否为垃圾邮件。“1”代表垃圾邮件,“0”代表非垃圾邮件。

用途:

该数据集可用于各种自然语言处理(NLP)任务,例如文本分类和垃圾邮件检测。研究人员和数据科学家可以使用此数据集训练和评估机器学习模型,以构建有效的垃圾邮件过滤器。