地球资源数据云——数据资源详情

垃圾短信分类

发布时间:2026-03-17 14:32:30资源ID:2031260194687062017资源类型:免费

该数据集《Spam Text Message Classification》主要用于二分类任务,数据形态以文本为主。 题目说明:Let's battle with annoying spammer with data science. 任务类型:文本二分类。 建议流程:先做文本清洗与分词,再比较 TF - IDF+线性模型 与 预训练语言模型。 评估建议:使用分层切分或交叉验证,优先关注 F1、Recall、AUC 等分类指标。 可用文件:SPAM text message 20170820 - Data.csv。 Context Coming Soon Content Acknowledgements Special thanks to; http://www.dt.fee.unicamp.br/~tiago/smsspamcollection/ Inspiration

垃圾短信分类

摘要概览

该数据集《Spam Text Message Classification》主要用于二分类任务,数据形态以文本为主。 题目说明:Let's battle with annoying spammer with data science.

任务类型:文本二分类。

建议流程:先做文本清洗与分词,再比较 TF - IDF+线性模型 与 预训练语言模型。

评估建议:使用分层切分或交叉验证,优先关注 F1、Recall、AUC 等分类指标。

可用文件:SPAM text message 20170820 - Data.csv。

Context

Coming Soon

Content

Acknowledgements Special thanks to; http://www.dt.fee.unicamp.br/~tiago/smsspamcollection/

Inspiration