地球资源数据云——数据资源详情

阿斯利康抗新冠病毒推特

发布时间:2026-03-17 14:30:54资源ID:2032005620864290817资源类型:免费

该数据集《Twitter AstraZeneca AntiCovid》主要用于多分类任务,数据形态以文本为主,应用场景偏向文本内容分析。 题目说明:Machine learning - NLP 任务类型:文本多分类。 建议流程:先做文本清洗与分词,再比较 TF - IDF+线性模型 与 预训练语言模型。 评估建议:使用分层切分或交叉验证,优先关注 F1、Recall、AUC 等分类指标。 可用文件:Vaccine_dataset_AstraZeneca.csv。 数据集描述 该数据集包含具有关联情绪分析指标的推文。这些数据可用于文本挖掘、自然语言处理 (NLP) 和情感分析项目。这些推文根据其主观性和极性进行分类,以便深入了解与各种主题或目标相关的观点。该数据集对于了解公众对不同实体或问题的情绪特别有价值。列: - id:每条推文的唯一标识符。 - 推文:推文的原始文本。 - 主观性:量化推文主观或客观程度的分数,值越高表示个人观点越多。 - 极性:情绪分数范围从 - 1(负面)到 1(正面),代表推文的整体基调。 - 目标:推文针对的特定主题或实体(例如人、事件、公司)。背景:该数据集的灵感来自于分析社交媒体平台(尤其是 Twitter)的需求,以了解围绕某些主题或实体的公众情绪。目标是了解用户对各种主题的感受,并量化这些感受以进行进一步分析。来源:该数据集是现实世界推文的汇编,这些推文已使用 NLP 技术进行处理以生成主观性和极性分数。它的灵感来自于越来越多地使用社交媒体情绪来推动商业、政治和社会见解。灵感:该数据集可用于各种 NLP 任务,例如: - 情感分析 - 意见挖掘 - 主题建模 - 文本分类 - 社交媒体监控 对于希望尝试推文数据和情感分析的数据科学家、研究人员和开发人员来说,它是理想的选择。

阿斯利康抗新冠病毒推特

摘要概览

该数据集《Twitter AstraZeneca AntiCovid》主要用于多分类任务,数据形态以文本为主,应用场景偏向文本内容分析。 题目说明:Machine learning - NLP

任务类型:文本多分类。

建议流程:先做文本清洗与分词,再比较 TF - IDF+线性模型 与 预训练语言模型。

评估建议:使用分层切分或交叉验证,优先关注 F1、Recall、AUC 等分类指标。

可用文件:Vaccine_dataset_AstraZeneca.csv。

数据集描述 该数据集包含具有关联情绪分析指标的推文。这些数据可用于文本挖掘、自然语言处理 (NLP) 和情感分析项目。这些推文根据其主观性和极性进行分类,以便深入了解与各种主题或目标相关的观点。该数据集对于了解公众对不同实体或问题的情绪特别有价值。列: - id:每条推文的唯一标识符。 - 推文:推文的原始文本。 - 主观性:量化推文主观或客观程度的分数,值越高表示个人观点越多。 - 极性:情绪分数范围从 - 1(负面)到 1(正面),代表推文的整体基调。 - 目标:推文针对的特定主题或实体(例如人、事件、公司)。背景:该数据集的灵感来自于分析社交媒体平台(尤其是 Twitter)的需求,以了解围绕某些主题或实体的公众情绪。目标是了解用户对各种主题的感受,并量化这些感受以进行进一步分析。来源:该数据集是现实世界推文的汇编,这些推文已使用 NLP 技术进行处理以生成主观性和极性分数。它的灵感来自于越来越多地使用社交媒体情绪来推动商业、政治和社会见解。灵感:该数据集可用于各种 NLP 任务,例如: - 情感分析 - 意见挖掘 - 主题建模 - 文本分类 - 社交媒体监控 对于希望尝试推文数据和情感分析的数据科学家、研究人员和开发人员来说,它是理想的选择。