地球资源数据云——数据资源详情

海德拉巴 Zomato 餐厅

发布时间:2026-03-17 14:30:57资源ID:2032004720884092930资源类型:免费

该数据集《Zomato Restaurants Hyderabad》主要用于多分类任务,数据形态以文本为主,应用场景偏向文本内容分析。 题目说明:A comprehensive data of top 100 restaurants in Hyderabad for NLP analysis. 任务类型:文本多分类。 建议流程:先做文本清洗与分词,再比较 TF - IDF+线性模型 与 预训练语言模型。 评估建议:使用分层切分或交叉验证,优先关注 F1、Recall、AUC 等分类指标。 可用文件:Restaurant names and Metadata.csv, Restaurant reviews.csv。 背景数据集背后的故事是为了识别海得拉巴独特的饮食文化和美食。这个地方的食品和饮料非常均衡,既有国际化的(意大利、中国、北印度),也有传统的(令人垂涎欲滴、烧耳朵的印度香饭)。内容 有两个单独的文件,而各列是不言自明的。以下是简要描述: 1. 餐厅名称和元数据 - 这可以帮助将餐厅分为多个部分。此外,该数据还包含有关美食和成本计算的宝贵信息,可用于成本与收益分析。 2. 餐厅评论 - 数据可用于情绪分析。此外,审稿人的元数据还可用于识别行业中的批评者。致谢 数据的抓取完全仅用于教育目的。数据的所有版权均归 Zomato Media Pvt. 所有。灵感 其背后的灵感是确定户外用餐文化如何转变,以及对特定菜肴的看法,以便确定以下内容: 1. 户外用餐即将出现的趋势和影响 2. 军政府(印度俚语)如何看待较新的菜肴与海得拉巴菜肴 3. 获得良好和不良评级的因素是什么

海德拉巴 Zomato 餐厅

摘要概览

该数据集《Zomato Restaurants Hyderabad》主要用于多分类任务,数据形态以文本为主,应用场景偏向文本内容分析。 题目说明:A comprehensive data of top 100 restaurants in Hyderabad for NLP analysis.

任务类型:文本多分类。

建议流程:先做文本清洗与分词,再比较 TF - IDF+线性模型 与 预训练语言模型。

评估建议:使用分层切分或交叉验证,优先关注 F1、Recall、AUC 等分类指标。

可用文件:Restaurant names and Metadata.csv, Restaurant reviews.csv。

背景数据集背后的故事是为了识别海得拉巴独特的饮食文化和美食。这个地方的食品和饮料非常均衡,既有国际化的(意大利、中国、北印度),也有传统的(令人垂涎欲滴、烧耳朵的印度香饭)。内容 有两个单独的文件,而各列是不言自明的。以下是简要描述: 1. 餐厅名称和元数据 - 这可以帮助将餐厅分为多个部分。此外,该数据还包含有关美食和成本计算的宝贵信息,可用于成本与收益分析。 2. 餐厅评论 - 数据可用于情绪分析。此外,审稿人的元数据还可用于识别行业中的批评者。致谢 数据的抓取完全仅用于教育目的。数据的所有版权均归 Zomato Media Pvt. 所有。灵感 其背后的灵感是确定户外用餐文化如何转变,以及对特定菜肴的看法,以便确定以下内容: 1. 户外用餐即将出现的趋势和影响 2. 军政府(印度俚语)如何看待较新的菜肴与海得拉巴菜肴 3. 获得良好和不良评级的因素是什么