地球资源数据云——数据资源详情
每当我想尝试新的化妆品时,都很难选择。实际上这比困难还多。有时这很可怕,因为我从未尝试过的新产品最终会给我带来皮肤问题。我们知道我们需要的信息位于每个产品的背面,但除非您是化学家,否则很难解释这些成分列表。您可能能够体会到这种情况。 内容 我们将创建一个基于内容的推荐系统,其中“内容”将是化妆品的化学成分。具体来说,我们将通过词嵌入处理 Sephora 上 1472 种化妆品的成分列表,然后使用称为 t - SNE 的机器学习方法和称为 Bokeh 的交互式可视化库可视化成分相似性。让我们先检查一下我们的数据。

每当我想尝试新的化妆品时,都很难选择。实际上这比困难还多。有时这很可怕,因为我从未尝试过的新产品最终会给我带来皮肤问题。我们知道我们需要的信息位于每个产品的背面,但除非您是化学家,否则很难解释这些成分列表。您可能能够体会到这种情况。
内容
我们将创建一个基于内容的推荐系统,其中“内容”将是化妆品的化学成分。具体来说,我们将通过词嵌入处理 Sephora 上 1472 种化妆品的成分列表,然后使用称为 t - SNE 的机器学习方法和称为 Bokeh 的交互式可视化库可视化成分相似性。让我们先检查一下我们的数据。