[关闭]
@Team 2018-03-07T02:33:37.000000Z 字数 4259 阅读 857

【干货收藏】不要担心没数据!史上最全数据集网站汇总

蒙康


如果用一个句子总结学习数据科学的本质,那就是:
学习数据科学的最佳方法就是应用数据科学。
如果你是一个初学者,你每完成一个新项目后自身能力都会有极大的提高,如果你是一个有经验的数据科学专家,你已经知道这里所蕴含的价值。
本文将为您提供一个网站/资源列表,从中你可以使用数据来完成你自己的数据项目,甚至创造你自己的产品。
image_1c7tluif61ghl1ti21smm1ccfuqv9.png-769.1kB

如何使用这些资源?

如何使用这些数据源是没有限制的,应用和使用只受到您的创造力和实际应用。使用它们最简单的方法是进行数据项目并在网站上发布它们。这不仅能提高你的数据和可视化技能,还能改善你的结构化思维。另一方面,如果你正在考虑/处理基于数据的产品,这些数据集可以通过提供额外的/新的输入数据来增加您的产品的功能。所以,继续在这些项目上工作吧,与更大的世界分享它们,以展示你的数据能力!我们已经在不同的部分中划分了这些数据源,以帮助你根据应用程序对数据源进行分类。我们从简单、通用和易于处理数据集开始,然后转向大型/行业相关数据集。然后,我们为特定的目的——文本挖掘、图像分类、推荐引擎等提供数据集的链接。这将为您提供一个完整的数据资源列表。如果你能想到这些数据集的任何应用,或者知道我们漏掉了什么流行的资源,请在下面的评论中与我们分享。(部分可能需要翻墙)

由简单和通用的数据集开始

大型数据集

预测建模与机器学习数据集

图像分类数据集

文本分类数据集

推荐引擎数据集

各种来源的数据集网站

结尾的话

我们希望这一资源清单对于那些想项目的人来说是非常有用的。这绝对是一个金矿,好好加以利用吧!

文章来源:https://www.analyticsvidhya.com/blog/

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注