建设带数据搜索的网站 第1篇
Buzzfeed并不只是做一些通过让你做salad来评论人类状况的测验。Buzzfeed可能在这方面不那么出名,但Buzzfeed做了很多高质量的数据新闻。
这也都是开源的。
推荐这个网站的原因:
有趣的数据,经过预先清理,并以文章的形式附上精心编写的评论。
较重的话题。这里强调的是更复杂的话题,例如政治和健康,但也有很多其他话题。
建设带数据搜索的网站 第2篇
如果你喜欢让数据紧随流行文化,那么就是最佳选择。这个网站关注的话题多种多样,如重复的流行歌词、女性的口袋,以及《生活大爆炸》多么受欢迎。
这更像是一本数字杂志,撰写关于文化的长篇文章,同时在旁边展示大量的数据。我把它放在这里,是因为他们讲述了很棒的故事并分享了他们的数据。
推荐这个网站的原因:
很棒且有趣的数据。
分享数据和脚本。
很多你可能关心的东西都是IRL。
建设带数据搜索的网站 第3篇
Tidy Tuesdays本身并不完全是一个包含数据集的网站,但它是一个每周一次的活动和社区,重点是使用数据科学来探索杂乱的数据。
每周都会推出一个新的数据集。鼓励参与者在GitHub和Twitter上互相分享他们的清理技术和可视化效果。
推荐这个网站的原因:
这个社区是令人难以置信的。每周你都能学到新东西。
它是如此方便。不用去寻找数据集,获取每周的投放。
具有挑战性的、不整齐的数据。你在IRL中得到的数据很少会像这个列表中的其他数据那样经过消毒处理。Tidy Tuesdays帮助你学习如何处理混乱的数据。
建设带数据搜索的网站 第4篇
Kaggle的Datasets也是一个搜索引擎,但它的局限性更大,也更有针对性。
它更有局限性,因为它只包含人们在Kaggle发布的数据集。但它更有针对性,因为这些数据集并不是Google随意搜罗的数字集。Kaggle是一个数据科学竞赛的场所,所以它收集的数据集与数据科学极为相关。
这使得你可以根据自己的特定兴趣进行筛选。例如,如果我在启用“计算机视觉”过滤器的情况下搜索“猫”,我可能会偶然发现同一个猫数据集。
推荐这个网站的原因:
很多示例项目。你还可以看到其他人围绕这个数据建立或编码的内容。
你也可以反其道而行之——查看他们的比赛,看看是否有你感兴趣的东西,然后使用配套的数据集。