当前位置:主页 > bwin app > 入门 | 从文本处理到己触动驾驭:机具念书最日
201809/27

入门 | 从文本处理到己触动驾驭:机具念书最日

admin bwin app Comments 围观:

  选己Gengo.ai

  干者:Meiryum Ali

  机具之心编译

  参加以:王淑婷、李泽南

  机具念书范畴里拥有哪些绽数据集儿子?Gengo 迩到来颁布匹了壹份高品质避免费数据集儿子列表,其搜索范畴不单包罗情节普遍(如 Kaggle),也带拥有高特募化的(如己触动驾驭汽车公用数据集儿子)数据集儿子种类。

  比值先,在选择数据集儿子时要记取几个要紧规范:

  数据集儿子不能是混骚触动的,鉴于你不期望破开费微少量时间整顿理数据。

  数据集儿子不该该拥有度过多的行容许列,此雕刻么才干轻善处理。

  数据越皓净越好——清算父亲型数据集儿子能会什分耗时。

  该数据集儿子却以用于回恢复壹些诙谐的效实。

  此雕刻么的话,让我们看看能找到点什么?

  查找数据集儿子

  Kaggle:壹个数据迷信竞赛网站,就中包罗微少量外面部贡献的诙谐数据集儿子。你却以在它长长的列表中(https://www.kaggle.com/bwin官网网址s)找到各种小群数据集儿子,从弹奏面的评分、篮球数据,到正西雅图的宠物牌照。

  UCI Machine Learning Repository:它是网绕中最新鲜的数据集儿子源之壹,是寻摸各种诙谐数据集儿子的第壹选择。在此雕刻边,固然数据集儿子邑是用户己行贡献的,但清洁程度依然很高。余外面,你却以直接从 UCI Machine Learning Repository 左右载数据,无需报户口。

  畅通用数据集儿子

  公共内阁数据集儿子

  

  Data.gov:此雕刻个网站却以从多个美国内阁机构下载数据,从内阁预算到校效实。不外面要剩意:就中的全片断数据需寻求进壹步切磋。

  链接:https://www.data.gov/

  Food Environment Atlas:包罗拥关于该地食物选择何以影响美国饮食习惯的数据。

  链接:https://catalog.data.gov/bwin官网网址/food-environment-atlas-f4a22

  School system finances:美国校体系财政情景考查。

  链接:https://catalog.data.gov/bwin官网网址/annual-survey-of-school-system-finances

  Chronic disease data:美国处处缓性病目的数据。

  链接:https://catalog.data.gov/bwin官网网址/u-s-chronic-disease-indicators-cdi-e50c9

  The US National Center for Education Statistics:美国和世界处处教养育机构和教养育人统计数据。

  链接:https://nces.ed.gov/

  The UK Data Centre:英国最父亲的社会、经济和人数据收集儿子。

  链接:https://www.ukdataservice.ac.uk/

  Data USA:美国公共数据的片面却视募化。


文章作者:admin
本文地址:
版权所有 © 未注明“转载”的文章一律为原创,转载时必须以链接形式注明作者和原始出处!
如果你觉得文章不错,您可以推荐给你的朋友哦!

◇◇上一篇:乐当着(合肥小松鼠壁挂炉)各中心特价而沽后效力 下一篇:没有了 ◇◇