[关闭]
@spiritnotes 2016-02-26T15:56:15.000000Z 字数 395 阅读 1990

机器学习实践 -- 20newsgroups

机器学习实践


数据获取

sklearn数据库中含有该数据集,可以通过如下代码获取:

  1. groups_sk = datasets.fetch_20newsgroups()
  2. # dict_keys(['DESCR', 'data', 'description', 'target_names', 'target', 'filenames'])

其中:

  1. groups_sk.filenames
  2. array([ '/home/spirit/scikit_learn_data/20news_home/20news-bydate-train/rec.autos/102994',
  3. '/home/spirit/scikit_learn_data/20news_home/20news-bydate-train/comp.sys.mac.hardware/51861',
  4. dtype='<U93')

聚类

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注