[关闭]
@spiritnotes 2016-02-23T04:55:35.000000Z 字数 491 阅读 2061

《Spark高级数据分析》

Spark 读书笔记


Spark高级数据分析
补充材料:https://github.com/sryza/aas

第1章 大数据分析

1.1 数据科学面临的挑战

  1. 成功的分析中绝大部分工作是数据预处理;
  2. 迭代与数据科学紧密相关;
  3. 构建完表现卓越的模型不等于大功告成;

1.2 认识Apache Spark

Spark是一个开源框架,作为计算引擎,它把程序分发到集群中的许多机器,同时它提供了优雅的编程模型。

第2章 用Scala和Spark进行数据分析

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注