内容简介
桑迪·里扎、于里·莱瑟森、肖恩·欧文、乔希 ·威尔斯著的《Spark 数据分析(第2版)/图灵程 序设计丛书》是使用Spark进行大规模数据分析的实 战宝典,由知名数据科学家撰写。本书在 版的基 础上,针对Spark近年来的发展,对样例代码和所使 用的资料进行了大量 新。新版Spark使用了全新的 核心API,MLlib和Spark SQL两个子项目也发生了较 大变化,本书为关注Spark发展趋势的读者提供了与 时俱进的资料,例如Dataset和DataFrame的使用,以 及与DataFrame API高度集成的Spark ML API。
本书适合从事数据分析的各类专业人员阅读。
相关截图
最新评论
命令: nload
真是个良心站点哇,大公无私,爱了爱了
还可以直接搞一张映射表,存 uid | time | source_index, 第一次直接查对应的 time 选出前100, 第二次直接用 CompleteFuture 去分别用 source_in
干得漂亮,多个朋友堵条路
2021.2.2版本的不适用吧
现在还可以用么
激活码有用,感谢分享
激活码的地址打不开了