博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
强烈推荐三本 Spark 新书籍
阅读量:4251 次
发布时间:2019-05-26

本文共 872 字,大约阅读时间需要 2 分钟。

点击上方 "zhisheng"关注, 星标或置顶一起成长

 系列文章

前言

看到标题大家可能会想,zhisheng 之前不是一直写 Flink 相关的文章吗?咋开始推荐 Spark 书籍了,这里解释一下,因为本人前段时间接手了公司 Spark 引擎,所以偶尔也会抽空学习一下 Spark,这不看到几本不错的 Spark 书籍,于是想在这里与大家分享一下。

《Stream Processing with Apache Spark》

这本书出版时间是 2019 年 6 月,算是与 《Stream Processing with Apache Flink》是姊妹篇,主要是讲 Spark 的流处理,比如 Structured Streaming 和 Spark Streaming,对 Spark 流处理感兴趣的不可错过该书,虽然现在 Flink 是流处理的 No1,但是并不影响对比着学习他们之间的技术。

流处理章节目录

《Learning Spark, 2nd Edition》

这本书出版时间是 2020 年 7 月,全书我觉得对于整个 Spark 的体系讲的还是很全的,从概念的介绍,到 API / SQL 的使用,再到如何优化 Spark 作业,接着讲解了 Structured Streaming,然后还讲解了通过 Spark 构建数据湖,并且该章节中还对目前很热门的三大数据湖框架 Apache Hudi / Apache Iceberg / Delta Lake 进行了介绍。接着讲解了 Spark 在机器学习相关场景的水碱和应用,最后介绍了 Spark 3.0 的新特性,也是目前唯一不多介绍 Spark 3.0 版本的书籍之一。

本书的目录

《Spark in Action, 2nd Edition》

本书出版时间是 2020 年 5 月,出版社是 Manning,不同于上面两本书是出版于 O’Reilly。本书内容跟其标题其实还是比较相符的,主讲实战,目录如下。

扫描下面二维码,回复 Spark 可获取本文提及到的三本书

转载地址:http://arkei.baihongyu.com/

你可能感兴趣的文章
593. Valid Square
查看>>
494. Target Sum
查看>>
463. Island Perimeter
查看>>
TCP协议粗析
查看>>
653. Two Sum IV - Input is a BST
查看>>
spark rdd 和 DF 转换
查看>>
RDD 基础操作
查看>>
RDD基本操作(下)
查看>>
##########(python 解析参数方法 可用) Python optionParser模块的使用方法 #######
查看>>
org.apache.hadoop.io.compress系列1-认识解码器/编码器
查看>>
pyspark-combineByKey详解
查看>>
从原理到代码:大牛教你如何用 TensorFlow 亲手搭建一套图像识别模块 | AI 研习社
查看>>
FM算法详解
查看>>
FM算法能够学习到原始特征的embedding表示
查看>>
Factorization Machines 学习笔记
查看>>
Spark入门实战系列--9.Spark GraphX介绍及实例
查看>>
倾情大奉送--Spark入门实战系列
查看>>
Navicat使用技巧(附快捷键)
查看>>
大数据在营销和销售中的十大应用
查看>>
python 的日志logging模块学习
查看>>