吾爱编程

标题: 基于企业案例实战深度剖析Spark内核Spark SQL\Streaming\GraphX\SparkR\机器学习 [打印本页]

作者: admin    时间: 2017-11-6 11:28
标题: 基于企业案例实战深度剖析Spark内核Spark SQL\Streaming\GraphX\SparkR\机器学习
适应人群:
Java开发经验或Scala开发经验,较好了解Hadoop,Hive等使用经验。课程对于Spark初学者,Spark开发人员及Spark运维人员都具有比较大的学习价值。
课程目标:
深入理解Spark的运行原理
学会搭建Spark,hadoop集群环境
完全掌握Spark编程基础,了解Spark运维的基础知识
完成大数据入门,可逐渐转岗大数据相关职位。
课程环境:
准备环境:CentOS,eclipse或IntelliJ IDEA, Scala,JDK,Maven,sbt,Hadoop,hive,建议三台虚拟机。

课程简介:

本课程将会结合精典案例讲解Spark Job的整个生命周期,以及如何划分Stage,如何生成逻辑执行计划和物理执行计划。从Hash Shuffle到Sort Shuffle再到Tungsten Sort Shuffle详细分析Spark Shuffle机制的原理与演进,同时结合Yarn分析Spark的内存模型以及如何进行相关调优,其中两节课主要介绍Spark Streaming使用方式,分析通用流式处理系统的关键问题以及Spark Streaming对相应问题的解决方案,如窗口,乱序,Checkpoint等,并分析Spark Streaming与Storm和Kafka Stream各自的优缺点和适用场景。

最后将结合源码分析Spark SQL的原理,以及实现SQL引擎的一般方法,介绍如何进行Spark SQL性能优化。并结合大量真实案例,分析如何解决数据倾斜问题从而提高应用性能。





作者: tangxingchen    时间: 2018-7-18 15:40
啥也不说了,楼主就是给力!支持吾爱编程网!
作者: gaochao    时间: 2018-9-1 20:16
啥也不说了,楼主就是给力!支持吾爱编程网!
作者: mas曹    时间: 2019-2-28 16:18
基于企业案例实战深度剖析Spark内核Spark SQL\Streaming\GraphX\SparkR\机器学习
作者: FunnyKing    时间: 2019-3-23 20:14
啥也不说了,楼主就是给力!支持吾爱编程网!




欢迎光临 吾爱编程 (http://www.52pg.net/) Powered by Discuz! X3.2