吾爱编程
标题:
《Spark 1.X 大数据平台V2》
[打印本页]
作者:
admin
时间:
2018-6-13 18:19
标题:
《Spark 1.X 大数据平台V2》
1639197126ea283628.jpg
(27.08 KB, 下载次数: 371)
下载附件
2018-6-13 18:18 上传
第一周 Spark生态系统概述与编程模型
• Spark生态系统概述
• 回顾Hadoop MapReduce
• Spark运行模式
• RDD
• Spark运行时模型简介
• 缓存策略介绍
• transformation
• action
• lineage
• 容错处理
• 宽依赖与窄依赖
• 集群配置
第二周 深入Spark内核
• Spark术语解释
• 集群概览
• 核心组件
• 数据本地性
• 常用RDD
• 任务调度
• DAGScheduler
• TaskScheduler
• Task细节
• 广播变量
• 累加器
• 性能调优
第三周 Spark on Yarn & Spark as a service
• Spark on Yarn原理
• Spark on Yarn实践
• JobServer架构
• JobServer API介绍
• JobServer配置与部署
第四周 Spark Streaming原理与实践
• DStream
• 数据源
• 无状态transformation与有状态transformation
• checkpoint
• 容错
• 性能优化
第五周 Shark与Spark SQL
• Shark数据模型
• Shark数据类型
• Shark架构
• Shark部署
• 缓存(分区)表
• SharkServer
• Shark与Spark结合
• Spark SQL架构
• Parquet支持
• DSL
• SQL on RDD
• Hive支持
• UDF
• JDBC Server
第六周 Machine Learning on Spark
• LinearRegression
• K-Means
• Collaborative Filtering
第七周 Spark多语言编程
• Python简介
• PySpark API
• 使用Python编写Spark程序
• Spark with Java
第八周 图计算GraphX
• 现存的图计算框架
• Table Operators
• Graph Operators
• GraphX设计
第九周 Tachyon原理与实践
• Tachyon原理与架构
• Tachyon实践
第十周 SparkR
• SparkR原理介绍
• 安装配置与运行
下载地址:
作者:
chenl8820
时间:
2018-6-13 18:31
哥顶的不是帖子,是寂寞!
作者:
yodang2008
时间:
2018-6-13 22:05
看了LZ的帖子,我只想说一句很好很强大!
作者:
gaochao
时间:
2018-7-25 13:20
看帖看完了至少要顶一下,还可以加入到淘帖哦!支持吾爱编程网!
欢迎光临 吾爱编程 (http://www.52pg.net/)
Powered by Discuz! X3.2