打印 上一主题 下一主题

[百度网盘]大数据平台架构与实践项目实战

[复制链接]
跳转到指定楼层
楼主
admin 发表于 2018-9-6 21:22:52
9316 10
教程内容:
此课程是大数据体系的完整总结:使用的技术有JAVAweb springmvc+ Hadoop+hive+flume+hbase+kafka+spark等所有大数据技术的总结,学完此课程对大数据案例操作完全没有问题。此项目背景基于类友盟的案例。
此案例场景来源于:
    【某盟+】全球领先的第三方全域数据服务商。通过全面覆盖PC、手机、传感器、无线路由器等多种设备数据,打造全域数据平台。秉承独立第三方的数据服务理念,坚持诚信、公正、客观的数据信仰,为客户提供全业务链数据应用解决方案,包括基础统计、运营分析、数据决策和数据业务等,帮助企业实现数据化运营和管理。
教程目录:
第1部分
01.业务模型说明
02.架构描述
03.术语解释-新增-活跃-用户等等
04.初始化weblog收集模块-公共模块-配置模块
05.初始化收集端模块-编程模拟上传json数据
06.通过firefox的poster插件测试web程序
07.创建client数据生成程序 不断发送数据给server
08.client上传log时,将client系统时间写入request的header中
09.编写工具类,使用内省实现属性复制
10.处理server收到的日志

第2部分
01.时间修正
02.属性复制
03.通过GeoLite提取ip地址的真实区域
04.工具类封装地理信息获取
05.startuplog对象的地址设置
06.地理信息进行缓存处理
07.将日志信息转换成json格式发送给kafka主题
08.准备kafka集群和zk集群并创建主题
09.启动kakfa集群-web程序-phone程序测试数据收集
10.分析flume收集kafka消息-分区手段
11.自定义***-添加logType和log创建时间的头信息
12.导出flumejar文件部署到flume lib下
13.配置flume
14.添加自定义***给配置文件
15.使用maven命令导出工件需要的所有第三方类库
16.联动测试-收集数据到hdfs
17.使用json serse作为hive表的串行化处理工具

第3部分
01.使用当前线程类加载解决公共模块的加载问题
02.修改flume配置文件原生类型-避免大量小文件
03.使用脚本创建仓库表
04.调度导入分区表数据分析
05.时间导入数据分析
06.使用sed编辑器处理时间问题
07.编写exec.sh文件和exportData.sql文件
08.使用hive命令测试导入hdfs数据到hive分区表
09.修改手机端数据生成时间戳
10.实现调度周期导入hdfs数据到hive分区表
11.centos安装tomcat
12.部署web程序到centos的tomcat下
13.分析统计用户和新增用户数
14.计算一天的起始和结束时间片
15.计算指定天所在的周和月的时间线
16.自定义UDF实现天起始和天结束时间提取
17.注册UDF函数-测试

第4部分
01.DateUtil通过偏移量定位时间-统一时间访问
02.注册函数-测试函数-选定库
03.查询日新增-周新增-月新增-用户总数
04.一次性统计一周内每天的新增用户
05.通过分区查询日活-月活-周活数
06.可视化web模块初始化
07.添加hive-jdbcclient驱动到可视化模块-测试
08.测试jdbc查询hive的自定义函数
10.关闭spring管理的事务-修改mybatis映射文件中大于
09.测试SSM连接查询hive数据库
11.查询指定的app今天新增用户数
13.连接web的ui程序-测试
12.嵌套子查询-查询一周内每天新增用户
14.通过链接访问新增用户-提交job给hive-执行查询
15.dubbo概述
16.可视化web项目拆分-统计服务提供者模块初始化
17.配置dubbo服务提供方-检查zk
18.配置dubbo消费者方集成-1

第5部分:
01.在hive使用using jar方式注册hdfs上的库函数
02.dubbo连接超时修改-消费者可视化程序测试
03.dubbo实现当前周内每天新增用户数
04.dubbo测试通过web可视化-provider
05.改造dubbo模块公共资源抽取
06.echart集成基础
07.echart使用ajax访问服务端数据-回传回调
08.echart集成json回传数据-配置web程序
09.echart集成json-pom中json配置调整
10.echart动态刷新图表-ajax访问controller方法
11.过去五周周活跃用户数-过去六月活跃用户数
12.沉默用户数
13.启动次数
14.版本分布
15.本周回流用户-1.版本分布
16.本周回流用户-2sql实现
17.连续n周活跃-忠诚用户-连续活跃用户
18.近期流失用户
19.留存用户
20.新鲜度分析


下载地址:
游客,如果您要查看本帖隐藏内容请回复


吾爱编程网 - 免责声明
1、吾爱编程网为非营利性网站,全站所有资料仅供网友个人学习使用,禁止商用
2、本站所有文档、视频、书籍等资料均由网友分享,本站只负责收集不承担任何技术及版权问题
3、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除下载链接并致以最深的歉意
4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
5、一经注册为本站会员,一律视为同意网站规定,本站管理员及版主有权禁止违规用户
6、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和吾爱编程网的同意
7、吾爱编程网管理员和版主有权不事先通知发贴者而删除本文




上一篇:2018年分布式爬虫实战第二期视频教程16课附代码讲义
下一篇:2018年Docker+k8s(Kubernetes)实战视频教程带源码
收藏
收藏1
支持
支持
反对
反对
回复

使用道具 举报

沙发
huxingxing 发表于 2018-9-6 23:22:47
哈哈哈哈或或或或或或或或或或
回复

使用道具 举报

板凳
failureone 发表于 2018-9-7 09:07:50
RE: 大数据平台架构与实践项目实战 [修改]
回复

使用道具 举报

地板
mjq 发表于 2018-9-7 12:07:31
不管你信不信,反正我是信了。支持吾爱编程网!
回复

使用道具 举报

5#
mjq 发表于 2018-9-7 12:10:38
不管你信不信,反正我是信了。支持吾爱编程网!
回复

使用道具 举报

6#
我爱编程007 发表于 2018-9-7 14:44:03
哥顶的不是帖子,是寂寞!支持吾爱编程网!
回复

使用道具 举报

7#
mas曹 发表于 2018-9-8 09:51:52
大数据平台架构与实践项目实战
回复

使用道具 举报

8#
今天在不在 发表于 2018-9-10 12:41:02
大数据平台架构与实践项目实战
回复

使用道具 举报

9#
nicky_hb 发表于 2019-3-8 21:10:52
哥顶的不是帖子,是寂寞!支持吾爱编程网!
回复

使用道具 举报

10#
zhx666 发表于 2019-5-1 00:16:59
不管你信不信,反正我是信了。支持吾爱编程网!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

返回顶部 返回列表

平台简介

吾爱编程网:http://www.52pg.net/是IT技能学习交流平台,我们提供了丰富的移动端开发、php开发、web前端开发、android开发、Java开发、Python开发、大数据开发、区块链开发、人工智能开发以及html5等大量的实战视频教程资源。(如果我们有侵犯了您权益的资源请联系我们删除)

点击这里给我发消息|Archiver|手机版|小黑屋|站点地图|吾爱编程  |网站地图

Powered by Discuz! X3.2??? 2017-2020 Comsenz Inc.??吾爱编程网