七月在线-数据挖掘班
课程大纲:
第1课 数据科学与数学基础
知识点1:数据挖掘基础,微积分、概率论、线性代数基础
实战项目:用numpy进行矩阵运算
第2课 数据处理/分析/可视化
知识点1:数据获取、数据格式、数据内容处理与分析、数据的可视化
实战项目:用python解析和清洗数据,pandas统计与分析数据,matplotlib和seaborn等做可视化
第3课 海量数据的分布式处理
知识点1:hadoop,Spark介绍,Map Reduce数据处理,hive与常见数据统计分析
实战项目:map reduce计数,文件关联与特征mapping,hiveql统计示例
第4课 关联规则挖掘
知识点1:数据关联分析,海量数据的关联分析方案,A-Priori与PCY算法
实战项目:小型商业服务中的在线认证企业资料挖掘,人群背景与身份关联挖掘
第5课 数据与聚类
知识点1:聚类与社区发现算法,深度剖析Kmeans等算法
实战项目:Spark MLlib下的K-Means算法与GraphX下的Label-Propagation算法实践
第6课 海量高维数据与近似最近邻
知识点1:海量数据检索问题,近似最近邻(ANN)常用算法:LSH、KD-Tree、Kmeans-Tree
实战项目:海量图像数据与最近图片检索
第7课 分类与排序
知识点1:有监督学习与分类,LR、SVM、深度神经网络与分类排序问题,样本高效训练
实战项目:kaggle分类问题、海量数据下电商的CTR预估问题
第8课 推荐系统
知识点1:基于内容的推荐算法,协同过滤,隐因子模型
实战项目:基于用户/商品的协同过滤推荐,隐因子模型电影推荐
第9课 海量高维数据与维度约减
知识点1:数据降维与SVD,CUR分解
实战项目:SVD与PCA在推荐系统与数据压缩应用
第10课 PageRank与图挖掘
知识点1:海量数据构成的图关联分析,PageRank与网页搜索
实战项目:PageRank在图关联数据上的应用与排序
下载地址:
**** Hidden Message *****
看帖看完了至少要顶一下,还可以加入到淘帖哦!支持吾爱编程网! 数据挖掘班 不管你信不信,反正我是信了。支持吾爱编程网! RE: 七月在线-数据挖掘班 七月在线-数据挖掘班 看帖看完了至少要顶一下,还可以加入到淘帖哦!支持吾爱编程网!
啥也不说了,楼主就是给力!支持吾爱编程网! 数据挖掘班 楼主,不论什么情况你一定要hold住!hold住就是胜利!支持吾爱编程网!
页:
[1]
2