最近从hadoop转向Spark了,学了一段时间了,准备写个专题,主要写pySpark的应用,主要计划是:
主题 |
内容概要 |
聚类(5.6) |
1.几种常用的聚类算法;2.pyspark中聚类算法的应用(2-3个实例) |
分类&回归 |
1.几种常用的分类和回归算法;2.pyspark中分类和回归算法的应用(各一例) |
推荐 |
1.推荐常用算法;2.实例:音乐推荐和电商推荐 |
文本挖掘 |
1.潜在语义分析;2.垃圾文本过滤;3.文本分类 |
征信评估 |
1.金融风险评估 |
深度学习 |
1.常用的深度学习模型2.实例:神经网络,图像分析 |
计划每个月写一篇。月底写第一篇,加油!~