Spark 实现wordcount - 走看看

zoukankan html css js c++ java

Spark 实现wordcount
　　配置完spark之后，使用spark实现wordcount，这一部分完全参考《深入理解Spark：核心思想与源码分析》

　　依然使用hadoop wordcountTest的那几个txt文件

　　

　　进入spark的bin目录，打开spark-shell
　　spark-shell
　　在打开的scala命令行中依次输入以下几个语句：
val lines = sc.textFile("/home/hadoop/scala-2.11.5/wordcountText/*.txt", 2) val words = lines.flatMap(line => line.split(" ")) val ones = words.map(w => (w,1)) val counts = ones.reduceByKey(_+_) counts.foreach(println)
　　部分wordcount输出结果，可以发现，spark默认的单词计数是乱序的：

　　
查看全文

相关阅读:
python基础7
python基础7
十大经典预测算法（一）----线性回归
 RNN-循环神经网络
 CNN之经典卷积网络框架原理
 卷积神经网络CNN
决策树的生成
 欠拟合、过拟合及解决方法
 决策树
 KD树

原文地址：https://www.cnblogs.com/qj4d/p/7111793.html

Copyright © 2011-2022 走看看