大数据学习——spark安装

1 下载安装包

2 上传并解压（不需要修改配置文件）

tar -zxvf spark-1.6.2-bin-hadoop2.6.tgz
mv spark-1.6.2-bin-hadoop2.6 spark

3 启动

进入spark/bin

./spark-shell

计算单词出现次数

 sc.textFile("/root/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect

按照单词出现次数降序排列

sc.textFile("/root/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2,false).collect

把计算结果保存

sc.textFile("/root/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2,false).saveAsTextFile("/root/out")

查看全文

相关阅读:
NLP Best Practices
Bert模型精简方法
 delphi:对象的创建(create)与释放(free/destory)(转载)
delphi:Format格式化函数(转载)
delphi:destroy, free, freeAndNil, release用法和区别(转载)
delphi:function ParamStr(i:LongInt):string
jquery:上传文件
 bootstrapValidator中用ajax校验
 jquery中实时监控文本框的变化
 jquery判断checkbox是否选中