zoukankan      html  css  js  c++  java
  • 大数据学习——spark安装

    1 下载安装包

    2 上传并解压(不需要修改配置文件)

    tar -zxvf spark-1.6.2-bin-hadoop2.6.tgz
    mv spark-1.6.2-bin-hadoop2.6 spark

     

    3 启动

    进入spark/bin

    ./spark-shell

    计算单词出现次数

     sc.textFile("/root/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect

    按照单词出现次数降序排列

    sc.textFile("/root/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2,false).collect

    把计算结果保存

    sc.textFile("/root/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2,false).saveAsTextFile("/root/out")

  • 相关阅读:
    2、变量
    1、基本的数据类型
    jenkins入门
    我的Python基础笔记
    jmeter测试手机app
    Python:字典
    Python:元组
    Python:列表
    Python:函数
    H3C-L2TP
  • 原文地址:https://www.cnblogs.com/feifeicui/p/10485427.html
Copyright © 2011-2022 走看看