zoukankan      html  css  js  c++  java
  • hadoop大作业

    Hadoop综合大作业 要求:

    1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。

        1、启动hadoop

        

      2、Hdfs上创建文件夹并查看

        

      3、上传英文词频统计文本至hdfs

        

      4、启动Hive

        

      5、导入文件内容到表docs并查看

        

      6、进行词频统计

        

      7、查看统计结果

        

    2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。

      

     

  • 相关阅读:
    Django进阶2
    Django进阶
    Django基础
    jQuery基本操作
    Dom编程
    JavaScript简介
    Python—sqlalchemy
    Python—RabbitMQ
    Python—redis
    Python—操作redis
  • 原文地址:https://www.cnblogs.com/xujinpei/p/9088565.html
Copyright © 2011-2022 走看看