zoukankan      html  css  js  c++  java
  • Hive 操作与应用 词频统计

    一、hive用本地文件进行词频统计

    1.准备本地txt文件

    2.启动hadoop,启动hive

    3.创建数据库,创建文本表

    4.映射本地文件的数据到文本表中

    5.hql语句进行词频统计交将结果保存到结果表中。

    6.查看统计结果

     

     

     

     

     

    二、hive用HDFS上的文件进行词频统计

    1.准备电子书或其它大的文本文件

    2.将文本文件上传到HDFS上

    3.创建文本表

    4.映射HDFS中的文件数据到文本表中

    5.hql语句进行词频统计交将结果保存到结果表中

    6.查看统计结果

     

     

     执行select  split(line,'') from docs;

     

  • 相关阅读:
    Grandpa's Estate
    The Fortified Forest
    Scrambled Polygon
    Wall
    激情的大三
    无聊的大二
    美好的大一
    高精度 加减乘
    Erasing Edges
    git放弃修改&放弃增加文件
  • 原文地址:https://www.cnblogs.com/shawncs/p/14084675.html
Copyright © 2011-2022 走看看