Hadoop综合大作业 - 走看看

zoukankan html css js c++ java

Hadoop综合大作业

1.用Hive对爬虫大作业产生的文本文件（或者英文词频统计下载的英文长篇小说）进行词频统计。

在网上下载英文小说，下载到本地home/hadoop/wc

首先要启动dfs：

2.在user/hadoop/上创建文件夹EnglishWord：

3.上传下载文档到user/hadoop/EnglishWord文件中：

4.在hive数据库创建表 world：

导入文本world.txt并查看

用HQL进行词频统计并保持到表 word_count:

2.用Hive对爬虫大作业产生的csv文件进行数据分析，写一篇博客描述你的分析过程和分析结果。

查看全文

相关阅读:
JZOJ 3034. 【NOIP2012模拟10.17】独立集
 JZOJ 3035. 【NOIP2012模拟10.17】铁轨
 JZOJ 1259. 牛棚安排
 数位DP JZOJ 3316. 非回文数字
 JZOJ 3046. 游戏
 JZOJ 3013. 填充棋盘
 debian 安装oracle提供的java8
java 汉字转拼音 PinYin4j
debian ssh设置root权限登陆 Permission denied, please try again
java并发下订单生成策略

原文地址：https://www.cnblogs.com/linbolinbo/p/9090504.html

Copyright © 2011-2022 走看看