zoukankan
html css js c++ java
Hadoop综合大作业
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
启动hadoop:
上传到wc文件中
启动Hive
在hive数据库创建表 world:
导入文本test.txt并查看
用HQL进行词频统计
2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。
创建用于存放csv数据目录
把文件放入文件夹中
查看文件中的数据:
导入数据库表中
查看全文
相关阅读:
算法导论:快速排序
lintcode:打劫房屋 III
lintcode:打劫房屋II
lintcode:打劫房屋
算法导论:二叉搜索树
算法导论:整齐打印
砝码称重问题二
多重背包问题II
多重背包问题
lintcode:背包问题II
原文地址:https://www.cnblogs.com/605-mk/p/9089040.html
最新文章
块级元素与行内元素
CSS选择器笔记
HTML标签
语义化标签的实战意义
谈CSS布局中HTML标签语义化
jQuery中contains和has的区别
background-position 用法详细介绍
jQuery:has()和jQuery:contains()及jQuery:empty
lintcode:整数排序||
lintcode:整数排序
热门文章
lintcode:玩具工厂
lintcode:形状工厂
lintcode:交换链表当中两个节点
lintcode:完美平方
lintcode: 左填充
lintcode:逆序对
lintcode:移动零
lintcode:两数组的交 II
lintcode:两个数组的交
算法导论:归并排序
Copyright © 2011-2022 走看看