zoukankan
html css js c++ java
Hadoop综合大作业
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
启动hadoop:
上传到wc文件中
启动Hive
在hive数据库创建表 world:
导入文本test.txt并查看
用HQL进行词频统计
2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。
创建用于存放csv数据目录
把文件放入文件夹中
查看文件中的数据:
导入数据库表中
查看全文
相关阅读:
2-2. 然后是几点(15)
2-1. 厘米换算英尺英寸(15)
2-0. 整数四则运算(10)
忙碌的下半学期
ACM 第十九天
ACM 第十八天
ACM 第十七天
凸包模板
极角排序常用方法
ACM 第十六天
原文地址:https://www.cnblogs.com/605-mk/p/9089040.html
最新文章
Python 基本语法(二)--- 条件循环语句
Ptyhon基本语法
Graphlab create安装
resultMap2_关联查询collection分步查询&延迟加载
resultMap_关联查询_collection 使用规则
resultMap3_关联查询_分步查询&延迟加载
resultMap3_关联查询_分步查询
resultMap2_关联查询2_association定义关联对象封装规
resultMap_关联查询1_级联属性
resultMap1_自定义结果映射规则
热门文章
04-2. 打印九九口诀表(15)
04-1. 水仙花数(20)
04-0. 求符合给定条件的整数集(15)
03-4. 成绩转换(15)
03-3. 12-24小时制(15)
03-2. 用天平找小球(10)
03-1. 三天打鱼两天晒网(15)
03-0. 超速判断(10)
2-4. BCD解密(10)
2-3. 逆序的三位数(10)
Copyright © 2011-2022 走看看