zoukankan
html css js c++ java
Hadoop综合大作业
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
启动hadoop:
上传到wc文件中
启动Hive
在hive数据库创建表 world:
导入文本test.txt并查看
用HQL进行词频统计
2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。
创建用于存放csv数据目录
把文件放入文件夹中
查看文件中的数据:
导入数据库表中
查看全文
相关阅读:
python基础之流程控制
多线程---阻塞队列
多线程---线程同步
多线程---线程实现
多线程start();之后会开辟新的栈空间
java中使用String的split分隔字符串注意事项
IO流
java中的多态
关于java中的接口
关于final关键字
原文地址:https://www.cnblogs.com/605-mk/p/9089040.html
最新文章
canvas 压缩图片上传
Turbo编码
ila核数据输出
频偏与相偏
群时延
升余弦滤波器原理
FPGA数据舍入方式
量化与归一化的妙用
Vivado与Modelsim联合仿真
Verilog从文件读数据
热门文章
差分时钟仿真测试模块
函数之装饰器
函数之闭包
函数之高阶函数
迭代器与生成器
函数的名称空间
函数的参数
入门函数
python基础之文件操作
python基础之运算符
Copyright © 2011-2022 走看看