zoukankan
html css js c++ java
Hadoop综合大作业
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
启动hadoop:
上传到wc文件中
启动Hive
在hive数据库创建表 world:
导入文本test.txt并查看
用HQL进行词频统计
2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。
创建用于存放csv数据目录
把文件放入文件夹中
查看文件中的数据:
导入数据库表中
查看全文
相关阅读:
常用算法之选择排序
常用算法之插入排序
常用算法之冒泡排序
Python hashlib模块 (主要记录md5加密)
Django Model
CSS实现table td中文字的省略与显示
JS读取文件,Javascript之文件操作 (IE)
ie6789和其他浏览器之间的鼠标左、中、右键的event.button不一致的办法
兼容和样式
kindeditor的docs
原文地址:https://www.cnblogs.com/605-mk/p/9089040.html
最新文章
php代码中的细节问题
使用ThinkPHP的扩展功能
外部地址访问xampp
DIV+CSS特殊符号的处理方法
Failed for User NT AUTHORITY
'Install app for SharePoint': Sideloading of apps is not enabled on this site
升级到Sharepoint 2013后页面打开速度慢
sharepoint 2013 query slow
SQL 优化
sql trace script
热门文章
sharepoint 2007 assembly
sharepoint site performance
抓取DUMP日志
修改搜索索引位置
Android 四大护法之一 Service
关于防止App被第三方应用Kill掉的问题
Activity与Fragment
SQLite的原子提交原理
数据库事务处理机制之事务回滚问题讨论
Java 事件机制
Copyright © 2011-2022 走看看