zoukankan
html css js c++ java
黑马大数据分析课程---1、大数据分析介绍
黑马大数据分析课程---1、大数据分析介绍
一、总结
一句话总结:
大数据为机器学习、人工智能等提供了数据依据
1、数据清洗包括哪些方面?
去掉脏数据
使数据格式化
2、数据挖掘是什么?
高级的数据分析方法:数据挖掘是一种高级的数据分析方法,侧重解决四类数据分析问题:分类、聚类、关联和预测
寻找有价值信息:数据分析和数据挖掘的本质是一样的,都是从数据里面发现关于业务的知识。
3、常用的分布式方案有哪些?
分布式应用和服务:【将应用和服务进行分层和切割】,然后分别部署:比如分布式服务框架 Dubbo
分布式静态资源:【静态资源】:比如CDN
分布式数据和存储:【单台计算机内存空间不足】:比如Apache Hadoop HDFFS
分布式计算:【计算】:比如Apache Hadoop MapReduce
4、分布式和集群的区别?
分布式:多台不同的服务器,【部署不同的服务模块】
集群:多台不同的服务器,【部署相同的应用或服务模块】
5、facebook是社交网站,那么评估机构评估facebook的时候,主要评估的是其哪方面的价值?
是其社交网络上的数据
6、云计算是什么?
硬件资源虚拟化
7、数据分析是什么?
发掘数据中的价值,发掘数据中的规律
8、如何采集用户浏览网站的数据?
js埋点:用js对用户的行为(比如点击啊,跳转啊)进行采集,不影响用户的正常操作,
存储的话可以用Nginx的自定义数据格式
9、采集到的用户的浏览数据,如何跨域发送到后台?
让数据伪装成图片:【比如京东就是这样干的】:/log.gif?a=111&b=222
返回数据的时候,伪装成一个1*1像素的gif图片
10、如何结合 Google Analytic 搭建一个自定义日志采集系统?
前端:确定要采集的数据,以及采集的页面,以及埋点的js
后端:收集、设计、编写数据
11、采集的用户的访问数据例子及注意事项有哪些?
比如用户ip,用户所在的位置,用户访问时间,用户的url等的
服务器参数获取:有些能够通过服务器直接获取到:比如用户的访问时间,ip等
js获取:有些不能通过服务器获取到:可以考虑js,cookie等等,就是想办法拿全用户的数据
二、内容在总结中
查看全文
相关阅读:
BlogEngine.Net架构与源代码分析系列part5:对象搜索——IPublishable与Search
SqlCacheDependency
Office SharePoint Server 2007
Castle Active Record for .NET2.0快速入门示例
PetShop的系统架构第三篇
中文分词核心配置
BlogEngine.Net架构与源代码分析系列part3:数据存储——基于Provider模式的实现
Cocos2d开发系列(二)
高负载、高并发网站架构知识汇总大流量网站架构的几点认识
使用Application变量
原文地址:https://www.cnblogs.com/Renyi-Fan/p/10965525.html
最新文章
读书札记:基于RBAC的权限设计模型分析
读书札记:基于RBAC的权限设计模型权限API和权限的实现
编程经验:高性能.NET WEB开发(3)控件缓存
编程经验:编程经验:高性能.NET WEB开发(2)EnableViewState
读书札记:基于RBAC的权限设计模型RBAC介绍
编程经验:关于如何在自己的网站或博客添加CNZZ站长统计功能
软件汉化:关于ZoomIt汉化的两个关键的问题
编程经验:Flash播放图片兼容火狐浏览器
读书札记:基于RBAC的权限设计模型 权限设计
考题整理搜狗笔试题
热门文章
如何检查浏览器版本以及支持性
[VS2008安装失败的解决办法]
【转】如何注册Vs2008[附带注册码]
【原】display:none 和visible:false 的区别
[原]关于页面超时和会话超时的一些理解
【转】WPF 带来的革命
Css中的度量单位 px em ex pt pc in mm cm
[转]Server.Htmlencode和Server.HtmlDecode的用法
【转】sqlserver中varchar和nvarchar的用法
“由于代码已经过优化或者本机框架位于调用堆栈之上,无法计算表达式的值”的解决方法
Copyright © 2011-2022 走看看