大数据的两种处理方式 - 走看看

zoukankan html css js c++ java

大数据的两种处理方式

       大数据的处理方式有两种：基于内存的流式处理和基于硬盘的存储处理。
       流式处理就好象是在经过的数据面前建一道水闸。数据流过这里，经过闸门的时候，就进行筛选过滤，分析出有价值的内容，然后丢弃，以后也不再使用。
       存储处理则是建一个储水池。数据先放进入储水池存起来，需要的时候，再进到储水池里，在里面筛选分析，找到那些有价值的内容。这个过程中，因为水还在储水池里，没放掉，所以可以供下次继续使用。
       存储模式的数据处理是可以重复的，用完再用，反复使用。但是因为硬盘本身的机械特性问题，导致它处理速度慢，速率不高。不过现在也还是有一些针对硬盘的优化措施。
       流式处理因为数据的处理过程在内存里进行，内存的处理性能是硬盘的数个量级，所以它的处理速率比存储模式高很多。但是也因为数据驻留在内存里，内存的特性是掉电即失的，只能一次性使用。所以流式处理通常是用完即弃，象卫生巾。
       大数据产品里，Spark是流式处理，Laxcus、Hadoop是存储处理。

查看全文

相关阅读:
Flash/Flex学习笔记(30)：不用startDrag和stopDrag的对象拖动
 Flash/Flex学习笔记(33)：如何用As3协同Flash CS IDE控制MovieClip实例
 Flash/Flex学习笔记(26)：AS3自定义右键菜单
 Flash/Flex学习笔记(32)：播放音乐并同步显示lyc歌词(适用于Silverlight)
Flash/Flex学习笔记(35)：如何正确监听Stage对象的事件
 jQuery autoComplete 自动完成支持中文
 黑马程序员视频学习下载地址记录一下
 汉语分词系统网址
 【转】Lucene.Net 详解
 MongoDB开发学习开天辟地，经典入门解决关系型数据库大数据量处理的瓶颈问题

原文地址：https://www.cnblogs.com/laxcus/p/5303526.html

Copyright © 2011-2022 走看看