我对结构化和非结构数据的理解 - 走看看

zoukankan html css js c++ java

我对结构化和非结构数据的理解

如今网上对大数据有结构化和非结构化的争论，前者如XML。后者象网页上的文字、图片、音视频等内容。孰优孰劣。在这里我不想去评论它。
我想说的是，应该换一个角度来看待这个问题。就是说。不管这些数据不管它外在表象是什么，到了CPU、磁盘层面。它们都是一串数据流，或者称字节数组。
假设让这些数据可以被计算机处理和产生价值，它的前提是必须可以被CPU理解和计算。所以。在这个概念基础上。我在Laxcus体系设计里，对数据採用的是一种可格式化（formatable）的处理方案。
这个方法简单来说就是这样：数据进入磁盘和CPU前，它们首先做一个预处理，被拆解成CPU理解的。或者可以依照一种即定规则，可以被CPU理解的格式。如今Laxcus的全部数据，都是依照这种方案来採集、整理、处理数据。这样做的优点有两个：1.由于规则明白。体系设计相对就简单了；2.在CPU层面。数据的处理速度会非常快。
典型的象SQL.LIKE这样模糊检索，在数据库里都非常慢，可是在Laxcus分布环境下。这种数据处理也可以立即获得结果。

查看全文

相关阅读:
排序算法最强总结及其代码实现
 程序员面试常问的小算法总结
 Docker部署Scrapy-redis分布式爬虫框架（整合Selenium+Headless Chrome网页渲染）
使用亚马逊AWS云服务器进行深度学习——免环境配置/GPU支持/Keras/TensorFlow/OpenCV
阿里巴巴MySQL开源中间件Canal入门
 【秒杀系统】秒杀系统实战（四）| 缓存与数据库双写一致性实战
 【秒杀系统】秒杀系统实战（五）| 如何优雅的完成订单异步处理
 把购买数据添加到购物车
 实现自动登陆和记住用户名功能
 自定义登陆标签

原文地址：https://www.cnblogs.com/mthoutai/p/7027969.html

Copyright © 2011-2022 走看看