zoukankan      html  css  js  c++  java
  • 非结构化数据存储方案

    ceph

    官方网站:http://docs.ceph.org.cn/

    简单介绍:

    Ceph是一个开源的分布存储系统,同时提供对象存储、块存储和文件存储。linux内核2.6.34将ceph加入到内核中,红帽基于ceph出了redhat ceph storage.

    支持TB级存储

    支持高可用、容灾备份(当然了,这是存储的常见功能)

    支持上百节点的负载均衡

    系统架构:

    OpenStack Swift

    官方网站:https://docs.openstack.org/swift/latest/

    简单介绍:

    OpenStack的存储项目,提供了弹性可伸缩、高可用的分布式对象存储服务,适合存储大规模非结构化数据。作为一个开源的云平台,本身的存储系统制约着平台的发展,所以swift在可靠性、性能上更加优秀。

    系统架构:

    Swift 采用完全对称、面向资源的分布式系统架构设计,所有组件都可扩展,避免因单点失效而扩散并影响整个系统运转;通信方式采用非阻塞式 I/O 模式,提高了系统吞吐和响应能力。

    HDFS

    官方网站:https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html

    简单介绍:

    HDFS全称是Hadoop distributed file system,是一个用java语言开发的分布式文件系统,有很好的伸缩性,支持10亿+的文件,上百PB数据,上千节点的集群。HDFS设计目标是==支持海量数据的批量计算==,而不是直接与用户做交互式操作。

    HDFS有很多特点:

    保存多个副本,且提供容错机制,副本丢失或宕机自动恢复。默认存3份。

    运行在廉价的机器上。

    适合大数据的处理。多大?多小?HDFS默认会将文件分割成block,64M为1个block。然后将block按键值对存储在HDFS上,并将键值对的映射存到内存中。如果小文件太多,那内存的负担会很重。

    GlusterFS

    官方网站:https://www.gluster.org/

    简单介绍:

    GlusterFS是一个开源的分布式文件系统,可支持PB级数据量和几千个客户端,没有元数据服务器。红帽2011年花1.36亿$购买了GlusterFS,基于GlusterFS发布了一个商业存储系统。

    外部架构:

    内部架构:

     
  • 相关阅读:
    基于任意深度学习+树状全库搜索的新一代推荐系统
    千人千面、个性化推荐,解读数据赋能商家背后的AI技术
    Graphics2D画图时背景颜色设置
    高校大数据实习实训平台需求
    B2B行业的支付的那些事。
    生成excel xls
    简单文件上传
    计时3秒后自动跳转到登录页
    jquery $换JQ
    用于二维数组排序
  • 原文地址:https://www.cnblogs.com/DarrenChan/p/9494755.html
Copyright © 2011-2022 走看看