Greenplum是一家总部位于
美国加利福尼亚州,为全球大型企业用户提供新型企业级数据仓库(EDW)、企业级数据云(EDC)和商务智能(BI)提供解决方案和咨询服务的公司,在全球已有:
纳斯达克,
纽约证券交易所,
Skype. FOX,
T-Mobile;
中国已有:
中信实业银行,
东方航空公司,
阿里巴巴,
华泰保险,
中国远洋(
Cosco),
李宁公司等大型企业用户选择
Greenplum的产品。
greenplum
[1]
MPP 系统!
Greenplum的架构采用了
MPP(大规模并行处理)。在 MPP 系统中,每个 SMP 节点也可以运行自己的
操作系统、数据库等。换言之,每个节点内的 CPU 不能访问另一个节点的内存。节点之间的信息交互是通过节点互联网络实现的,这个过程一般称为
数据重分配(
Data Redistribution) 。与传统的SMP架构明显不同,通常情况下,MPP系统因为要在不同处理单元之间传送信息,所以它的效率要比SMP要差一点,但是这也不是绝对的,因为 MPP系统不共享资源,因此对它而言,资源比SMP要多,当需要处理的事务达到一定规模时,MPP的效率要比SMP好。这就是看通信时间占用计算时间的比例而定,如果通信时间比较多,那MPP系统就不占优势了,相反,如果通信时间比较少,那MPP系统可以充分发挥资源的优势,达到高效率。当前使用的 OLTP程序中,用户访问一个中心数据库,如果采用SMP系统结构,它的效率要比采用MPP结构要快得多。而MPP系统在决策支持和数据挖掘方面显示了优势,可以这样说,如果操作相互之间没有什么关系,处理单元之间需要进行的通信比较少,那采用MPP系统就要好,相反就不合适了。
名字来源呢
Greenplum的大中华区
总裁Stanley Chen告诉我们:“
Greenplum这个名字是一个7岁小女孩无意中脱口而出的。”起初几个创始人在斟酌公司名字的时候都很没头绪,于是他们去问了朋友的孩子,一个年仅7岁的可爱小姑娘告诉他们叫“
Apple”,但是爸爸告诉他,这个名字已经被别人用了,还有其他的么?很快孩子变随口说了“
Greenplum”,于是“
Greenplum”公司的名字就这样诞生了。
编辑本段Greenplum在中国独立运营
Greenplum于
2008年12月进入
中国市场,经过一年多的开拓,
2010年1月1日Greenplum正式宣布在中国独立运营,并任命
Stanley Chew先生为
Greenplum大中华区
总裁职务,
Stanley Chew先生在IT行业从业25年以上,曾在Oracle公司工作16年担任亚太区副总裁。
Stanley Chew总裁将管理和运营
Greenplum在大中华区的业务,
Greenplum公司将为大中华区的企业级用户提供世界领先的数据仓库解决方案和服务。
Greenplum在中国迅速而高效的适应能力已经彰显了其卓越的实力,宣布在中国的独立运营展示了
Greenplum对中国市场的信心,也体现了
Greenplum描绘中国市场宏伟蓝图的决心,也预示着新一代超级数据引擎
Greenplum在中国市场的无限前景。
公司
专注于
OLAP系统数据引擎开发,有世界级的研发团队进行高性能计算和
数据库系统的前沿开发工作,
宗旨是向客户提供高性能的超级数据引擎,并将强大的并行计算能力融入到大规模数据仓库分析领域中。公司具有发展趋势超前的视野和洞察力,为全球很多最大规模的数据仓库提供推动力;公司最先将SQL和
Map Reduce的功能整合到统一的数据处理框架中。
Greenplum中国公司拥有一支具备丰富行业经验的销售和技术团队,具备金融、电信、政府、互联网等等行业的数据仓库项目行业经验,专注于推动
Greenplum在数据仓库分析领域的应用,为客户实现投资回报、价值增长。
编辑本段Greenplum软件的性能优势
支持海量数据存储和处理
当今是个数据不断膨胀的时代,数据量从过去的MB->GB->TB增长到现在的PB级数据规模,传统的OLTP数据库在TB级别以上数据管理中已经是捉襟见肘,采取MPP架构的数据库系统才能对海量数据进行管理。
Greenplum支持50PB(1PB=1000TB)级海量数据的存储和处理,
Greenplum将来自不同源系统的、不同部门、不同平台的数据集成到数据库中集中存放,并且存放详尽历史的数据轨迹,业务用户不用再面对一个又一个信息孤岛,也不再困惑于不同版本数据导致的偏差,同时对于IT人员也降低管理维护工作的复杂度。
高并发支持
随着商业智能在企业内的快速发展,BI 用户对信息分析平台的访问频率和查询复杂度也快速提升,因此要求相应的数据库系统对高并发查询进行支持。
Greenplum利用强大并行处理能力提供并发支持。
Greenplum提供资源管理功能
(workload managemnt)来管理
数据库资源,利用资源队列管理可实现按用户组的进行资源分配,如
Session同时激活数、最大资源值等。通过资源管理功能,可以按用户级别进行资源分配和管理用户SQL查询优先级别,同时也能防止低质量SQL(如没有条件的多表join等)对
系统资源的消耗。
支持线性扩展
Greenplum采用MPP并行处理架构,在MPP架构中增加节点就可以线性提高系统的存储容量和处理能力。
Greenplum在扩展节点时操作简单,在很短时间内就能完成数据的重新分布。
Greenplum线性扩展支持为数据分析系统将来的拓展给予了技术上的保障,用户可根据实施需要进行容量和性能的扩展。
高性价比
Greenplum数据库软件系统节点基于业界各种开放式硬件平台,如SUN/HP/DELL等厂商的PC Server等,在普通的x86 Server上就能达到很高的性能,因此性价比很高,相比于其他封闭式数据仓库专用系统,
Greenplum每TB的投资是前者的1/5甚至更低。同样,
Greenplum产品的维护成本相比同类厂商也低许多。
支持Just In Time BI
我们面对的是一个瞬息变化的市场,谁能首先感知到市场的需求和变化,就能在竞争中先行一步,获得主动权,在竞争中
立于不败之地。
Greenplum通过准实时、实时的数据加载方式,实现数据仓库的实时更新,进而实现动态数据仓库(ADW)。基于动态数据仓库,业务用户能对当前业务数据进行BI实时分析-“Just In Time BI”,能够让企业敏锐感知市场的变化,加快决策支持反应速度。
高可用性支持
Greenplum是高可用的系统,在已有案例中最多使用了96台机器的集群MPP环境。除了硬件级的Raid技术外,
Greenplum还提供数据库层
Mirror机制保护,即每个节点数据在另外的节点中同步
镜像,单个节点的错误不影响整个系统的使用。
对于主节点,
Greenplum提供
Master/Stand by机制进行主节点容错,当主节点发生错误时,可以切换到Stand by节点继续服务。
系统易用性
Greenplum产品是基于流行的
PosgreSQL之上开发,几乎所有的
PostgreSQL客户端工具及
PostgreSQL应用都能运行在
Greenplum平台上,在
Internet上有着丰富的PostgreSQL资源供用户参考。
最新进展
Greenplum 被EMC公司收购,将其整合到EMC 云计算战略中。