学习一门语言或工具,首先得知道该工具的用途是什么。Pentaho 的官方定义是一个集数据集成和数据分析于一体的平台。这样的解释还是有点模糊。还是看其有哪些特点吧:
☐可以进行数据集成。谈到数据集成这个概念,说出来可能会被砸。百度出来的结果给我的感觉太架空。在csdn上看到一个答案,我觉得应该还比较靠谱。
数据集成是个统称,
可以通过ETL的方法收集数据。
也可以通过ESB的方式收集数据。
也可以搞个数据库,由各个系统往这个数据库里面插入数据。
在pentaho官网上谈到Data Integration会附上Access, manage and blend any data from any source。我的理解是可以访问,管理,融合从任何来源的数据。
☐可以直观的为用户提供数据分析的图表。
这两点足以体现pentaho在做数据集成以及数据分析方面的优势。
Pentaho CE安装:
- 从http://community.pentaho.com/上下载BA Platform
- 解压下载下来的biserver-ce包,在item上进入解压后的biserver-ce目录下,执行./start-pentaho.sh
- 访问http://localhost:8080/pentaho。