待尝试研究的可视化组件及产品:
- 开源组件
- 商业组件
开源组件
- zeppelin
- Caravel
- D3.js
- Flare
- talend(ETL)
- pentaho
- spagoBI
- NanoCubs
- Dygraphs
- Saiku
- airpal
- Chart.js
- chartist.js
- ECharts
- FnordMetric
- redash
- zingchart
zeppelin
- 主页:
- apache 开源产品
- 在编写 Flink,Spark,Hive 等相关作业时,要是能快速的将我们所编写的作业能可视化在我们面前的工具
- http://www.pointtec.de/zeppelin/
Caravel
- Caravel 是 Airbnb (知名在线房屋短租公司)开源的数据探查与可视化平台(曾用名Panoramix),该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析
- 快速创建数据可视化互动仪表盘
- 丰富的可视化图表模板,灵活可扩展
- 细粒度高可扩展性的安全访问模型,支持主要的认证供应商(数据库、OpenID、LDAP、OAuth 等)
- 简洁的语义层,可以控制数据资源在 UI 的展现方式
- 与 Druid 深度集成,可以快速解析大规模数据集
- https://github.com/airbnb/superset
- https://segmentfault.com/a/1190000005083953
D3.js
- 一个强调网页标准的用来创建数据可视化JavaScript库。使用HTML、SVG和CSS,可以让使用者以数据驱动的方式去操作DOM,能够满足现在浏览器的兼容性并且不受专用框架的限制。
- 示例地址:https://github.com/d3/d3/wiki/Gallery
Flare
- 处理复杂、交互式图表、支持数据管理、视觉编码、动画和交互作用,各种可视化表格从时间线到多层图表来说明关系
- 演示地址:http://flare.prefuse.org/demo
- 关注演示部分:
- layout -> intent
talend
- 网址:https://www.talend.com/download/talend-open-studio/
- 即提供免费版本,也提供收费版本
-
Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。
-
Talend Open Studio是 Talend 开发的ETL工具——Talend 是一家主营数据集成和数据管理解决方案的企业。Talend 采用用户友好型,综合性很强的IDE(类似于Pentaho Kettle 的 Spoon)来设计不同的流程。这些流程可以在IDE内部测试并编译成Java 代码。您可以随时查看并编辑生成的Java代码,同时实现强大的控制力和灵活性。 两者都非常优秀,都属于用户友好型的交叉平台(基于Java的)工具。它们的主要差异在于Kettle 将 ELT 流程编译为 XML 格式,然而Talend Open Studio 则生成 Java 代码
-
易用性:
- Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供
- Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。
- 技术支持:
- Talend:主要在美国
- Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲(中国,日本,韩国)都可以找到相关技术支持人员
- 部署:
- Talend:创建 java 或perl 文件,并通过操作系统调度工具来运行
- Kettle:可以使用 job 作业方式或操作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署
- 速度
- Talend:需要手工调整,对特定数据源有优化知识
- Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计
- 数据质量:
- Talend:在 GUI 里有数据质量特性,可以手工写 SQL 语句。
- Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。
pentaho
- 网址:http://www.pentaho.com/product/big-data-analytics
- pentaho自称为“全面的数据集成和商业智能平台”,该公司主要大力推销它的商业软件,该软件基于开源社区。
- Pentaho是一个以工作 流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案
- 功能和特点
◆ 工作流引擎:Shark and JaWE
◆ 数据库:Firebird RDBMS
◆ 集成管理和开发环境:Eclipse
◆ 报表工具:Eclipse BIRT
◆ ETL工具:Enhydra/Kettle
◆ OLAP Server:Mondrian
◆ OLAP展示:JPivot
◆ 数据挖掘组件:Weka
◆ 应用服务器和Portal服务器:JBoss
◆ 单点登陆服务及LDap认证:JOSSO
◆ 自定义脚本支持:Mozilla Rhino Javascript脚本处理器
spagoBI
- 相比Pentaho,spagoBI完全免费
- 包括用于报表、olap、图表、位置情报、数据挖掘、ETL和更多其它方面的工具,还实现与流行的内存处理引擎整合,能够实现实时处理
- 网址:http://www.spagobi.org/homepage/product/real-time/
- 参照学习笔记 :http://blog.csdn.net/zry3942522/article/category/1122641
NanoCubs
- 在日常电脑上可提供对亿级时空数据的快速展示和多级实时钻取探索分析
- 网址:http://nanocubes.net/
- 关注: http://nanocubes.net/view.html#flights (分时段热力图?)
Dygraphs
- Dygraphs是一个开源的JS库;用于生成可与用户交互的、可缩放的时间图表。主要用于显示密集的数据集合,用户能够很好的浏览和查看数据
- demo地址: http://dygraphs.com/
- 参考学习笔记:http://blog.csdn.net/yangqingqo/article/details/8456325
Saiku
- Saiku是一个模块化的开源分析套件,它提供轻量级的OLAP(联机分析处理),并且可嵌入、可扩展、可配置
- Saiku通过REST API连接OLAP系统,利用其友好的界面为用户提供直观的分析数据的方式,它是基于jQuery做的前端界面
- 网址:http://www.analytical-labs.com/
- 源码:https://github.com/OSBI/saiku
- 学习参考笔记:http://www.cnblogs.com/Jason-Xiang/category/747640.html
airpal
- Airpal 是一个基于 Web 的查询执行工具,利用 Facebook 的 PrestoDB 进行查询和获取结果。提供了查找表、元数据、浏览数据行,编写和执行查询的功能,这些功能全部通过浏览器完成。一旦查询开始执行,用户可跟踪查询进度获取并下载结果。查询的结果可生成新的 Hive 表用于进一步的分析
- 源码地址:https://github.com/airbnb/airpal
- 项目特性:
•可选的用户访问控制
•SQL语法高亮
•查询结果导出到CSV文件,或者存到Hive表中
•可查看SQL查询的历史记录
•可保存查询
•根据表名搜索对应的表
•可查看表结构,并预览前1000行数据
Chart.js
- chart.js 是一个简单、面向对象、为设计者和开发者准备的图表绘制工具库
- ChartJS 使用HTML5 Canvas元素的Javascript图形库,支持6种统计图形,不依赖其他库
- 网址:http://www.bootcss.com/p/chart.js/
chartist.js
- hartist.js 是简单的响应式图表,可以作为前端图表生成器
- 网址:http://gionkunz.github.io/chartist-js/
ECharts
- 百度企业场景图表
- http://echarts.baidu.com/
FnordMetric
- FnordMetric是一个使用SQL语句来实现数据收集和可视化的框架,它使用chartsql扩展了标准的sql,允许你编写查询语句来返回图表而不是返回表,查询结果作为SVG向量图或者images来呈现出来。这些图表可以很容易嵌入一个web站点中,这样你就可以在短短几分钟内绘制漂亮的图表
- 网址: http://fnordmetric.io/
- 参考:http://blog.csdn.net/itas109/article/details/52311390
redash
- re:dash 是一款开源的BI工具,提供了基于web的数据库查询和数据可视化功能
- 访问地址: https://redash.io/
zingchart
- https://www.zingchart.com/about-us/
- 网址:https://github.com/zingchart
- 参考:http://bbs.pinggu.org/thread-3666754-1-1.html
商业组件
- Ethink
- Tableau
- PowerBI
- FineReport
- Style Intelligence
- sisense
EThink
- 公司地址: http://www.ethinkbi.com/#
- 演示: http://www.ethinkbi.com/try/
- 说明:安徽象形信息科技有限公司(ETHINK)是国内大数据产品及方案服务商,专注于大数据,BI,大数据分析,大数据挖掘工具领域,是一家国内大数据分析产品领域的领导企业
- 关注点:
- 地图下钻(缺点:不能按比例缩放) http://120.26.36.169:8088/ethinknew/user?type=item2
- K线图:关注下面关联的时间轴
Tableau
- 公司地址:https://www.tableau.com/
- 相关评价:
- 混合数据源
- 高效快速
- Tableau9.0版本开始支持中国地图
- 产品分类:
- Tableau Desktop:收费,分个人版跟专业版,个人版只能连本地文件,专业版则无限制。Tableau制作端,创建可视化图表的软件
- Tableau Server:收费。可以发布做好的可视化图表,在浏览器或者移动设备上即可查看,共享、协作提高数据分析决策效率
- Tableau Online:收费,按年收取。基于云的服务,简单来讲就是云计算版server,企业不用自己部署Tableau server服务,通过Tableau自己的云端服务器,处理发布出去的可视化图表,同样能达到server的效果。不过由于服务器不在中国境内,运行效率可能会受到影响
- Tableau Public:免费。可在线分享自己的工作表、仪表板以及故事,与更多的人交流交互式数据故事
- Tableau Reader:免费。Tableau阅读器可打开并查看Desktop中生成的可视化图表,并且能进行可视化交互、筛选、钻取和查看明细
- 关注点:
- 图表丰富,操作简单
- 交叉表
PowerBI
- 微软产品
- https://powerbi.microsoft.com/en-us/blog/
- https://powerbi.microsoft.com/en-us/guided-learning/powerbi-learning-0-0b-building-blocks-power-bi
- https://powerbi.microsoft.com/en-us/documentation/powerbi-spark-on-hdinsight-with-direct-connect/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-personal-gateway
- https://powerbi.microsoft.com/en-us/documentation/powerbi-gateway-enterprise/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-gateway-enterprise-upgrade-as-connector/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-power-bi-pro-content-what-is-it/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-gateway-enterprise-manage-sql/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-gateway-enterprise-indepth/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-service-self-service-signup-for-power-bi/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-admin-data-management-gateway-in-office-365/
FineReport
- 演示地址: http://www.finereporthelp.com:8889/demo/ReportServer?op=fs
- 公司主页: http://www.finereport.com/product
- FineReport报表软件是一款纯Java编写的、集数据展示(报表)和数据录入(表单)功能于一身的企业级web报表工具
- 传统报表类工具,没啥新意
Style Intelligence
- Style Intelligence 是由美国英网软件技术公司自主研发意为全球企业级客户提供简单、敏捷、高效的商业智能软件
- 访问: https://www.passionned.com/business-intelligence/tools/style-intelligence/
sisense
- 支持组合多个数据源,可以让用户从丰富的数据可视化数据中发现及分享见解
- 网址:https://www.sisense.com
- 微软 Azure Marketplace : https://azuremarketplace.microsoft.com/en-us/marketplace/apps/sisense.sisense_byol