• 欢迎访问蜷缩的蜗牛博客 蜷缩的蜗牛
  • 微信搜索: 蜷缩的蜗牛 | 联系站长 kbsonlong@qq.com
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧

Caravel–一款开源OLAP+数据可视化分析前端工具,支持Druid和Kylin

大数据 lxw1234@qq.com 2年前 (2016-06-06) 172次浏览 已收录

关键词:caravel、olap、kylin、数据可视化

Caravel(曾用名 Panoramix),是由知名在线房屋短租公司 Airbnb 开源的一款数据探索与可视化工具,该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析。官网地址为: http://airbnb.io/caravel/

Caravel 介绍

Caravel 底层使用 Python 开发,与 SQLAlchemy 深度整合,目前原生支持的数据源有:

MySQL、Postgres、Presto、Oracle、sqlite、Redshift、MSSQL 以及 Druid。对于前面的关系型数据库,Caravel 通过将界面的操作转换成 SQL 语句,提交给 SQLAlchemy 适配数据源查询并返回结果,对于 Druid,Caravel 将界面的操作转换成 Druid 的 API 进行查询并返回结果,与 Druid 的深度集成,可以实现大规模海量数据的 OLAP 分析和实时探索。

另外,为了提高并发查询下的性能,还支持数据缓存,可配置将数据缓存至 Redis、Memcache 或者本地文件系统。

Caravel 支持十几种可视化图表,用于将查询返回的数据做可视化展示:

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

Caravel 安装并支持 Apache Kylin

 

如果你的数据源是上面介绍的几种,那么可以直接使用 Caravel。但我们数据平台中的 OLAP 引擎为 Apache Kylin,所以需要简单的修改和开发。

由于 Caravel 使用 SQLAlchemy 适配数据源并提交查询,因此我们的思路为,将 Kylin 作为一个数据库引擎注册进 SQLAlchemy,然后由 Caravel 自动适配并执行。而将 Kylin 查询注册到 SQLAlchemy,网上已经有人开源了代码:https://github.com/wxiang7/pykylin(感谢作者 Wu Xiang)。

接下来先安装 Caravel,http://airbnb.io/caravel/installation.html,再安装 pykylin,https://github.com/wxiang7/pykylin。

启动 Caravel Server: caravel runserver -d

使用浏览器打开:http://localhost:8088,使用 admin/admin 登陆。

Caravel 使用

创建数据源(Databases)

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

这里需要注意 Sqlalchemy Uri 的写法:

kylin://ADMIN:KYLIN@172.16.212.17:7070/kylin/api?project=lxw1234

Kylin 中的 project 名称,需要以 URL 参数的方式传递。

点击”TEST CONNECTION”,提示测试连接成功,并且在最下方,列出了 project 中所有的表。

 

如果使用 MySQL 数据库,配置如下:

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

添加表(Tables)

数据源创建好之后,就可以添加数据源中的表。

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

其中,Database 选择之前创建好的数据源,Table Name 必须是数据源中对应真实的表名。

需要注意的是,该表中必须有一个日期或时间类型的字段。

SAVE 之后,进入到 Table List 页面。

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

点击上面的 Edit record 按钮,可以编辑该表的字段及指标属性:

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

在 List Table Column 页面中,指定那些字段可以 GroupBy,那些可以过滤,那些可以 Count Distinct,那些可以 Sum、Min、Max,那些字段属于时间序列字段(Is Dttm)。

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

在 List Sql Metric 页面,可以编辑和定义指标,如果上面对一些字段勾选了 Sum、Min、Max、Count Distinct 选项,则这里会自动生成相应的指标字段。

数据探索分析与可视化展示

在针对一个 Table,定义好维度字段和指标之后,即可针对该表进行数据探索分析与可视化展示,在 List Table 页面,点击一个表名,即可进入:

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

如下图,在分析页面中,可以针对某一个表事先定义的时间字段、维度及指标字段进行数据探索分析,并可以选择相应的图表进行可视化展示。

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

另外,可以将一个定制好的数据探索保存成 Slice,多个 Slice 可以组成一个 Dashboard。

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

定制自己的 Dashboard

在添加 Dashboard 页面,指定包含哪些 Slice,定制自己的 Dashboard。

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin

其中,每个 Slice 对应的模块,可以自由拖拽位置和大小,并保存整个 Dashboard 的布局。

关于 Caravel for Kylin

我和我的朋友 Rocky,正在整理相关的修改,后面将放到 github 或者提交到 Caravel。

你可以先使用已支持的数据源来体验和使用 Caravel。

 

 

 

 

 

如果觉得本博客对您有帮助,请 赞助作者

转载请注明:lxw 的大数据田地 » Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin


蜷缩的蜗牛 , 版权所有丨如未注明 , 均为原创丨 转载请注明Caravel–一款开源 OLAP+数据可视化分析前端工具,支持 Druid 和 Kylin
喜欢 (0)
[]
分享 (0)