Python开源 BI 工具 Superset 的搭建与初级使用

Python开源 BI 工具 Superset 的搭建与初级使用

Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard(看板),为数据分析提供了轻量级的数据查询与可视化方案。

06

目录:
  • 1.搭建流程

    • 1.1.构建虚拟环境

    • 1.2.激活虚拟环境

    • 1.3.安装superset

    • 1.4.初始化superset

    • 1.5.superset启动脚本

  • 2.使用流程

    • 2.1.数据源设置

    • 2.2.上传csv文件

    • 2.3.图表

    • 2.4.看板

官方网站:http://superset.apache.org/
Python开源 BI 工具 Superset 的搭建与初级使用
Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard(看板),为数据分析提供了轻量级的数据查询与可视化方案。
主要功能及特点
(为啥是英文的,因为我不知道怎么翻译的好,反正能看懂就行)
Python开源 BI 工具 Superset 的搭建与初级使用
主要功能
官方看板示例

Python开源 BI 工具 Superset 的搭建与初级使用

1.搭建流程

我的本机环境如下:
# 系统版本:Windows10家庭版
# Python:python 3.7.7
# Superset:0.36.0

1.1.构建虚拟环境

当然,不构建虚拟环境也是可以搭建的,这里构建虚拟环境可以相对保证咱们只需要用到Superset的依赖库,纯净。这里我们简单介绍2中构建虚拟环境的方式,其中一种是通过Anconada navigator直接创建,另外一种是在命令行通过命令创建,大家可以根据自己的实际情况进行选择尝试。
方式一 Anconada navigator
如果你是安装的Anconada,可以直接打开 Anconada navigator,通过以下示例图方式创建虚拟环境supersetTest (名字可以自定义)

Python开源 BI 工具 Superset 的搭建与初级使用

方式二 命令行
如果你安装的是Anconada,通过以下命令即可创建一个名为“supersetTest”的虚拟环境。
conda create -n supersetTest python=3.7.7

Python开源 BI 工具 Superset 的搭建与初级使用

如果是直接安装的python官方环境,可以先安装一个用于创建虚拟环境的第三方库virtualenv,然后再进行虚拟环境构建。
# 安装第三方库
pip install virtualenv
# 创建一个名为supersetTest且不拷贝系统的python第三方库的虚拟环境
virtualenv –no-site-packages supersetTest
# 激活该虚拟环境
supersetTestScriptsactivate.bat
# 退出该虚拟环境
supersetTestScriptsdeactivate.bat

1.2.激活虚拟环境

通过上述方式一,我们构建了虚拟环境 supersetTest,由于安装superset关联的第三方库较多,我们激活该虚拟环境后再进行superset的安装。
# 激活虚拟环境,后续在该环境下安装相关库
activate supersetTest

1.3.安装superset

在之前就行安装的时候,遇到很多问题,当然最后都解决了,所以这里直接以最终解决后总结的安装步骤进行介绍(注意:需要安装在上一步构建的虚拟环境中)。
第一步:升级setuptools和pip;
# Put all the chances on your side by getting the very latest pip and setuptools libraries.:
pip install –upgrade setuptools pip
第二步本地安装以下两个库;
python_geohash-0.8.5-cp37-cp37m-win_amd64.whl
sasl-0.2.1-cp37-cp37m-win_amd64.whl
https://www.lfd.uci.edu/~gohlke/pythonlibs进行以上两个轮子的下载(大家根据自己的环境进行版本选择),然后本地安装,安装过程中一定要注意 被安装文件路径写全。
pip install C:UsersGdcDownloadssasl-0.2.1-cp37-cp37m-win_amd64.whl
pip install C:UsersGdcDownloadspython_geohash-0.8.5-cp37-cp37m-win_amd64.whl
Python开源 BI 工具 Superset 的搭建与初级使用
第三步:安装superset。
完成第一步的安装后,再进行本步骤,一般是很可以很顺利完成安装的,否则可能会出现很多报错(基本都是依赖关系库版本匹配问题等)
pip install apache-superset==0.36.0

1.4.初始化superset

直接拷贝官网初始化流程如下:
# Initialize the database
superset db upgrade

# Create an admin user (you will be prompted to set a username, first and last name before setting a password)
 
nbsp;export FLASK_APP=superset
superset fab create-admin

# Load some data to play with
superset load_examples

# Create default roles and permissions
superset init

# To start a development web server on port 8088, use -p to bind to another port
superset run -p 8088 –with-threads –reload –debugger
不过,这些命令需要在superset安装路径下使用,比如我的是这样:
C:UsersGdcanaconda3envssupersetTestLibsite-packagessupersetbin
按照流程进行执行即可,每一步之前记得加上 python,部分步骤如:
python superset db upgrade【数据库初始化】
Python开源 BI 工具 Superset 的搭建与初级使用
初始化数据库
python superset fab create-admin【创建账号】
Python开源 BI 工具 Superset 的搭建与初级使用

 

创建账号
python superset run -p 8088 –with-threads –reload –debugger【启动superset】
Python开源 BI 工具 Superset 的搭建与初级使用

 

启动superset

1.5.superset启动脚本

为了快捷启动superset,我们可以编写简单的脚本bat文件
call cd C:UsersGdcanaconda3envssupersetTestLibsite-packagessupersetbin
call activate supersetTest
call python superset run -p 8088 –with-threads –reload –debugger

pause

2.使用流程

当我们启动superset之后,在按照提示在浏览器输入“http://127.0.0.1:8088/”即可进行访问,在右侧可以选择页面语言(我这里选择的是中文)。
Python开源 BI 工具 Superset 的搭建与初级使用

 

superset

2.1.数据源设置

数据源设置里我们可以设置数据库,superset支持很多数据库,具体大家在官网即可查阅。这里我使用的是mysql,因此可以在数据源中新增mysql数据源,参考如下:
mysql://root:password@localhost/databasename?charset=utf8
Python开源 BI 工具 Superset 的搭建与初级使用

 

添加数据库

2.2.上传csv文件

除了直接从数据库获取数据外,如果源数据是csv文件,也可以通过上传csv文件(其实是写入了你关联的数据库里)
Python开源 BI 工具 Superset 的搭建与初级使用

 

上传csv文件

2.3.图表

提供很多可视化图表,大家可以根据自己的需求进行数据字段的拖拽,然后创建需要的图表形式。
Python开源 BI 工具 Superset 的搭建与初级使用

 

图表

2.4.看板

多个图表可以组成看板,看板页面也可以自己拖拽图表创建你喜欢的看板形式。
Python开源 BI 工具 Superset 的搭建与初级使用

转自:https://mp.weixin.qq.com/s/3ognn2Q-RG5SCd1VD4MbBA

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注