经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » JS/JS库/框架 » Echarts » 查看文章
Python?数据可视化神器Pyecharts绘制图像练习
来源:jb51  时间:2022/2/28 13:24:18  对本文有异议

前言:

Echarts 是百度开源的一款数据可视化 JS 工具,数据可视化类型十分丰富,但是得通过导入 js 库在 Java Web 项目上运行。

作为工作中常用 Python 的选手,不能不知道这款数据可视化插件的强大。那么,能否在 Python 中也能用到 Echarts 的功能呢?寻找中惊喜地发现了 pyecharts,只需在python中安装该模块即可使用。

安装:

常用的pip安装包一键安装pyecharts

 pyecharts安装命令:

  1. ython -m pip install pyecharts
  2.  

Python + pyecharts具体应用

结合工作中的项目数据,我选择了 test 项目需求中 hotel_code_new 为 CNSZVS_002,CWSWS_003 对应2019年12个月指标为 RNs 的数据做可视化展示与分析。

1.Hive数据库查询sql

hive_sql内容如下:

  1. # sql中所使用的部分语法为hive sql中常规的语法,与mysql有所不同,请注意。
  2. select rrrd1.hotel_code_new as hotel_code_new
  3. ? ? ? ,dda.natural_date as natural_date
  4. ? ? ? ,nvl(rrrd.room_nights, 0) as room_nights
  5. ?from ( select distinct substr(natural_dt,1,7) as natural_date?
  6. ? ? from dws.dws_test_date_calendar
  7. ? ? where dt_year='2019'
  8. ? ? ? ? )dda
  9. ? ? ? ? left join?
  10. ? ? ? ? ?(select 'CNSZVS_002' hotel_code_new
  11. ? ? ? ? ? ? UNION all select ?'CWSWS_003' hotel_code_new
  12. ? ? ? )rrrd1
  13. ? ? ? ? left join
  14. ? ? ? ? ?(select ?hotel_code_new
  15. ? ? ? ? ? ? ? ? ? ? ,substr(stay_date,1,7) as stay_date
  16. ? ? ? ? ? ? ? ? ? ? ,sum(number_of_room_nights) as room_nights
  17. ? ? ? ? ? ? ? ? from dwm.dwm_test_resvs_rom_daily_df
  18. ? ? ? ? ? ? ? ? where dt='2021-10-24'
  19. ? ? ? ? ? ? ? ? and hotel_code_new in(CNSZVS_002', 'CWSWS_003')
  20. ? ? ? ? ? ? ? ? ? ? and resv_status in('CHECKEDSSSIN','CHECKEDSSSOUT')
  21. ? ? ? ? ? ? ? ? ? ? and substr(stay_date,0,4) = '2019'?
  22. ? ? ? ? ? ? ? ? ? ? group by hotel_code_new,substr(stay_date,1,7)
  23. ? ? ? ? )rrrd?
  24. ? ? ? ? on dda.natural_date = rrrd.stay_date?
  25. ? ? ? ? and rrrd1.hotel_code_new=rrrd.hotel_code_new
  26. ? ? ? ? order by rrrd.hotel_code_new;

2.Python代码实现—柱状图

  1. from impala.dbapi import connect
  2. import warnings
  3.  
  4. #数据仓库数据获取准备
  5. def hive_connect(sql):
  6. ? ? warnings.filterwarnings('ignore')
  7. ? ? config_hive_beta = {
  8. ? ? ? ? 'host': '10.7.0.12', ?#hivehost地址
  9. ? ? ? ? 'port': 10000, ? ?#hive的端口号
  10. ? ? ? ? 'user': 'hive', ? ?#hiveusername
  11. ? ? ? ? 'password': 'hive', ? ?#hivepassword
  12. ? ? ? ? 'database': 'tmp', ? ? #hive中需要查询的数据库名
  13. ? ? ? ? 'auth_mechanism': 'PLAIN' #hive的hive-site.xml配置文件中获取
  14. ? ? }
  15. ? ? conn = connect(**config_hive_beta)
  16. ? ? cursor = conn.cursor()
  17. ? ? cursor.execute(sql)
  18. ? ? hive_all_data = cursor.fetchall()
  19. ? ? return hive_all_data
  20.  
  21.  
  22. # all_data = hive_connect(hive_sql)
  23. # 通过调用hive_connect方法获取到的数据库查询结果数据如all_data列表所示
  24. all_data = [('CNSZVS_002', '2019-01', 0), ('CNSZVS_002', '2019-02', 0), ('CNSZVS_002', '2019-03', 0),
  25. ? ? ? ? ? ? ('CNSZVS_002', '2019-04', 0), ('CNSZVS_002', '2019-05', 0), ('CNSZVS_002', '2019-06', 2353),
  26. ? ? ? ? ? ? ('CNSZVS_002', '2019-07', 2939), ('CNSZVS_002', '2019-08', 5148), ('CNSZVS_002', '2019-09', 3850),
  27. ? ? ? ? ? ? ('CNSZVS_002', '2019-10', 4973), ('CNSZVS_002', '2019-11', 5467), ('CNSZVS_002', '2019-12', 4742),
  28. ? ? ? ? ? ? ('CWSWS_003', '2019-01', 5914), ('CWSWS_003', '2019-02', 4434), ('CWSWS_003', '2019-03', 6003),
  29. ? ? ? ? ? ? ('CWSWS_003', '2019-04', 6611), ('CWSWS_003', '2019-05', 6586), ('CWSWS_003', '2019-06', 5840),
  30. ? ? ? ? ? ? ('CWSWS_003', '2019-07', 6624), ('CWSWS_003', '2019-08', 7001), ('CWSWS_003', '2019-09', 5792),
  31. ? ? ? ? ? ? ('CWSWS_003', '2019-10', 6898), ('CWSWS_003', '2019-11', 6944), ('CWSWS_003', '2019-12', 5404)]
  32.  
  33. # 从pyecharts模块导入柱状图-Bar
  34. from pyecharts import Bar
  35. # 设置横轴行名,这里使用12个月份的英文简称
  36. columns = ["Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul", "Aug", "Sep", "Oct", "Nov", "Dec"]
  37. # 分别新建2个空list用于存储每个月份对应的RNs的值
  38. CNSZVS_002 = []
  39. CWSWS_003 = []
  40.  
  41. for i in all_data:
  42. ? ? if i[0] == 'CNSZVS_002':
  43. ? ? ? ? CNSZVS_002.append(i[2])
  44. ? ? elif i[0] == 'CWSWS_003':
  45. ? ? ? ? CWSWS_003.append(i[2])
  46. ? ? else:
  47. ? ? ? ? pass
  48. # 设置柱状图的主标题与副标题
  49. bar = Bar("柱状图", "Test需求—2019年的RNs")
  50. # 添加柱状图的数据及配置项-求平均值、最大值、最小值
  51. bar.add("CNSZVS_002", columns, CNSZVS_002, mark_line=["average"], mark_point=["max", "min"])
  52. bar.add("CWSWS_003", columns, CWSWS_003, mark_line=["average"], mark_point=["max", "min"])
  53. # 在本py文件同级目录下生成名为render.html的本地文件(默认为.html文件)
  54. bar.render()
  55. # 也可设置成指定的路径用于保存html文件
  56. #bar.render(r"D:bar_render.html")

柱状效果图展示:

生成的柱状效果图是html格式的,可以在浏览器中打开查看,在浏览器中支持下载成图片格式到本地,并且点击图例即可置灰对应的图例,同时隐藏图例对应的柱状图数据,

如下图所示:

3.Python代码实现—饼状图

注意:数据准备部分的代码与柱状图一样,这里只展示饼状图特有的代码

  1. # 从pyecharts模块中导入饼图Pie
  2. from pyecharts import Pie
  3. # 设置主标题与副标题,标题设置居中,设置宽度为1000
  4. pie = Pie("饼状图", "Test需求—2019年的RNs", title_pos='left', width=1000)
  5. # 使用add导入数据,设置坐标位置为【20,50】,上方的colums选项取消显示
  6. pie.add("CNSZVS_002", columns, CNSZVS_002, center=[20, 50], is_legend_show=True)
  7. # 使用add导入数据,设置坐标位置为【75,50】,上方的colums选项正常显示
  8. pie.add("CWSWS_003", columns, CWSWS_003, center=[75, 50], is_legend_show=False, is_label_show=True)
  9. # 保存图表
  10. pie.render()

饼状效果图展示——隐藏所占百分比

饼状效果图展示——展示所占百分比

4.Python代码实现—箱型图

  1. # 从pyecharts模块导入箱型图Boxplot
  2. from pyecharts import Boxplot
  3. boxplot = Boxplot("箱型图", "Test需求—2019年的RNs")
  4. x_axis = ['CNSZVS_002', 'CWSWS_003']
  5. y_axis = [CNSZVS_002, CWSWS_003]
  6. # prepare_data方法可以将数据转为嵌套的 [min, Q1, median (or Q2), Q3, max]
  7. yaxis = boxplot.prepare_data(y_axis)
  8. boxplot.add("2019年RNs统计", x_axis, yaxis)
  9. boxplot.render()

箱型图效果展示:

5.Python代码实现—折线图

  1. from pyecharts import Line
  2. line = Line("折线图", "Test需求—2019年的RNs")
  3. # is_label_show属性是设置上方数据是否显示
  4. line.add("CNSZVS_002", columns, CNSZVS_002, is_label_show=True)
  5. line.add("CWSWS_003", columns, CWSWS_003, is_label_show=True)
  6. line.render()

折线图效果展示:

6.Python代码实现—雷达图

  1. from pyecharts import Radar
  2. radar = Radar("雷达图", "Test需求—2019年的RNs")
  3. # 由于雷达图传入的数据得为多维数据,需要将list再进行list转换一次
  4. CNSZVS_002 = [CNSZVS_002]
  5. CWSWS_003 = [CWSWS_003]
  6. # 设置column的最大值,为了雷达图更为直观,这里的月份最大值设置依据真实数据的值来设置,因此各个月份有所不同
  7. schema_diff = [
  8. ? ? ("Jan", 7000), ("Feb", 5000), ("Mar", 6500),
  9. ? ? ("Apr", 7000), ("May", 7000), ("Jun", 6200),
  10. ? ? ("Jul", 6800), ("Aug", 7200), ("Sep", 6000),
  11. ? ? ("Oct", 7300), ("Nov", 7500), ("Dec", 6000)
  12. ]
  13. # 传入坐标
  14. radar.config(schema_diff)
  15. radar.add("CNSZVS_002", CNSZVS_002)
  16. # 一般默认为同一种颜色,这里为了便于区分,需要设置item的颜色
  17. radar.add("CWSWS_003", CWSWS_003, item_color="#1C86EE")
  18. radar.render()

雷达效果图展示:

7.Python代码实现—散点图

  1. from pyecharts import Scatter
  2. scatter = Scatter("散点图", "Test需求—2019年的RNs")
  3. # xais_name是设置横坐标名称,这里由于显示问题,还需要将y轴名称与y轴的距离进行设置
  4. scatter.add("CWSWS_003&CNSZVS_002 RNs的散点分布", CNSZVS_002, CWSWS_003, xaxis_name="CNSZVS_002", yaxis_name="CWSWS_003", yaxis_name_gap=40)
  5. scatter.render()

散点图效果展示:

总结:

  • 准备符合要求的数据及其格式
  • 导入对应图表所使用的包
  • add()方法:主要方法,用于添加图表的数据和设置各种配置项
  • render()方法:用于保存生成的图表

 到此这篇关于Python 数据可视化神器Pyecharts绘制图像练习的文章就介绍到这了,更多相关Python 数据可视化神器Pyecharts内容请搜索w3xue以前的文章或继续浏览下面的相关文章希望大家以后多多支持w3xue!

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号