经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » Python » 查看文章
Python制作个性化的词云图实例讲解
来源:jb51  时间:2022/2/14 8:35:13  对本文有异议

1. 引言

词云图可以让我们方便地识别出文本中的关键词,其中单词的大小代表它们的频率。有了这个,我们甚至在阅读之前就可以很好地了解文本的内容。虽然有很多免费的工具可以在线制作文字云,但我们可以使用万能的Python来定制个性化的词云图。

在本文中,我们将使用第三方Python库stylecloud,有了该库,可以通过简短的几行代码来制作漂亮的词云图。如下所示:

在这里插入图片描述

闲话少说,我们直接开始吧。 :)

2. 举个栗子

接下来,我们将用来制作词云图的文本是偶像乔布斯在斯坦福大学演讲的一部分。点击这里可以获得对应的 .txt 文件或使用任何其他的文本来制作你自己的词云图。

2.1 安装stylecloud库

这里我们可以直接使用pip来安装该词云库,代码如下:

  1. pip3 install stylecloud

2.2 生成词云图

接着我们可以使用stylecloud.gen_stylecloud() 方法来生成词云图,通过传递相应的文本 .txt 文件的路径和生成词云的图标样式。
在网站上,我们可以方便的找到可用于 stylecloud 的图标样式列表。在此示例中,我选择了一个苹果作为图标。代码如下:

  1. import stylecloud
  2. stylecloud.gen_stylecloud(file_path='SJ-Speech.txt',
  3. icon_name="fas fa-apple-alt")

上述代码运行后,在当前python文件目录下生成以png格式保存词云图,如下所示:

在这里插入图片描述

2.3 美化显示效果

仔细观察gen_stylecloud函数的相关参数,我们可以控制背景颜色、单词的颜色、输出文件的名称等。为此,我们查看下面的代码:

  1. stylecloud.gen_stylecloud(file_path='SJ-Speech.txt',
  2. icon_name='fas fa-apple-alt',
  3. colors='white',
  4. background_color='black',
  5. output_name='apple.png',
  6. collocations=False)

运行结果如下:

在这里插入图片描述

2.4 处理停用词

我们可以使用stop_words库来处理文本中的停用词,可以使用pip install stop_words来安装该库。有了停用词列表,我们也可以将其传递给在gen_stylecloud函数中的custom_stopwords参数。

样例代码如下:

  1. from stop_words import get_stop_words
  2. stop_words = get_stop_words('english')
  3. stylecloud.gen_stylecloud(file_path='SJ-Speech.txt',
  4. icon_name='fas fa-apple-alt',
  5. palette='cartocolors.qualitative.Pastel_3',
  6. background_color='black',
  7. output_name='apple.png',
  8. collocations=False,
  9. custom_stopwords=stop_words)

上述代码的运行结果如下:

在这里插入图片描述

2.5 使用自定义背景图像

在上述网站上有数百个免费图标可用于 stylecloud,但是但有时我们可能希望使用自己的图像来为创建更加个性化的词云图。此时,我们可以使用PIL库来读取图像,使用matplotlib来绘制我们的图像,使用wordcloud来制作对应的词云图。

下述代码中使用蝙蝠的图案来生成对应的词云图,代码如下:

  1. from wordcloud import WordCloud, ImageColorGenerator
  2. from PIL import Image
  3. import matplotlib.pyplot as plt
  4. import numpy as np
  5. # create a mask based on the image we wish to include
  6. my_mask = np.array(Image.open('batman-logo.png'))
  7. # create a wordcloud
  8. wc = WordCloud(background_color='white',
  9. mask=my_mask,
  10. collocations=False,
  11. width=600,
  12. height=300,
  13. contour_width=3,
  14. contour_color='black',
  15. stopwords=stop_words)
  16.  
  17. with open('SJ-Speech.txt',encoding='gb18030',errors='ignore') as txt_file:
  18. texto = txt_file.read()
  19. wc.generate(texto)
  20. image_colors = ImageColorGenerator(my_mask)
  21. wc.recolor(color_func=image_colors)
  22.  
  23. plt.figure(figsize=(20, 10))
  24. plt.imshow(wc, interpolation='bilinear')
  25. plt.axis('off')
  26. wc.to_file('wordcloud2.png')
  27. plt.show()

运行结果如下:

在这里插入图片描述

3. 总结

本文详细介绍了如何使用stylecloud库来绘制各种样式的词云图,以突出显示文本中相应的关键词,并给出了定制化改进显示效果的样例代码。

到此这篇关于Python制作个性化的词云图实例讲解的文章就介绍到这了,更多相关Python词云图内容请搜索w3xue以前的文章或继续浏览下面的相关文章希望大家以后多多支持w3xue!

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号