0%

wordcloud词云工具

wordcloud是一种NLP中常用的可视化工具,主要用途是可视化展示文本中各个词出现的频率多少,将出现频率多的使用更大的字体进行展示。

基本用法

1
2
3
4
5
6
7
import wordcloud
with open("./type1.txt","r") as f:
type1 = f.read()

w = wordcloud.WordCloud()
w.generate(type1)
w.to_file("type1.png")

wordcloud内部处理流程:

​ 1 、分隔:以空格分隔单词

​ 2、统计 :单词出现的次数并过滤

​ 3、字体:根据统计搭配相应的字号

​ 4 、布局

常用参数