python文本分析与可视化利器—wordcloud库使用

wordcloud是功能强大的词云展示第三方库。它不仅可根据文本中词语出现的频率等参数绘制词云,还可设定词云的字体,颜色,形状等。需要注意的是,wordcloud库在运行时,需要用到一些依赖库:包括matplotlib库以及图像处理库pillow库。因此,使用该库之前,务必先装好依赖库。和其他第三方库一样,wordcloud在使用前需在cmd中输入如下命令安装:

pip install wordcloud

from wordcloud import WordCloud
import numpy as np
import PIL.Image as Image
fi = open("book.txt", "r", encoding = 'utf-8')
txt = fi.read()
fi.close()
font='font.ttf'
wc = WordCloud(width=800,
height=1000,
background_color='white',
font_path=font,
random_state=42
)
wc.generate(txt)
wc.to_file('鲁迅词云.png')

 

以上程序中,在设置词云是,默认生成的是一张长方形的图片,实际中,我们还可通过给WordCloud函数添加参数mask(面具),来实现,生成任意形状的词云。现在,修改以上程序,代码如下:

from wordcloud import WordCloud
import numpy as np
import PIL.Image as Image
fi = open("book.txt", "r", encoding = 'utf-8')
txt = fi.read()
fi.close()
font='font.ttf'
coloring=np.array(Image.open("mask.jpg"))
my_wc=WordCloud(background_color="white",max_words=2000,
mask=coloring, max_font_size=30,random_state=50,scale=8,
font_path=font)
my_wc.generate(txt)
my_wc.to_file('鲁迅词云mask.png')

 

发表评论

邮箱地址不会被公开。 必填项已用*标注