wordcloud和jieba的安装都很简单 都是pip install 直接安装就行,但是在学校机房,那个词云就是安装完就是报错,很奇怪,自己的电脑很顺利。!!! 然后 其实也不是自己写的 就直接从网上找的例子,自己看了看 感觉能看懂 嘻嘻 好懒~ 说说重点步骤吧 1、
def getText(text):#该函数用来替换文本中出现的特殊字符 txt = text for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~,。、 :': txt = txt.replace(ch, "") #将文本中特殊字符替换为空格 return txt先将文本中的特殊字符去除 2、
string = open(r'C:\Users\13583\Desktop\\夏C歌迷会.txt','r',encoding='utf-8').read()` 读取文本 3、
s = re.compile('x1358397179@qq.c片.+9879576219')#编写正则表达式 message = re.sub(s,'',string)将无关的字符变成空格 4、
# 绘制词云 def draw_wordcloud(): #读入一个txt文件 comment_text = open('F:\program\MyProjects\clustering\\fenci1.0\wordseg_result.txt','r').read() #结巴分词,生成字符串,如果不通过分词,无法直接生成正确的中文词云 cut_text = " ".join(jieba.cut(comment_text)) d = path.dirname(__file__) # 当前文件文件夹所在目录 color_mask = imread("Anne_Hathaway.png") # 读取背景图片 cloud = WordCloud( #设置字体,不指定就会出现乱码 font_path="HYQiHei-25J.ttf", #font_path=path.join(d,'simsun.ttc'), #设置背景色 background_color='white', #词云形状 mask=color_mask, #允许最大词汇 max_words=2000, #最大号字体 max_font_size=40 ) word_cloud = cloud.generate(cut_text) # 产生词云 word_cloud.to_file("pjl_cloud4.jpg") #保存图片 # 显示词云图片 plt.imshow(word_cloud) plt.axis('off') plt.show()总结: 这个大体的功能就这些了 剩下的就是应用了 和前期处理 如何让无用的数据不影响数据很关键! 加油加油哦 ccc