最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
基于Python词云分析政府工作报告关键词代码示例
时间:2020-06-02 编辑:袖梨 来源:一聚教程网
本篇文章小编给大家分享一下基于Python词云分析政府工作报告关键词代码示例,代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看。
前言
十三届全国人大三次会议作了政府工作报告。这份政府工作报告仅有10500字左右,据悉是改革开放40年以来最短的一次。受到疫情影响,今年的两会会议适当缩短,政府工作报告也大幅压缩,体现了“实干为要”的理念。那么,这份政府工作报告突出强调了哪些关键词呢?我们其实可以基于Python技术进行词频分析和词云制作!
import matplotlib.pyplot as plt#绘图库 import jieba from wordcloud import WordCloud # 读入文本数据 fp = open(r'D:爬虫下载2020年政府工作报告.txt','r',encoding='utf-8') content = fp.read() # print(content) #分词 words = jieba.lcut(content) # 词频分析操作 data = {} for word in words: if len(word)>1: if word in data: data[word]+=1 else: data[word]=1 # print(data) #排序 hist = list(data.items())#转成列表 hist.sort(key=lambda x:x[1],reverse=True) # print(hist) #调试输出 for i in range(20): # print(hist[i]) print('{:<10}{:>5}'.format(hist[i][0],hist[i][1]))#左对齐10,右对齐5个长度
下表统计了今年的政府工作报告中出现次数最多的几个关键词。我们可以看到,今年的政府工作报告中提到“发展”的次数最多,一共出现了69次,“发展”一直都是政府工作报告中的重要关键词;其次是“就业”,出现了39次,足以显示新冠疫情之下就业问题的严峻性,以及党中央、国务院对就业问题的高度重视,政府工作报告中没有提出全年经济增速的具体目标,但仍然提出了就业目标——城镇新增就业900万人以上、城镇调查失业率6%左右、城镇登记失业率5.5%左右;第三多的就是“疫情”,报告中多次提到疫情防控工作,并指出这次新冠肺炎疫情,是新中国成立以来我国遭遇的传播速度最快、感染范围最广、防控难度最大的公共卫生事件。
“企业”作为市场经济的主体,出现的次数达到了30次,要想保障就业和民生,必须稳住上亿市场主体,尽力帮助企业特别是中小微企业、个体工商户渡过难关,报告提出要加大宏观政策实施力度,着力稳企业保就业。还有“支持”、“保障”、“加强”、“推进”等鼓舞人心的关键词出现次数也很多,相信大家看到政府工作报告中满满的政策“干货”,信心和底气也会更足了。
根据关键词的出现次数,我们可以使用Python绘制出政府工作报告词云图。Python的词云功能相当强大,你可以自己设定形状、字体、大小!
result = ' '.join(words) # print(result) #生成词云 wc = WordCloud( font_path=r'D:PPTppt字体思源宋体SC-Regular.otf', background_color = 'white',#背景颜色 ,#图片的宽 , max_font_size=50, min_font_size=12 ) wc.generate(result) wc.to_file(r'.wordcloud.png')#保存图片 #显示图片 plt.figure('政府工作报告') plt.imshow(wc) plt.axis('off')#关闭坐标轴 plt.show()
相关文章
- Golang ProtoBuf的基本语法详解 10-20
- Python识别MySQL中的冗余索引解析 10-20
- Python+Pygame绘制小球代码展示 10-18
- Python中的数据精度问题介绍 10-18
- Python随机值生成的常用方法介绍 10-18
- python3解压缩.gz文件分析 09-27