说明: (1)打开豆瓣一部电影评论区,根据html结构捕获三个信息: 一,每账号的评分等级为5星、4星、3星、2星、1星; 二,每个账号的评论留言; 三,跳转到下个评论页面的http链接 (2)获取所有的信息后对信息进行处理: 一,计算出每个星级的总数和一共多少账户进行了评级 二、将所有的评论内容放在一起,处理评论中的空格和其他不规范形式 (3)用matplotlib绘制评分等级占比的饼图,用jieba进行分词处理,用wordcloud生成词云图 同个修改url=https://movie.douba
<qq_31967985> 上传 | 大小:14kb