© 1999-2048 dssz.net 粤ICP备11031372号
[其它] Python输入输出-自然语言处理+json格式化
说明:Python输入输出-自然语言处理+json格式化 NLP自然语言处理 读取文件 去除所有标点符号和换行符,并把所有大写变成小写; 合并相同的词,统计每个词出现的频率,并按照词频从大到小排序; 将结果按行输出到文件 out.txt。 import re def parse(text): #使用正则表达式去除text文件内标点符号和换行符,替换为空格, text = re.sub(r'[^\W]',' ',text) #转换为小写 text = text.lowe<weixin_38665668> 上传 | 大小:154kb