© 1999-2048 dssz.net 粤ICP备11031372号
[其它] [Python]提取docx/网页超链接
说明:写在前面,仅供学习交流。 编程环境: win10, office2019 docx文本提取超链接并写入TXT文档: from pydocx import PyDocX from bs4 import BeautifulSoup # 用于解析网页 #by:菜鸟阿样 # 转docx为html文本 html = PyDocX.to_html("docx文本名") # 加载文本 bsObj = BeautifulSoup(html, 'html.parser') # 提取所有方法 t1 = bsObj<weixin_38683930> 上传 | 大小:27kb