© 1999-2048 dssz.net 粤ICP备11031372号
[其它] 爬取【医疗问答】数据
说明:本文章以 丁香 医生为例 主要以 科目分类来进行爬取,每个科目爬取的内容会存储到一个文本文档中,内容是问答式。 代码如下: from bs4 import BeautifulSoup import pandas as pd import json import requests import time import random def get_static_url_content(url): headers = {'User-Agent': 'Mozilla/5.0 (Windows<weixin_38663151> 上传 | 大小:26kb