WEB_KG：爬取百度百科中文页面，抽取三元组信息，建立中文知识图谱-源码开源web知识图谱项目爬

文件名称: WEB_KG：爬取百度百科中文页面，抽取三元组信息，建立中文知识图谱-源码

所属分类: 其它

开发工具:

文件大小: 1mb

下载次数: 0

上传时间: 2021-02-03

提供者: weixin_********

下载 (1mb)

不能下载？报告错误

详细说明：开源web知识图谱项目爬取百度百科中文页面解析三元组和网页内容建立中文知识图谱建立百科bot（重建中）更新20200720 Windows上的部署参考，感谢LMY-nlp0701！更新20191121 迁移代码到爬虫框架scrapy 优化了抽取部分代码数据持久化迁移到mongodb 修复chatbot失败问题开放neo4j后台界面，可以查看知识图谱成型效果提示如果是项目问题，请提问题。如果涉及到不方便公开的，请发邮件。 ChatBot请访问成型的百科知识图谱访问，用户名：neo4j，密码：123。效果如下：环境 python 3.6 re：url正则匹配 scrapy：网页爬虫和网页解析 neo4j：知识图谱图数据库，安装可以参考 pip install neo4j-driver：neo4j python驱动 pip install pymongodb：mongodb的python支持 mongodb数据库：安装参考代码执行： cd WEB_KG/baike scrapy crawl baike 执行界面（按ctrl + c停止）：知识图谱效果图

(系统自动生成,下载前可以参看下载内容)