您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 文本挖掘tmSVM开源项目包含Python和Java两种版本带参考文档

  2. 文本挖掘tmSVM开源项目集成libSVM和liblinear包含Python和Java两种版本带PDF源码参考文档 简介 文本挖掘无论在学术界还是在工业界都有很广泛的应用场景。而文本分类是文本挖掘中一个非常重要的手段与技术。现有的分类技术都已经非常成熟,SVM、KNN、Decision Tree、AN、NB在不同的应用中都展示出较好的效果,前人也在将这些分类算法应用于文本分类中做出许多出色的工作。但在实际的商业应用中,仍然有很多问题没有很好的解决,比如文本分类中的高维性和稀疏性、类别的不平衡
  3. 所属分类:Python

    • 发布日期:2014-02-23
    • 文件大小:3mb
    • 提供者:vcfriend
  1. Python抢票源码

  2. 一、运行环境: 基于python2.7 二、原理: 图像识别基于tesseract 数据抓包使用httpwatch, IE,识别出所有的POST请求,获取各步骤中数据,分析页面里token等 三、用法: 修改conf_example.py里的买票信息, 然后运行 在不繁重情况下,可以验证提交买票请求,买完后自己去"未完成订单"页面付款 春运的压力环境下,有bug,待完善, python初学乍用,很多地方不 pythonic 四、Todo: 1. 压力下的抢票测试, fixbug 2. 寻找最优
  3. 所属分类:Python

    • 发布日期:2015-06-26
    • 文件大小:3mb
    • 提供者:qq_29329931
  1. 开源免费opencv3.3 计算机视觉系统,验证码,车牌,人脸识别等等(全语言)

  2. 领域如下: 1、人机互动 2、物体识别 3、图像分割 4、人脸识别 5、动作识别 6、运动跟踪 7、机器人 8、运动分析 9、机器视觉 10、结构分析 11、汽车安全驾驶 OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV
  3. 所属分类:C

    • 发布日期:2017-09-22
    • 文件大小:183byte
    • 提供者:luguangbiao
  1. 正方教务教务系统 请求接口

  2. 一个封装教务系统接口,验证码识别,方便开发者进行校园服务类开发,如:成绩查询,课表查询,个人信息查询等等。
  3. 所属分类:Python

    • 发布日期:2018-08-30
    • 文件大小:140kb
    • 提供者:qq_24573659
  1. 利用python 12306火车票抢票软件源码

  2. 一、运行环境: 基于python2.7 二、原理: 图像识别基于tesseract 数据抓包使用httpwatch, IE,识别出所有的POST请求,获取各步骤中数据,分析页面里token等 三、用法: 修改conf_example.py里的买票信息, 然后运行 在不繁重情况下,可以验证提交买票请求,买完后自己去"未完成订单"页面付款 春运的压力环境下,有bug,待完善, python初学乍用,很多地方不 pythonic 四、Todo: 1. 压力下的抢票测试, fixbug 2. 寻找最优
  3. 所属分类:Python

    • 发布日期:2018-11-29
    • 文件大小:3mb
    • 提供者:wo704566930
  1. python自动化实现登录获取图片验证码功能

  2. 主要介绍了python自动化实现登录获取图片验证码功能,本文通过实例截图的形式给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-18
    • 文件大小:117kb
    • 提供者:weixin_38596267
  1. Python实现的百度站长自动URL提交小工具

  2. URL提交是百度提供的一个站长工具,用于给站长提供手工收录某些URL的接口,但是该接口有验证码识别部分,比较难弄。所以编写了如下程序进行验证码自动识别: 主要思路 获取多个验证码,提交到 http://lab.ocrking.com/ 进行多次识别,然后计算每个验证码图片识别出来的 字母或数字 进行统计,得出统计率最高的 即为验证码。 复制代码 代码如下: #!/usr/bin/env python # -*- coding: utf-8 -*- import requests import t
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:44kb
    • 提供者:weixin_38622827
  1. python使用百度文字识别功能方法详解

  2. 介绍python使用百度智能去的文字识别功能,可以识别截图中的文,登陆路验证码等等。, 登陆百度智能云,选择产品服务。 选择“人工智能”—文字识别。 点击创建应用。 如图下面有关于“文字识别”的各类信息,如通用文字识别每天可以名费使用50000次,文字识别高精度版本免费使用500次每天。对于一般应用应该还足够。 在创建应用界面填入必要的信息,点击“立即创建”按纽。返回后点击“管理应用”按纽。 管理应用界面主要是能看到调用接口时需要的APP_ID, API_KEY, SECRET_KEY
  3. 所属分类:其它

  1. python使用百度文字识别功能方法详解

  2. 介绍python使用百度智能去的文字识别功能,可以识别截图中的文,登陆路验证码等等。, 登陆百度智能云,选择产品服务。 选择“人工智能”—文字识别。 点击创建应用。 如图下面有关于“文字识别”的各类信息,如通用文字识别每天可以名费使用50000次,文字识别高精度版本免费使用500次每天。对于一般应用应该还足够。 在创建应用界面填入必要的信息,点击“立即创建”按纽。返回后点击“管理应用”按纽。 管理应用界面主要是能看到调用接口时需要的APP_ID, API_KEY, SECRET_KEY
  3. 所属分类:其它

  1. 12306-Ticket-Booking:12306自动抢票系统(2020-01-10)-源码

  2. 基于Python的12306自动订票系统 系统功能 1.余票监控:发现余票自动下单 2.自动打码:采用第三方免费接口/本地识别算法两种模式,自动验证图片验证码 3.小黑屋:发展有余票但是下单失败的车次,自动加入小黑屋 4.邮件通知:下单异常或下单成功后邮件通知用户,以便及时处理 5.全国CDN轮询:提高余票查询频率的同时尽量避免IP被封禁 6.远程日志:抢票日志推送到远程服务器,方便查询 7.动态任务:定时扫描任务变化,动态增减任务 8.并行任务:支持多个抢票任务同时进行 9.远程任务:支持从远
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:814kb
    • 提供者:weixin_42151599
  1. pyhanlp:汉语分词词性标注命名实体识别依存句法分析新词发现-源码

  2. pyhanlp:HanLP1.x的Python接口 的Python接口,支持自动下载和升级 ,兼容py2,py3。内部算法通过工业界和学术界考验,配套书籍已经出版,欢迎查阅。学习的已于2020年初发布,次世代最先进的多语种NLP技术,与1.x相辅相成,平行发展。 安装 非IT人士可直接使用;新手建议观看 ;工程师请: 先安装和 。要求JDK,操作系统和Python一致。然后,最后执行: conda install -c conda-forge jpype1==0.7.0 # (可选
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:147kb
    • 提供者:weixin_42146888
  1. pycmx:Python CMX 3600编辑决策列表解析器-源码

  2. cm pycmx软件包提供了用于解析CMX 3600 EDL及其最常见变体的基本接口。 产品特点 CMX 3600的主要变化:自动检测并正确读取标准的“ File32”和“ File128”格式。 保留事件与单个编辑/片段之间的关系。 具有常见识别格式的备注或注释字段将被读取并提供给客户端,包括剪辑名称和源文件数据。 象征性地解码过渡和音频通道。 不解析或验证时间码,不强制执行帧速率,不以任何方式参数化时间码或帧速率。 这使得解析器对混合速率的EDL具有更高的容忍度。 可在EditL
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:30mb
    • 提供者:weixin_42102634
  1. python 爬虫反爬策略

  2. python 爬虫反爬策略 爬虫和反爬的对抗一直在进行着…为了帮助更好的进行爬虫行为以及反爬,今天就来介绍一下网页开发者常用的反爬手段。 1.通过user-agent客户端标识来判断是不是爬虫 解决方法:封装请求头:user-agent 2.封ip 解决方法:设置代理ip 封ip最主要的原因就是请求太频繁。 3.通过访问频率来判断是否是非人类请求 解决方法:设置爬取间隔和爬取策略 4.验证码 解决方法:识别验证码 5. 页面数据不再直接渲染,通过前端js异步获取 解决
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:46kb
    • 提供者:weixin_38672800
  1. Python模拟登入的N种方式(建议收藏)

  2. 这段时间在研究如何破解官网验证码,然后进行下一步的爬虫操作,然而一个多星期过去了,编写的代码去识别验证码的效率还是很低,尝试用了tesserorc库和百度的API接口,都无济于事,本以为追不上五月的小尾巴,突然想到我尝试了这么多方法何不为一篇破坑博客呢。 现在很多官网都会给出相应的反扒措施,就拿这个登入来说,如果你不登入账号那么你就只能获取微量的信息,甚至获取不了信息,这对我们爬虫来说是非常不友好的,但是我们总不可能每次都需要手动登入吧,一次二次你能接受,大工程呢?既然学了python,而不为用
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:86kb
    • 提供者:weixin_38653878
  1. Python pytesseract验证码识别库用法解析

  2. 环境 centos7 python3 pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。 依赖安装 yum install-y automake autoconf libtool gcc gcc-c++ yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel 安装依赖的leptonica库 wget http://ww
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:34kb
    • 提供者:weixin_38684806