您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 复旦中文文本分类语料-训练集

  2. 由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:数据库

    • 发布日期:2017-02-06
    • 文件大小:50mb
    • 提供者:github_36326955
  1. 中文文本分类语料(复旦)-训练集

  2. 这个链接是训练集,测试集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:讲义

    • 发布日期:2017-02-06
    • 文件大小:50mb
    • 提供者:github_36326955
  1. 复旦大学语料包括训练集和测试集

  2. 找了很久才找到的,包括训练集和测试集,分享一下。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-01-04
    • 文件大小:88mb
    • 提供者:liudanaihuyan
  1. MNIST_原始图像数据集.rar

  2. MNIST手写数字数据集,包括训练集和测试集两部分,训练集和测试集的标签分别在train_lables.txt和test_lables.txt两个文件中,序号与手写数字图片相对应,导入后可以转化为相应矩阵。该文档可用来练习制作自己的数据集过程。
  3. 所属分类:深度学习

    • 发布日期:2019-08-20
    • 文件大小:69mb
    • 提供者:sunmingyang1987
  1. 实训作业 (1).rar

  2. 三、 项目思路 1. 爬取一定时间内的(如最近1个月的)前程无忧岗位数据(例如青岛所有岗位的url为:https://jobs.51job.com/qingdao-snq/),部分数据可以直接在搜索结果中获取,部分数据需要进入到岗位页面中获取。 2. 将爬取的数据保存为本地文本文件(若学生掌握数据库相关知识则可以保存在数据库中)。 3. 基于爬取的数据可以形成多种数据分析结果,例如:行业薪资、地区薪资、地区与行业分布关系、行业学历需求情况等。 4. “职位信息”字段可使用jieba分词库进行分
  3. 所属分类:机器学习

  1. 训练集与测试集文件.rar

  2. tensorflow通过提取Mfcc特征+卷积神经网络来实现语音分类的测试文件 ddd是train训练文件,test_Data是测试文件
  3. 所属分类:深度学习

    • 发布日期:2020-01-16
    • 文件大小:7mb
    • 提供者:qq_37591637
  1. hadoop携程数据情感预测.rar

  2. 基于Eclipse并使用Maven创建Hadoop工程。 1)训练集training.txt文件 该文件是一个大小为75.8MB的文本数据集,并包含了20,000,000条数据记录,每行数据中包含的信息为“评价结论\t 评价内容”。其中,“评价内容”是若干词语组合而成,词语之间是空格隔开,词语包括中文、英文以及其他特殊符号,即其内容为“word1 word2 word3 word4 …… wordn”,其中wordi表示当前文本描述中的第i个词,n为当前文本描述中包含的总词数。 2)测试
  3. 所属分类:Hadoop

    • 发布日期:2020-01-10
    • 文件大小:3mb
    • 提供者:qq_40673864