您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. fine_tuning_data.zip 可直接用bert进行微调的中文情绪数据

  2. 具体使用方法可以看我的博客:https://blog.csdn.net/weixin_40015791/article/details/90410083 下面也会简单介绍一下:在bert开源代码中的run_classifier.py中找到 processors = { "cola": ColaProcessor, "mnli": MnliProcessor, "mrpc": MrpcProcessor, "xnli": XnliProcessor, "intentdetection":Inte
  3. 所属分类:深度学习

    • 发布日期:2019-05-21
    • 文件大小:599kb
    • 提供者:weixin_40015791
  1. 覆盖40种语言:谷歌发布多语言、多任务NLP新基准XTREME.pdf

  2. 自然语言权威数据集 GLUE 一直是衡量各机构 NLP 预训练技术水平最重要的指标之一。近年来在其榜单之上实现更好的成绩,也成为了科技公司技术提升的体现。不过现有的大多数 NLP 基准仅限于英文任务,无法评价 NLP 模型在其他语言上的能力。近日,来自 CMU、谷歌研究院和 DeepMind 的科学家们提出了覆盖四十种语言的大规模多语言多任务基准 XTREME,希望一举解决这个问题。
  3. 所属分类:机器学习

    • 发布日期:2020-04-15
    • 文件大小:899kb
    • 提供者:syp_net
  1. GLUE任务中MRPC任务数据集.zip

  2. 里面是GLUE官网下载的MRPC任务数据集,官网上指定的方式是通过跑脚本download_glue_data.py来下载 GLUE data 。指定数据存放地址为:glue_data。执行后发现下载失败,究其原因是下面这两个链接访问不上,几天后试了一次又能下载了,可能对方服务端不稳定。
  3. 所属分类:深度学习

  1. GLUE中MRPC数据集 BERTdemo数据集

  2. GLUE——MRPC数据集。因为资源大小限制,该资源只包含MRPC数据集。 Microsoft Research Paraphrase Corpus 下载地址https://www.microsoft.com/en-us/download/details.aspx?id=52398
  3. 所属分类:机器学习

    • 发布日期:2020-03-02
    • 文件大小:855kb
    • 提供者:weixin_31713129
  1. GLUE-baselines百度网盘下载地址.txt

  2. english GLUE数据集,Bert等一些论文中进行评测基准用的数据集,因为原数据太大,所以放到了网盘里面. 因为这些GLUE的官网在国外,而GitHub上面的下载地址也在国外,所以你过你可以翻出去的话,下载不成问题,如果翻不出去的话,你可以用我上传的链接下载。 数据内容见介绍:http://www.xuwei.io/2018/11/30/%E6%96%87%E6%9C%AC%E5%88%86%E7%B1%BB-glue%E6%95%B0%E6%8D%AE%E9%9B%86%E4%BB%
  3. 所属分类:深度学习

    • 发布日期:2020-01-14
    • 文件大小:81byte
    • 提供者:zhaijianfengrui
  1. 孟加拉国模拟玉米生长和产量的农业技术转让模型决策支持系统的校准和验证

  2. 玉米是孟加拉国新兴的重要农作物,因为与水稻和小麦作物相比,它具有很高的单产潜力和经济效益。 有必要了解孟加拉国在不同生产环境中这种作物的生长和产量行为。 诸如农业技术转移决策支持系统(DSSAT)4.6版(以下简称DSSAT)之类的作物模型可以经济有效地用于研究玉米在不同生产环境下的性能。 它需要为孟加拉国常用的玉米栽培品种校准和验证DSSAT模型,然后将该模型带到各种应用中,包括投入和农艺管理选择以及影响分析的气候变化。 因此,本研究旨在首先为流行的四个杂交玉米品种(BARI杂交玉米7,BAR
  3. 所属分类:其它

    • 发布日期:2020-06-04
    • 文件大小:723kb
    • 提供者:weixin_38741531
  1. 第四节:ALBERT

  2. 目录回顾BERT1. 降低模型参数,加宽加深模型2. 改进NSP任务为SOP3. 去掉dropout4. 增加训练数据总结 最近在家听贪心学院的NLP直播课。放到博客上作为NLP 课程的简单的梳理。 简介:虽然BERT模型本身是很有效的,但这种有效性依赖于大量的模型参数,所以训练一套BERT模型所需要的时间和资源成本是非常大的,甚至这样复杂的模型也会影响最终效果。在本次讲座里,我们重点来介绍一种瘦身版的重磅BERT模型 – ALBERT,它通过几种优化策略来获得比BERT小得多的模型,但在GLU
  3. 所属分类:其它

  1. bert-stable-fine-tuning:关于微调BERT的稳定性-源码

  2. 关于微调BERT的稳定性:误解,解释和强大的基准 Marius Mosbach,Maksym Andriushchenko,Dietrich Klakow 萨尔大学和EPFL 该存储库包含有关“。它是(v2.5.1)的分支。 抽象的 微调经过预训练的基于变压器的语言模型,例如BERT,已成为控制各种NLP基准排行榜的一种普遍做法。尽管微调模型具有强大的经验性能,微调还是一个不稳定的过程:使用多个随机种子训练同一模型可能会导致任务性能产生较大差异。先前的文献(Devlin等人,2019; Lee
  3. 所属分类:其它

  1. text-corpus-analysis-源码

  2. 文本语料库分析 词汇探究可产生很少的统计数据,例如常见单词的数量,数据集的唯一单词以及查找出现在五种,四种,三种,两种和两种中的单词所占的百分比,包括和不包括停用词列表。 Sentence Vector Exploration(句子向量探究)基于两种句子向量表示方法的捕获能力比较它们的能力。 其中包括Spark ML库使用基于TDIDF的矢量表示以及Google发布的预训练语句编码器。 设置环境 创建EMR集群 You are suggested to download the MNLI dat
  3. 所属分类:其它

  1. denver-service-request-events-源码

  2. 丹佛服务请求事件 丹佛服务请求事件 该项目 前言 对于测试交付,此处的数据集相对较小(来自丹佛开放数据目录( )的数据)。 您应该进行此测试,就好像数据是实际大小的1000倍并且经常通过实时事件进行更新一样。 方法 可能有多种方法来应对这一挑战,但此处使用的方法是AWS Cloud,它通过使用EC2,Kinesis Data Firehose,S3,Glue,Athena,Redshift,Quicksight,Kinesis Data Streams, DynamoDB Lambda。
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:13mb
    • 提供者:weixin_42134769
  1. albert:阿尔伯特-源码

  2. 阿尔伯特 ***************新2020年3月28日*************** 添加一个colab 以对GLUE数据集进行微调。 ***************新2020年1月7日*************** v2 TF-Hub模型现在应该可以在TF 1.15上使用,因为我们从图中删除了本地Einsum op。 请参阅下面的更新的TF-Hub链接。 ***************新2019年12月30日*************** 中国模型发布。 我们要感谢提供的培训
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:109kb
    • 提供者:weixin_42136837
  1. aws-etl-glue-源码

  2. 概述 请记住:在下面的链接中,请使用真实的AWS帐户(例如inventale dev沙箱),而不要假冒{9999999} 该项目包含Scala WeatherToParquetJob作业,以使用将数据从样本转换为镶木地板并将其存储到s3存储桶。 代码位于此处: : 输入数据: : input/ 结果数据: : weather/ 您可以使用查询输入和输出数据 请在这里找到完整的使用数据集: : 您可以在此处找到cloudformation基础结构描述符: ./aws/ 二
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:339kb
    • 提供者:weixin_42113456
  1. GLUE数据集下载-附件资源

  2. GLUE数据集下载-附件资源
  3. 所属分类:互联网

    • 发布日期:2021-03-05
    • 文件大小:106byte
    • 提供者:weixin_42196667
  1. GLUE数据集下载-附件资源

  2. GLUE数据集下载-附件资源
  3. 所属分类:互联网

    • 发布日期:2021-03-02
    • 文件大小:23byte
    • 提供者:weixin_42187944
  1. 发布-源码

  2. 发布 GLUE数据集 CoLA:句子是语法还是不语法?:Matthews SST-2:电影评论是正面,负面还是中立的?:准确性 MRPC:句子B是否是句子A的表述?:Accuracy / F1 STS-B:句子A和B有多相似?:Pearson / Spearman QQP:两个问题是否相似?:准确性/ F1 MNLI:句子A是否包含或矛盾句子B ?:准确性 QNLI:句子B是否包含对句子A中问题的答案?:准确性 RTE:句子A是否包含句子B ?:准确性 WNLI:句子B用一个名词代替句子
  3. 所属分类:其它

  1. mzutils-源码

  2. 张墨涵的实用工具 这是一个个人实用程序的工具箱,其中包含各种方法来完成与数据清理和预处理有关的杂项工作,尤其是针对JSON,CSV,SQL和许多其他数据格式的数据集,例如SQuAD,GLUE,Deepmind CNN / DailyMail等数据集。 该工具箱的唯一目的是重用代码并使Mohan Zhang的生活更轻松。 整个工具包(无任何规范)均已获得MIT许可。 通过
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:24kb
    • 提供者:weixin_42143161
  1. albert_zh:用于自我监督学习语言表示的精简BERT,海量中文预训练ALBERT模型-源码

  2. albert_zh 使用TensorFlow实现的实现 ALBert基于Bert,但有一些改进。 它以30%的参数减少,可在主要基准上达到最先进的性能。 对于albert_base_zh,它只有十个百分比参数与原始bert模型进行比较,并且保留了主要精度。 现在已经提供了针对中文的ALBERT预训练模型的不同版本,包括TensorFlow,PyTorch和Keras。 海量中文语料上预训练ALBERT模型:参数充分,效果更好。预训练小模型也能拿下13项NLP任务,ALBERT三大改造登顶G
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:969kb
    • 提供者:weixin_42176827
  1. serverless-data-pipeline-sam:由Kinesis Firehose,API Gateway,Lambda,S3和Athena支持的无服务器数据管道-源码

  2. 无服务器数据管道-由AWS SAM提供支持 使用Amazon API Gateway,AWS Lambda,Amazon Kinesis Firehose,Amazon S3和Amazon Athena构建无服务器数据管道。 如何部署堆栈 请参阅scr ipts/deploy.sh (自定义部署存储桶和堆栈名称)。 如何通过API提取新记录 请参阅scr ipts/track.sh (自定义堆栈名称)。 我可以对数据集执行哪种查询? 这取决于您收集的数据以及在Athena和Glue上定义的虚拟
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:12kb
    • 提供者:weixin_42131367
  1. unibg_cloud_e_mobile_2020:2020年移动与云技术-源码

  2. 移动和云技术项目 该资料库中所有可用材料的简要说明: 可以(通过slides.com)获得描述项目的体系结构,功能和基本目标的幻灯片。 可以在上获得描述系统设置,数据加载过程和数据集的幻灯片(通过slides.com)。 数据集在/ Dataset文件夹中可用,而实现AWS Glue流程的Python脚本在/ AWS_glue文件夹中可用。 可通过(通过slides.com)获得描述lambda函数及其API的幻灯片。 每个Lambda函数的处理程序的代码在/ AWS_lambda文件夹中
  3. 所属分类:其它

  1. glue-jupyter:Jupyter生态系统的实验胶前端-源码

  2. Jupyter胶水界面 有时也称为“ Glupyter” 关于 是一个Python库,用于探索数据集内和数据集之间的关系。 到目前为止,主要接口都基于 ,但是gum-jupyter软件包旨在提供一种在Jupyter笔记本电脑和Jupyter实验室中使用Glue的方法。 目前这是一项正在进行的工作,并且正在高度试验中。 有关某些笔记本电脑的用法示例,请参阅notebooks目录。 您可以在mybinder上在线试用胶水jupyter: 具有真实数据的笔记本: (例如,将桌子和图像链接在一起
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:137kb
    • 提供者:weixin_42105570
« 12 »