您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. kaggle-quora-问题对-源码

  2. Quora问题对 2つの质问が同じ内容かどうか 最佳解决方案 1日, 2, 第三, 4日, 5日, 7日, 8日, 9日, 24日, 类似比赛 质问に対する回答をwikipedia内から抽出 有害なコメントの分类 书き言葉から话し言葉への変换 有害なコメントかどうか判定 感情分析の根拠となっているフレーズの抽出 参考 [TensorFlow roBERTa-[0.705]] )
  3. 所属分类:其它

  1. Quora_question_pairs_NLP_Kaggle:Quora Kaggle竞赛:使用word2vec嵌入,scikit-learn和xgboost进行训练的自然语言处理-源码

  2. 使用Word2Vec,XGBoost和自动编码器进行重复问题检测 在这篇文章中,我解决了基于问题对是否重复来对问题进行分类的问题。 对于Quora或Stack Overflow这样的公司来说,这很重要,因为其中张贴的多个问题是已经回答的问题的重复。 如果算法发现重复的问题,则可以将用户定向到该问题并更快地找到答案。 两个重复问题的示例是“如何阅读和查找我的YouTube评论?” 和“如何查看我在YouTube上的所有评论?”,重复出现的问题是“是什么导致某人嫉妒?” 和“我该怎么做才能避免嫉
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:24mb
    • 提供者:weixin_42097369
  1. kaggle-quora-question-pairs:我对Kaggle Quora Question Pairs竞赛的解决方案(排名前2%,私有LB对数损失0.13497)-源码

  2. kaggle-quora-问题对 我对(排名前2%,私人LB对数损失0.13497)。 总览 该解决方案结合了纯统计功能,经典NLP功能和深度学习。 将近200种手工制作的特征与来自具有不同架构的4个神经网络的失意预测相结合。 最终模型是GBM(LightGBM),使用分层的K折交叉验证对它进行了早期停止训练并且学习率非常低。 复制解决方案 硬件要求 几乎所有代码(某些第三方脚本除外)都可以有效利用多核计算机。 同时,其中一些可能需要大量内存。 所有代码均已在具有64 GB RAM的计算机上进
  3. 所属分类:其它

  1. Siamese-LSTM:用于评估Quora问题对数据集的句子之间语义相似性的Siamese LSTM-源码

  2. 连体LSTM 使用MaLSTM模型(暹罗网络+曼哈顿距离的LSTM)检测问题对之间的语义相似性。 使用的训练数据集是原始Quora问题对数据集(使用的〜363K对)的子集。 这是Keras基于和。 先决条件 纸,文章 数据 参考文献 原始作者的GitHub 基于TensorFlow的实现 Kaggle的test.csv太大了,所以我就只提取前20个问题,并创建了一个名为test-20.csv和它在使用predict.py 。 您应该将所有数据文件./data目录。 怎么跑 训练 $ py
  3. 所属分类:其它