您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. German Sentiment Analysis Toolkit 德语情绪分析工具包-数据集

  2. SentimentWortschatz,或简称为SentiWS,是一个公开可用的德语资源,用于情感分析、观点挖掘等。它列出了在[-1区间内加权的正负极性词;加上他们的词缀部分,如果适用的话,还有他们的词尾变化。当前版本的SentiWS (v1.8b)包含1650个正词和1818个否定词,合计15649个正词和15632个否定词形式分别包含词形变化。它不仅包含明确表达一种情绪的形容词和副词,也包含含蓄表达一种情绪的名词和动词。 SentiWS_v1.8c_Negative.txt SentiW
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:87040
    • 提供者:weixin_38581405
  1. TurkishMorphologicalAnalysis:土耳其形态分析图书馆-源码

  2. 形态分析 形态学 在语言学中,术语形态学是指对词的内部结构的研究。 假设每个单词都包含一个或多个词素,这些词素可以定义为具有特定含义或语法功能的最小语言单元。 一个词可以碰到形态单一的单词,即词根,也可以碰到形态复杂的单词,例如复合词或词缀形式。 Batı-lı-laş-tır-ıl-ama-yan-lar-dan-mış-ızwest-make-caus-pass-neg.Abil-Nom-Pl-Abl-Evid-A3Pl'看来我们是在那些不能被西方化的国家中。” 构成单词的语素以(或多或
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:78848
    • 提供者:weixin_42160398
  1. 基于字形分析的离线维吾尔手写体字符高效分割算法

  2. 草书离线手写维吾尔语脚本包含许多小而随机的笔画,这使得字符分割更加复杂。 有鉴于此,本文提出了一种基于字素分析的高效字符分割算法。 首先,通过点笔画检测和成分分析,将一个手写的维吾尔语单词过度细分为三种类型的笔画:点,词缀和主笔画。 其次,主笔划被过度分割,而点笔划被聚类,从而分别构造了主笔素队列和附加笔素队列。 最后,通过对字素的形状和识别结果进行分析,选择出最佳的字符序列假说。 以93.09%的字符分割准确率和97.67%的查全率进行的实验结果验证了该算法的有效性。
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:1048576
    • 提供者:weixin_38576561
  1. 基于字素分析的离线手写维吾尔文字识别

  2. 维吾尔语字符包含许多小而随机的笔画,这使字符识别更加复杂。 针对128个维吾尔语字符,提出了一种基于字素分析的高效字符识别算法。 首先,通过点笔画检测和成分分析,将维吾尔字符分解为点,词缀和主要字素三种类型的字素,建立了128个字符模型。 其次,通过其字素组成将维吾尔语字符预先分类为12个子类。 最后,针对各种类型的字素设计了不同的分类器。 利用估计的字素融合系数,通过使用加权朴素贝叶斯算法融合字素分类输出,给出字符识别结果。 实验结果表明,该算法可以有效地识别出128个不受约束的手写维吾尔字符
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:446464
    • 提供者:weixin_38706824
  1. 语言分类-源码

  2. 顶点:语言分类 卢克·赫林加 数据科学沉浸式遥控器(DSIR-113020) 2021年3月4日 问题陈述 执行摘要 该项目的范围旨在涵盖Web API的使用,自然语言处理(NLP)以及分类模型的比较。 首先,使用Pushshift reddit API从子Reddit r / Coffee和r / tea收集5000个帖子。 清洗后,将剩余的4607个帖子标题和相关的subreddit标签分为一个训练集(数据的75%)和一个测试集(数据的25%)。 然后对多种NLP技术和分类模型进行了测试,
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:2097152
    • 提供者:weixin_42133680
  1. 维吾尔语多音词消歧混合方法

  2. 维吾尔语中存在的形同音不同单词(多音词)的正确发音是影响合成系统可懂读的重要原因之一。维吾尔语单词由词根和词缀构成,虽然多音词词根数量不多,但多音词词根连接各种词缀则构成了大量的多音词。将维吾尔语中经常用错的16个多音词词根作为研究对象,以多音词的不同特点为出发点,采取不同的规则,结合最大熵模型方法来处理不符规则的多音词,同时用似然比方法选取关键词,并用贪婪算法选择最佳特征模板。经过性能测试,该算法多音词消歧平均准确率达到87.7%。
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:1048576
    • 提供者:weixin_38686658
  1. 基于标注词典和规则的维吾尔文动词词干提取方法

  2. 利用语言学专家人工标注的语料库对维吾尔文动词进行研究,并总结出了维吾尔文动词范畴的连接规则框架.在人工标注的实例库的基础上,收集了词缀连接规则集合,经人工纠正构建了词缀连接规则库集合.最终,结合人工标注实例库、词缀连接规则库及维吾尔文动词范畴的连接规则框架提出了维吾尔文动词词干提取方法,该方法的独立实验准确率达到了84.15%.
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:288768
    • 提供者:weixin_38519681
  1. 基于SVM的哈萨克语文本分类

  2. 介绍了支持向量机(SVM)和k-最近邻法(kNN)分类算法的思想和两种哈萨克语特征提取方法。对SVM、kNN和Bayes算法在哈萨克语文本分类的实验进行了比较。实验结果表明:在处理哈萨克语文本分类问题上,SVM较kNN和Bayes有较好的分类效果。由于哈萨克文单词的语素和构形的特点,若对哈萨克语词缀进行切分,则会降低文本分类的准确率和查全率。
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:244736
    • 提供者:weixin_38692707
  1. 基于分类及最佳匹配读音的维吾尔多音词消歧

  2. 研究维吾尔语中的多音词现象,根据多音词的不同特点进行分类。利用词性和读音的映射关系消歧第1类多音词。根据词缀连接词干后是否发生元音弱化的特点消歧第2类多音词。提取上下文语境信息,使用最佳匹配读音的方法消歧第3类多音词。采用似然比方法进行关键词选择,并对不同窗口宽度的关键词选取方法进行对比实验。结果表明,该方法可以得到错误率为20.9%的多音词消歧效果。
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:2097152
    • 提供者:weixin_38502239
  1. sticky-sidebar::smiling_face_with_sunglasses:用于制作智能和高性能粘性侧边栏的纯JavaScript工具-源码

  2. 粘边栏 纯Javascr ipt插件,用于制作智能和高性能的粘性侧边栏。 有关完整的文档和示例,请参见 为什么粘性侧边栏是如此出色? 滚动时,它不会重新计算所有尺寸,而只是重新计算必要的尺寸。 超级平滑,不会产生滚动滞后或颠簸现象,也不会重排页面。 集成了调整大小传感器,以在更改侧边栏或其容器的大小时重新计算插件的所有尺寸。 它在每种词缀类型上都有事件触发器,以在特定情况下挂接您的代码。 与容器的其余部分相比,如果边栏过高或过短,请使用侧栏。 零依赖和超级简单的设置。 安装 您可以
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:37888
    • 提供者:weixin_42139871
  1. 土耳其语-Word2Vec:土耳其语的预训练Word2Vec模型-源码

  2. 土耳其语预训练Word2Vec模型 (下面是土耳其语版本。/Türkçeiçinaşağıyabakın。) 本教程介绍了如何从Wikipedia转储中为土耳其语训练word2vec模型。 此代码使用库以Python 3编写。 土耳其语是一种凝集性语言,维基百科语料库中有很多词具有相同的词缀和不同的后缀。 我将写土耳其语lemmatizer来提高模型的质量。 您可以查看以了解更多详细信息。 如果您只想下载预训练的模型,则可以使用并且可以在github Wiki中的页面中查找示例。 其中一些如
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:5120
    • 提供者:weixin_42131705
  1. turkish-stemmer-python:用于Python的土耳其语词干-源码

  2. 土耳其语Python干词 注意:大多数文档取自项目。 土耳其语词干算法。 土耳其语言形态学导论 土耳其语是一种凝集性语言,具有非常丰富的形态结构。 在土耳其语中,可以通过附加一系列后缀来从一个词干中形成许多不同的词。 例如,“doktoruymuşsunuz”一词的意思是“您曾经是他的医生”。 这个词的词干是“ doktor”,它带有三个不同的后缀-sU,-ymUş和-sUnUz。 从“雪球描述”中: 词通常由词干和至少附加两个或三个词缀组成。 我们可以分析土耳其语中的名词后缀两类。 名
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:21504
    • 提供者:weixin_42116681
  1. 在Python中使用NLTK库实现对词干的提取的教程

  2. 什么是词干提取? 在语言形态学和信息检索里,词干提取是去除词缀得到词根的过程─—得到单词最一般的写法。对于一个词的形态词根,词干并不需要完全相同;相关的词映射到同一个词干一般能得到满意的结果,即使该词干不是词的有效根。从1968年开始在计算机科学领域出现了词干提取的相应算法。很多搜索引擎在处理词汇时,对同义词采用相同的词干作为查询拓展,该过程叫做归并。 一个面向英语的词干提取器,例如,要识别字符串“cats”、“catlike”和“catty”是基于词根“cat”;“stemmer”、“stem
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:160768
    • 提供者:weixin_38517728
  1. 考研词汇5500笔记

  2. 考研词汇5500 主讲:刘一男 00-01 词汇的记忆方法 常见方式:考试的词汇以列表的方式发给大家 本课程的讲解方式:词根、词缀学 1、​ 难点 2、​ 重点 3、​ 知识点 4、​ 落脚点 01-
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:9437184
    • 提供者:weixin_38717980
  1. 英语词根、后缀word打印版.doc

  2. 整理了英语常用的词根词缀,希望对记忆大量词汇的同学们有所帮助。
  3. 所属分类:教育

    • 发布日期:2021-01-12
    • 文件大小:199680
    • 提供者:ironurbane
  1. PowerShell小技巧之查找获取注册表路径

  2. 在先前的技巧中我们说明如何将一个PS内置的路径格式转化成一个实际路径。这里介绍了一个例子。这段代码递归从HKEY_CURRENT_USER获取所有包含”powershell”词缀的键(简单的替换查询词缀将能获得你想要查询的任何东西) 代码如下: Get-ChildItem -Path HKCU:\ -Include *PowerShell* -Recurse -ErrorAction SilentlyContinue|Select-Object -Property *Path* | Out-G
  3. 所属分类:其它

    • 发布日期:2021-01-10
    • 文件大小:37888
    • 提供者:weixin_38553648
  1. poe-itemtext-parser:流放路径剪贴板项文本的解析器-源码

  2. 流放项文本解析器的路径 从“流放之路”客户端解析项目文本(通过CTRL + C获得)。 请查看以获取更多信息。 入门 使用npm安装: $ npm i klayver/poe-itemtext-parser --save 已知的问题 对于没有显式词缀的魔术,稀有和独特项,词缀解析不正确 例子 import fs from "fs" ; import util from "util" ; import { Parser } from "klayver/poe-itemtext-parser"
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:232448
    • 提供者:weixin_42107374
  1. 基于分类及最佳匹配读音的维吾尔多音词消歧

  2. 研究维吾尔语中的多音词现象,根据多音词的不同特点进行分类。利用词性和读音的映射关系消歧第1类多音词。根据词缀连接词干后是否发生元音弱化的特点消歧第2类多音词。提取上下文语境信息,使用最佳匹配读音的方法消歧第3类多音词。采用似然比方法进行关键词选择,并对不同窗口宽度的关键词选取方法进行对比实验。结果表明,该方法可以得到错误率为20.9%的多音词消歧效果。
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:2097152
    • 提供者:weixin_38543749
  1. TurkishMorphologicalAnalysis-Swift:土耳其形态分析图书馆-源码

  2. 形态分析 形态学 在语言学中,术语形态学是指对词的内部结构的研究。 假设每个单词都包含一个或多个词素,这些词素可以定义为具有特定含义或语法功能的最小语言单元。 一个词可以碰到形态单一的单词,即词根,也可以碰到形态复杂的单词,例如复合词或词缀形式。 Batı-lı-laş-tır-ıl-ama-yan-lar-dan-mış-ızwest-make-caus-pass-neg.Abil-Nom-Pl-Abl-Evid-A3Pl在那些不能被西方化的国家中。” 构成单词的语素以(或多或少)严格的顺
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:63488
    • 提供者:weixin_42121725
« 1 2 ... 8 9 10 11 12 13»