点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 语料库分析系统
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
LJCorpus中文语料库分析软件
LJCorpus试用版本下载地址 下载地址:http://www.lingjoin.com/download/LJCorpus.rar 介绍: LJCorpus中文语料库分析软件是一套专门针对中文生语料库的加工、抽取、统计与翻译全自动的综合语料分析系统,应用了领先的汉语词法分析技术、新词发现技术、统计挖掘技术以及词语翻译对齐技术,目前,东北师范大学中文系已经成功应用该软件对新加坡的语言进行了分析,极大提高了研究的效率。 LJCorpus中文语料库分析软件的四大功能主要包括: 1. 新词发现:
所属分类:
专业指导
发布日期:2010-04-17
文件大小:12mb
提供者:
lingjoin
LJCorpus语料分析软件
这个软件可以对设定的语料库分词,提词,频度分析。便于语料的处理
所属分类:
专业指导
发布日期:2010-11-29
文件大小:12mb
提供者:
tatu11
基于角色标注的中国人名自动识别研究
该文提出了一种基于角色标注的中国人名自动识别方法.其基本思想是:根据在人名识别中的作用 ,采取 Viterbi 算法对切词结果进行角色标注 ,在角色序列的基础上 ,进行模式最大匹配 ,最终实现中国人名的识别.识别 过程中只需要将某个词作为特定角色的概率以及角色之间的转移概率.该方法的实用性还在于:这些角色信息完 全可以从真实语料库中自动抽取得到.通过对 16M字节真实语料库的封闭与开放测试 ,该方法取得了接近 98 %的 召回率.文中介绍了计算所汉语词法分析系统 ICTCLAS ,集成人名
所属分类:
互联网
发布日期:2011-04-18
文件大小:429kb
提供者:
yuqilong
语音识别技术文章.rar
第一部分 基本理论 第2章 听觉机理和汉语语音基础 2. 1 概述 2.2 听觉机理和心理 2.2.1 语音听觉器官的生理结构 2.2.2 语音听觉的心理 2.3 发音的生理机构与过程 2.4 汉语语音基本特性 2.4. 1 元音和辅音 2.4.2 声母和韵母 2.4.3 音调(字调) 2.4.4 音节(字)构成 2.4.5 汉语的波形特征 2.4.6 音的频谱特性 2.4.7 辅音的频谱特性 2.4.8 汉语语音的韵律特征 2.5 小结 参考文献 第3章 语音信号处理方法--时域处理 3.1
所属分类:
其它
发布日期:2011-05-12
文件大小:5mb
提供者:
wangjunhui1984
灵玖LJCorpus中文语料库分析软件
语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。随着互联网的爆炸式增长,中文语料库的规模也随之剧增。语言学的研究面临着各类复杂的海量数据,亟需采用信息化的手段,自动分析相关的语言数据,从而更好地研究并开发使用的自然语言信息处理系统。
所属分类:
其它
发布日期:2011-08-07
文件大小:12mb
提供者:
fw_1234
商务智能架构图表
HomeAboutDesignlol.netAdmin ARCHIVED ENTRIES FOR 数据可视化 九 27 前言:数据可视化是怎样创造出来的。可视化 Tags: 数据可视化, 信息可视化 13 Comments » 我多次被炫目的数据可视化或信息可视化震惊,在我知道这些图片背后的数据来源和创造历程后,更是为之诧异不止。它涉足制图学、图形绘制设计、计算机视觉、数据采集、统计学、图解技术、数型结合以及动画、立体渲染、用户交互等。相关领域有影像学、视知觉。空间分析、科学建模等。 这是创造
所属分类:
其它
发布日期:2011-10-21
文件大小:11kb
提供者:
sxfmol
论文检测系统软件,免费分享 反抄袭
现在论文抄袭、学术打假成为学术界、媒体关注的话题。有的学者心存侥幸,有的学者对学术严谨性未加重视等,以至于被相关人士揭发举报,最终身败名裂。而许多毕业生因为种种原因,并未对论文抄袭现象加以重视,最后不能顺利毕业,荒废了几年时间,得不偿失。现在提供论文检测的机构主要来源于三大中文期刊数据库,即中国知网论文检测系统,万方论文相似性检测系统,维普通达检测系统。 现在应用较多的是中国知网和万方的检测系统,但是两者都不是免费的,其中,中国知网的费用相对高,在淘宝上一篇硕士论文的检测费用达到两百元。介于此
所属分类:
教育
发布日期:2012-03-03
文件大小:3mb
提供者:
baidengdao
论文相似度检测系统软件
现在论文抄袭、学术打假成为学术界、媒体关注的话题。有的学者心存侥幸,有的学者对学术严谨性未加重视等,以至于被相关人士揭发举报,最终身败名裂。而许多毕业生因为种种原因,并未对论文抄袭现象加以重视,最后不能顺利毕业,荒废了几年时间,得不偿失。现在提供论文检测的机构主要来源于三大中文期刊数据库,即中国知网论文检测系统,万方论文相似性检测系统,维普通达检测系统。 现在应用较多的是中国知网和万方的检测系统,但是两者都不是免费的,其中,中国知网的费用相对高,在淘宝上一篇硕士论文的检测费用达到两百元。介于此
所属分类:
其它
发布日期:2013-10-04
文件大小:3mb
提供者:
cscdn
《计算语言学》讲义-中科院 刘群教授
中国科学院研究生院信息学院 硕士生课程 刘群教授主讲。 本课程为计算机软件与理论专业研究生的专业基础课。通过本课程的学习,使同学掌握计算语言学的基本理论,了解自然语言处理的常用模型和算法,初步具备从事相关领域研究工作的能力。 内容提要: 第一章 概论 介绍计算语言学的研究对象,研究手段,学科特点,历史趋势等。 第二章 词典 词典编纂,组织,检索等。 第三章 语料库 语料库收集,整理,对齐,检索,基于语料库的知识获取。 第四章 词法分析 正则语法与有限状态自动机,HMM与词性标注,汉语词语切分,
所属分类:
专业指导
发布日期:2013-11-21
文件大小:9mb
提供者:
yuhentian
手机评论文本语料库
商城手机评论文本,华为荣耀手机(2款手机评论文本),小米红米手机,OPPO手机各1000条,共4000条。可作为中文分类的训练语料库,用于情感分析,推荐系统等领域。最新的评论资源。
所属分类:
其它
发布日期:2018-01-04
文件大小:1mb
提供者:
c3438727825
基频包络的音节聚类分析
对汉语TTS 系统的大规模语料库做了基本的韵律参数统计, 分析了音节的韵律特征与其所在的韵律结构位 置以及韵律结构边界的关系. 进一步, 对有调音节样本集基于基频包络采进行聚类, 通过听辨实验检验了聚类结果, 并分析了音节聚类与其所在韵律结构之间的对应关系
所属分类:
专业指导
发布日期:2008-12-30
文件大小:255kb
提供者:
aouming
Coae中文微博语料库
中文微博语料库2014.包含COAE2014会议五个任务的评测数据,任务1 :面向新闻的情感关键句抽取与判定 在给定新闻集合(每篇文章已切成句子)中,判别每篇文章的情感关键句 。 任务2:跨语言情感倾向性分析 本任务是对给定多语言篇章级数据集 ,要求参加系统自动分析多语言篇章级数据集每个情感句的情感倾向性,即(褒义、贬义或者中性)。 任务3:微博情感新词发现与判定 本任务是对给定大规模的微博句子集 ,要求参赛系统自动发现新的词语( 不在给定的词典以内),以及每个词语的情感倾向性,即褒义、贬义或
所属分类:
机器学习
发布日期:2018-10-14
文件大小:42mb
提供者:
qq_24435185
通过文本情感分析和识别技术可视化中文博客中的情感
近年来,关于博客情绪分析和识别的研究变得越来越重要。在这项研究中,我们基于中文博客情感语料库(Ren-CECps),从不同的文本级别(单词,句子和段落)分析并比较了博客情感可视化。然后,针对实际应用设计了博客情感可视化系统。机器学习方法适用于不同文本级别的博客情感识别的实现。基于情感识别引擎,博客情感可视化界面旨在提供更直观的博客情感显示,从而可以为博客作者检测情感并快速捕获情感变化。此外,我们通过比较五种不同模式下的分类算法对句子情感识别的性能进行了评估,从而证明了互补朴素贝叶斯模型对句子情感
所属分类:
其它
发布日期:2021-03-18
文件大小:2mb
提供者:
weixin_38624628
汉维医疗平行语料库构建及特征分析
面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统。目前已建成110多万字、2.6万句汉语医疗语料,3000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁。
所属分类:
其它
发布日期:2021-03-14
文件大小:1mb
提供者:
weixin_38746574
pablobernabeu.github.io:网站https:pablobernabeu.github.io(请参阅https://github.compablobernabeuwebsite-files的后端文件)。 毕奥:在完成了心理
pablobernabeu.github.io:网站https:pablobernabeu.github.io(请参阅https://github.compablobernabeuwebsite-files的后端文件)。 毕奥:在完成了心理语言学研究硕士学位之后,我现在是认知心理学的博士研究生和研究生助教。 我正在研究语言和感觉运动脑系统如何支持概念处理。 我使用行为和脑电图实验,语料库分析,统计和编程等方法
所属分类:
其它
发布日期:2021-02-23
文件大小:61mb
提供者:
weixin_42097967
Exmaralda-源码
埃玛拉达 EXMARaLDA是用于在计算机上处理口腔语料库的系统。 它由一个转录和注释工具(Partitur-Editor),一个用于管理语料库的工具(Corpus-Manager)以及一个查询和分析工具(EXAKT)组成。 EXMARaLDA的功能包括: 时间对齐的数字音频或视频灵活批注,可自由选择类别,通过元数据对语料库进行系统的文档化以各种布局和格式(批注,文档)灵活输出转录数据,计算机辅助查询抄录,批注和元数据它使用基于XML的数据格式,允许与其他工具(例如Praat,ELAN,
所属分类:
其它
发布日期:2021-02-17
文件大小:91mb
提供者:
weixin_42103587
构建和剖析中英三元组可比语料库
由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到应用系统的性能。为了克服平行语料库固有的缺陷,本文提出了构建和剖析中英三元组可比语料库的技术研究。这项研究采用可比语料库和语言自动剖析技术,使用统计和规则相结合的方法,对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库中的本族英语和中式英语进行统计分析。在此基础上,利用n-元词串、关键词簇等自动抽取技术挖掘基于本族语言模型的双
所属分类:
其它
发布日期:2021-02-09
文件大小:416kb
提供者:
weixin_38601878
PDF-Search-Engine-C-:这是用C ++创建的PDF搜索引擎,是南方卫理公会大学CSE2341数据结构课程的最终项目-源码
C ++中的PDF搜索引擎 该程序是C ++编写的TF-IDF搜索引擎,用于南部卫理公会大学的CSE 2341最终项目。 UI是用ncurses制作的,并且使用Poppler C ++解析库来解析PDF。 可以使用哈希表和AVL树创建索引,但是两个索引都具有相对相似的解析和搜索时间。 用法 程序运行后,用法相对不言自明。 转到“添加文件”部分以添加PDF,将通过删除停用词,阻止词干并将其添加到指定的数据结构中来分析其内容。 该程序还列出了PDF语料库中最常用的单词。 正在搜寻 用户可以使用“搜索
所属分类:
其它
发布日期:2021-02-04
文件大小:549kb
提供者:
weixin_42139252
greekLit:一种在elasticsearch中索引古代语料库的系统-源码
规范希腊语 发展在正在发生。 这只是一面镜子。 建立 该存储库包含来自perseus的规范性greekLit集合作为子模块,因此在进行任何分析/索引之前,请初始化/更新子模块: git submodule update --init 第一遍: 解析本垒打正常,但尚未解析所有书籍中的所有行。 正在处理...: # gives back all lines of homers # represented as json data points ./greek_lit.rb 去做:
所属分类:
其它
发布日期:2021-02-04
文件大小:3kb
提供者:
weixin_42179184
ODSC_text_analysis:具有空间性和文本性的探索性文本分析材料-源码
使用spaCy和textacy在Python中进行探索性文本分析 斯科特·贝利(Scott Bailey) 数字研究与奖学金图书馆员版权和数字奖学金中心(CDSC) 北卡罗来纳州立大学图书馆 2021年东部开放数据科学会议讲习班 Python生态系统有许多用于自然语言处理(NLP)的库,这会使开始将文本作为数据进行分析变得令人困惑。 该研讨会将介绍spaCy,它是NLP的强大而自以为是的库,可促进文本数据的分析,而textacy是增加信息检索和语料库分析功能的库。 通过完成此研讨会,您将开发核
所属分类:
其它
发布日期:2021-03-28
文件大小:11mb
提供者:
weixin_42115003
«
1
2
3
»