Ucto-基于规则的令牌生成器
Centre for Language and Speech technology, Radboud University Nijmegen
Induction of Linguistic Knowledge Research Group, Tilburg University
网址: :
Ucto标记文本文件:将单词与标点符号分开,并拆分句子。 这是几乎所有自然语言处理应用程序的首要任务之一。 Ucto提供了其他几个基本的预处理步骤,例如更改大小写,您都可
数据集:荷兰的COVID-19病例数
CoronaWatchNL收集了荷兰的COVID-19疾病计数病例数。 每天都会从各种来源收集数字,例如 , , 和。 该项目标准化并发布数据,并使它可查找,可访问,可互操作和可重用(FAIR) 。 我们旨在收集完整的时间序列,并准备可重复分析和学术用途的数据集。
荷兰语:
CoronalWatchNL在Nederland的COVID-19上进行了测试。 Dagelijks worden de cijfers verzameld van het ,
解析荷兰语
荷兰语解析器,用于生成节点。
安装
该软件包仅适用于ESM:需要使用Node 12+才能使用它,并且必须将其import而不是require d。
:
npm install parse-dutch
采用
import inspect from 'unist-util-inspect'
import { ParseDutch } from 'parse-dutch'
var tree = new ParseDutch ( ) . parse (
'Kunt U zich