您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. nlp-datasets:用于自然语言处理(NLP)的带有文本数据的自由公共领域数据集的字母顺序列表-源码

  2. nlp数据集 自由/公共领域数据集的字母顺序列表,其中包含用于自然语言处理(NLP)的文本数据。 如果您正在寻找带注释的语料库或树库,请参阅底部的源,此处的大多数内容只是原始的非结构化文本数据。 数据集(英语,多语言) :截至2011年7月11日的所有公共可用Apache Software Foundation邮件档案(200 GB) :包括2004年8月从blogger.com收集的19,320个博客作者的帖子。681,288个帖子和超过1.4亿个单词。 (298 MB) 由568454
  3. 所属分类:其它