说明:NLP任务
这是我为Realyze Intelligence提供的NLP任务的解决方案。提供了一个标准格式的.txt文件,返回提供的单词,句子和段落的数量。
该解决方案是用Java编写的,并从命令行运行。不需要依赖项。
思考过程
起初,我认为根据结尾处是否有空格来对单词进行计数就足够了,但是这种方法必须更改为考虑到极端情况。从示例文本可以看出,该文本包含对话-并非每个句子都必须以句号结尾。同样,使用ENE这样的缩写时,再次计数周期是无效的,因为它们将被视为句子。
我检查完文本后的一个很好的解决方
<weixin_42102220> 在 上传 | 大小:3072