随着Internet的发展,信息量呈指数增长,自动文本摘要技术变得越来越重要。 目前,大多数关于自动摘要技术的研究都应用于常见的语言,例如中文和英文,但在资源匮乏的语言中却很少。 在本文中,我们构建了印尼语自动摘要数据集,并对印尼语自动摘要进行了相关研究。 并且在本文中,我们提出了一种基于句子相似度聚类的高效的基于提取的自动文本摘要方法。 基于聚类的思想,本文考虑了句子的语义,并根据句子与句子之间的相似性对句子进行聚类。 根据规则提取摘要,最后得到摘要结果。 该方法不仅保证了摘要的完整性,重要性