顺序连续模式挖掘
这个问题的目的是让您更好地了解根据您在课堂上学到的知识,将模式挖掘算法应用于实际应用程序。
了解一个新问题并设计一种算法来解决。
实现频繁的连续顺序模式挖掘算法,以从文本语料库中挖掘频繁的短语。
问题定义
连续的顺序模式是一个项目序列,经常在许多序列的数据库中显示为连续的子序列。 例如,如果语料库是
good fish sandwich and french fries
disgusting fish sandwich but good french fries
thei
自动短语:从大量文本语料库中自动进行短语挖掘
刊物
如果您使用的是我们的工具,请引用以下两篇论文。 谢谢!
尚静波,刘加禄,姜萌,任翔,Clare R Voss,韩佳玮,“”,被IEEE Transactions on Knowledge and Data Engineering,2018年2月接受。
刘加鲁*,尚静波*,王驰,任翔和韩佳伟,“”,2015年ACM SIGMOD国际数据管理大会(SIGMOD'15),澳大利亚墨尔本,2015年5月。(*同样贡献, )
近期变动
2020.06