© 1999-2048 dssz.net 粤ICP备11031372号
[算法与数据结构] 一种面向大规模微博数据的话题挖掘方法.pdf
说明:随着微博的日趋流行,新浪微博已成为公众获取和传播信息的重要平台之一,针对微博数据的话题挖掘也 成为当前的研究热点。提出一个面向大规模微博数据的话题挖掘方法。首先对大规模微博数据进行分析,基于 Bloom Filter算法对数据进行去重处理,针对微博的特有结构,对文本进行预处理,提出改进的LDA主题模型So- cial Network LDA(SNLDA),采用吉布斯采样法进行模型推导,挖掘出微博话题。实验结果表明,方法能有效地从 大规模微博数据中挖掘出话题信息。<sinat_34886114> 在 上传 | 大小:576512