为了实现文本代表性语义词汇的抽取,提出一种基于词组主题建模的文本语义压缩算法SCPTM(semantic compression based on phrase topic modeling) 。该算法首先将代表性语义词汇抽取问题转化为最大化优化模型,并通过贪心搜索策略实现该模型的近似求解。然后,利用词组挖掘模型LDACOL 实现词组主题建模,得到SCPTM 算法的输入参数;同时,针对该模型中词组的主题分配不稳定的问题进行改进,使得取得的代表性语义词汇更加符合人们对语义的认知习惯。最后,将改进L
针对传统推荐方法在短文本处理方面的不足,提出一种基于用户兴趣模型与会话抽取算法的微博推荐方法。该方法应用基于归一化割加权NMF的微博用户兴趣模型获取用户—主题矩阵,产生用户感兴趣的微博主题,结合基于Single-Pass 聚类模型的会话在线抽取算法SPFC(single-pass based on frequency and correlation)获取微博的会话队列,并与用户感兴趣的微博主题进行相似度计算,最后得到实时的微博推荐结果。实验表明,此方法能有效地进行微博推荐。
针对传统推荐方法在短文本处理方面的不足,提出一种基于用户兴趣模型与会话抽取算法的微博推荐方法。该方法应用基于归一化割加权NMF的微博用户兴趣模型获取用户—主题矩阵,产生用户感兴趣的微博主题,结合基于Single-Pass聚类模型的会话在线抽取算法SPFC(single-pass based on frequency and correlation)获取微博的会话队列,并与用户感兴趣的微博主题进行相似度计算,最后得到实时的微博推荐结果。实验表明,此方法能有效地进行微博推荐。