知识网络
该存储库包含Web会议2021年论文《的源代码和预处理数据集。
数据集
Twitter数据集
收集Twitter数据集[1]来评估社交事件检测方法。 在过滤掉重复且不可恢复的推文之后,数据集包含68,841个与503事件类别相关的手动标记的推文,分布了四个星期。 请在找到原始数据集
MAVEN数据集
MAVEN [2]是根据Wikipedia文档构建的一般域事件检测数据集。 我们删除与多种事件类型关联的句子(即消息)。 过滤后的数据集包含10,242条与154个事件类别相关的消息。 请