媒体意见分析器
主要目的是帮助来自世界各地的科学家从社交媒体评论中评估和分析社会观点。想法是使用文本嵌入算法对注释进行矢量化,然后将其用于聚类,分类,动态分析以及与参考文本的相似度比较。该方法已在Reddit平台上的数据上进行了测试。
储存库结构
文件夹
描述
预处理
预处理从Reddit下载的数据
网路应用程式
streamlit web_app
伯特
测试sBert:矢量化,分类,cos_sim,聚类
doc2vec
测试doc2vec:矢量化,分类,cos_sim
使用
测试USE:矢量化