开发工具:
文件大小: 984kb
下载次数: 0
上传时间: 2021-02-13
详细说明:资料集
用于训练和验证模型的Twitter数据集是密歇根大学Kaggle竞赛数据集和Neik Sanders创建的“ Twitter情感语料库”的组合。 这些数据集总共包含1,578,627条标记为正或负的推文。 您可以获取数据集!
我们还在嵌入层中使用了GloVe(单词表示的全球向量)进行了预训练。(您可以下载Twitter的Glove ^^
火车
我们通过多种方式处理数据,例如:
URL被标记替换。
连续重复两次以上的任何字母都将被该字母的2次重复替换(例如,“ sooooo”被替换为“ soo”)
使用dicos数据集修复错误的单词
几个表情符号被代币替换
所有推文均小写。
我们结合使用LSTM和CNN
结果
我们得到的准确性因素到83,7%,在这种高8.5%, 用相同的数据集。
注意:该项目中的所有文件都在运行
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.