您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 不平衡数据集分类

  2. 面对不均衡数据集多分类 两分类的极限学习机源码
  3. 所属分类:其它

    • 发布日期:2013-07-05
    • 文件大小:857kb
    • 提供者:zhaoshuobupt
  1. Credit_Card_Fraud_Detection-源码

  2. Credit_Card_Fraud_Detection 语境 信用卡公司必须能够识别欺诈性的信用卡交易,以免向客户收取未购买商品的费用,这一点很重要。 内容 数据集包含欧洲持卡人在2013年9月使用信用卡进行的交易。 此数据集显示了两天内发生的交易,在284,807笔交易中,我们有492起欺诈。 数据集高度不平衡,阳性类别(欺诈)占所有交易的0.172%。 它仅包含数字输入变量,它们是PCA转换的结果。 遗憾的是,由于机密性问题,我们无法提供有关数据的原始功能和更多背景信息。 功能部件V1
  3. 所属分类:其它

    • 发布日期:2021-03-26
    • 文件大小:11kb
    • 提供者:weixin_42138376
  1. credit-card-fraud-detection:使用Sagemaker的高度不平衡数据集的二进制分类器,具有召回和精确定位的功能-源码

  2. 用于信用卡欺诈检测的二进制分类器 使用鼠尾草 笔记本从下载cc欺诈培训数据 显示具有召回和精确定位的高度不平衡数据集的处理。
  3. 所属分类:其它

    • 发布日期:2021-03-26
    • 文件大小:319kb
    • 提供者:weixin_42161497
  1. Imbalanced-Dataset-源码

  2. 不平衡数据集 该文件说明了处理不平衡数据集的欠采样和过采样方法 使用的图书馆 熊猫imblearn numpy
  3. 所属分类:其它

  1. predicting-behavior-of-new-costumers-based-on-cookies-data-源码

  2. 基于Cookies数据的新服装消费者行为预测 目标 该项目的目标是建立分类器,以基于Cookie的历史记录来预测将来的购买行为,并确定哪些变量对购买最有帮助。 数据集说明 数据集包含在感兴趣的时期内购买产品或未购买产品的用户的历史记录。数据集包含54,584条记录和14个属性。 该数据集的一些特征是: is_buyer:一种功能,是二进制变量,编码为0或1,类似于目标功能。其余记录为定量值。 buy_freq:具有许多空值。 last_buy和last_visit:包含非常相似的信息。
  3. 所属分类:其它

    • 发布日期:2021-03-22
    • 文件大小:989kb
    • 提供者:weixin_42137539
  1. colorectal-prognostication:数据集和代码展示了我们的项目,该项目利用机器学习技术来预测结直肠癌-源码

  2. 预后大肠癌 该项目展示了我们在论文中使用的方法:使用机器学习技术对结直肠癌的复发进行预后,可在(链接)上找到。 所需的库 Tsfresh-从时间序列中提取表格特征所必需。可以通过pip install tsfresh 学习失衡-可选;仅当您希望使用欠采样和过采样技术来解决不平衡数据集问题时。可以按照文档进行安装 脾气暴躁的 大熊猫 Scikit学习 Matplotlib 数据集 数据集是合成的,由表格和时间序列数据组成。这两个数据集都是使用dataset/create_simul_data.ip
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:606kb
    • 提供者:weixin_42132354
  1. Hard-Disk-Drive-Failure-Detection:任务是预测不同供应商的硬盘驱动器发生故障-源码

  2. 硬盘驱动器故障检测 任务是预测不同供应商的故障硬盘驱动器。 描述: 这是二进制类分类问题,我们必须预测硬盘故障。 这些是通过使用在硬盘驱动器正常运行期间记录的属性来预测的。 这些属性称为SMART(自我监视和报告技术),它是计算机HDD中包含的监视系统。 此预测的目的是降低故障率,因为HDD供应商会采取节省成本的措施,并且主机系统上运行的软件可能会通知用户,因此可以采取预防措施来防止数据丢失,并且可以更换故障驱动器并数据保持完整性。 当这些属性中的某些属性超过阈值时,HDD被认为是失败或严重的
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:579kb
    • 提供者:weixin_42129797
  1. rethinking_dsc:项目针对高度不平衡的数据集测试一些有关DSC损失的玩具示例-源码

  2. 使用3D补丁重新考虑极不平衡数据集的损失函数 该项目将针对高度不平衡的数据集测试一些有关DSC损失的玩具示例。 自从Miletari等人在2016年引入所谓的骰子损失函数以来。 [ ],我们一直在医学成像领域将其用于高度不平衡的数据集,以改善结果。 从经验上看,情况确实如此,但是我们可以实际地进行分析吗? 它与Sudre等人的广义骰子丢失有何关系。 [ ]? 有什么更好的选择吗? 与焦点损失相比如何? 该存储库是对论文的扩展,基于该论文可以在不平衡性很高的几个数据集上获得经验结果。 [
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:44kb
    • 提供者:weixin_42131798
  1. credit_card_fraud_detection:信用卡欺诈检测-无监督异常检测-分类不平衡-自动编码器-源码

  2. 作者:安德烈·维特(Andre Veit) 领英(LinkedIn): : 电子邮件: 信用卡欺诈检查 不平衡数据的分类和异常检测 关于本笔记本 欺诈并不是什么新鲜事物,事实上,据《您的钱》网站称,第一个欺诈记录发生在公元前300年。 如今,在互联网和数字化以惊人的速度增长的世界中,每天都通过网络实现数百万笔交易和其他操作。 这意味着欺诈者有很多机会。 幸运的是,相对而言很少。 不幸的是……这个事实使他们很难被抓住。 本笔记本的目的是探索几种处理异常检测和高度不平衡的数据集的方法。
  3. 所属分类:其它

  1. GAN-based-data-augmentation-for-improved-hate-speech-detection:SeqGAN数据扩充-源码

  2. 基于GAN的数据增强,可改善仇恨语音检测 SeqGAN数据增强用于改善仇恨语音检测,我们将SMOTE过采样方法用作基准。 我们还使用了四个训练有素的分类器-SVM,LSTM,BERT,Logistic回归。 要求 Tensorflow 1.15.0 Python 3.7 分类模型 如果要使用分类模型,请直接单击分类模型文件夹,在其中您将看到两个.ipynb文件,其中包含所有4个分类模型。 模型中使用的csv格式的训练集,测试集和验证集可以在数据集文件夹中看到。 SMOTE过采样 如果要实现SM
  3. 所属分类:其它

  1. MAP583--age_estimation-源码

  2. DL-DIY潜在项目构想 将此问题归结为回归或分类 使用进行分类 使用进行回归 寻找处理不平衡数据的策略 年龄估算PyTorch 基于PyTorch的CNN实现,用于从人脸图像估算年龄。 当前仅支持APPA-REAL数据集。 在可以找到类似的基于Keras的项目。 要求 pip install -r requirements.txt 演示版 需要网络摄像头。 有关详细选项,请参见python demo.py -h 。 python demo.py 使用--img_dir参数,该目录中的图像
  3. 所属分类:其它

  1. Spam-Classification-Project:针对我的AI入门课程的学期末项目的Spam分类器项目。 我们是四人一组。 我处理过所有朴素贝叶斯模型-源码

  2. 垃圾邮件分类器 使用CountVectorizer和Tf-idf Vectorizer构建的垃圾邮件分类器。 数据集来源: ://www.kaggle.com/uciml/sms-spam-collection-dataset我们在项目中采用了Upsampling和Cross-val,并建立了以下模型: 使用CountVectorizer的不平衡数据集的朴素贝叶斯模型 使用Tf-idf Vectorizer的不平衡数据集的朴素贝叶斯模型 使用CountVectorizer进行交叉验证的朴素贝
  3. 所属分类:其它

  1. 有毒评论分类:使用BERT转移学习对文本进行多标签分类不平衡数据的重新采样-源码

  2. 使用预训练的Google BERT模型对有毒评论(Kaggle的竞争数据集)进行多标签分类 keras-bert.ipynb :在Google的BERT模型的顶部微调一个多标签分类器(固定其参数)。 将Hamming损失与自定义定义的召回率指标一起使用(衡量分类器正确预测的阳性标签的比例),以评估分类器的性能。 use-model.ipynb :使用微调的多标签分类器进行预测 colab-tpu :文件夹包含用于在Colab TPU上训练模型的笔记本(注意:在对Colab TPU进行训练之前,
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:32kb
    • 提供者:weixin_42097557
  1. 不平衡数据集-源码

  2. Bu不平衡数据集uygulamasındamüşterilerin期限deposit'e evet veyahayırdemelerini inceledim.Dataseti burada bulabilirsiniz。
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:381kb
    • 提供者:weixin_42120541
  1. Python-DataScience-CookBook:Python数据科学食谱-源码

  2. Python-DataScience-CookBook Python数据科学食谱 Python环境 Jupyter笔记本 谷歌合作 Scikit-了解速查表- 各种ML交易算法代码- 不平衡分类-https: 基于树状模型- 数据集 上面的链接包含与NLP,自动驾驶,推荐系统相关的数据集
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:10mb
    • 提供者:weixin_42139429
  1. 学习失衡的学习-源码

  2. 论文清单 民意调查 从不平衡数据中学习:挑战和未来方向(调查文章2016) My Summary | My Code key Word :学习失衡,异常检测 绩效衡量 在不平衡数据集上评估二进制分类器时,精度调用图比ROC图更具信息性 My Summary | My Code Key Word :PR图,ROC图 精确召回率与ROC曲线之间的关系 My Summary | My Code Key Word :PR图,ROC图 通过监督学习预测好的概率 My Summary | M
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:416kb
    • 提供者:weixin_42109732
  1. URECA_Main:使用TensorFlow隐私库使用差异隐私在联合学习框架中维护本地服务器数据的隐私-源码

  2. 乌雷卡 本科生研究 数据集 creditcard.csv 可以在以下链接中找到数据集: : 前处理 删除具有NaN值的行 在不使用SMOTE的情况下平衡数据集: 联合学习框架 在添加隐私之前: 添加Tensorflow隐私后: s Numair Fazili Ritwik Kanodia 特别感谢我们的研究项目主管Saurav Sen gupta博士。
  3. 所属分类:其它

  1. tensorflow-face-detection:基于mobilenet SSD的面部检测器,由tensorflow对象检测api驱动,由WIDERFACE数据集训练-源码

  2. Tensorflow人脸检测器 提供基于Mobilenet SSD(单发多盒检测器)的人脸检测器并提供预训练模型,由tensorflow,由训练。 产品特点 速度,在nvidia GTX1080 GPU上运行60fps。 内存,单次推理所需的GPU内存少于364Mb。 健壮,适应不同的姿势,此功能归功于,我手动清理了数据集以平衡精度和召回权衡。 并行,多进程视频处理可以同时推断多个输入,我测试了同时在单个GPU卡上处理4个视频,速度仍然具有竞争力,并且仍有容纳更多进程的空间。 依存关系 T
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:20mb
    • 提供者:weixin_42098104
  1. 不平衡学习:一种解决机器学习中不平衡数据集问题的Python程序包-源码

  2. 不平衡学习:一种解决机器学习中不平衡数据集问题的Python程序包
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:314kb
    • 提供者:weixin_42160424
  1. Imbalanced-Data-Classification-SMOTE:本笔记本展示了如何使用SMOTE对不平衡数据集进行分类-源码

  2. 不平衡数据分类SMOTE 该项目是在巴黎大学的数据科学小组项目的背景下完成的。 笔记本显示了如何使用SMOTE对不平衡数据集执行分类。 另一方面,R文件对数据集执行探索性数据分析。
  3. 所属分类:其它

« 12 3 4 5 »