本代码实现了朴素贝叶斯分类器(假设了条件独立的版本),常用于垃圾邮件分类,进行了拉普拉斯平滑。
关于朴素贝叶斯算法原理可以参考博客中原理部分的博文。
#!/usr/bin/python
# -*- coding: utf-8 -*-
from math import log
from numpy import*
import operator
import matplotlib
import matplotlib.pyplot as plt
from os import listdir
def
使用IBM Watson Studio Local在Hortonworks Data Platform上发现,训练和部署垃圾邮件过滤器模型
该代码模式的目的是演示数据科学家如何利用IBM的Watson Studio Local(以前称为Data Science Experience Local或DSX)利用Hortonworks Data Platform(HDP)的远程Spark集群和计算环境来训练和部署垃圾邮件过滤器模型。本地)。
垃圾邮件过滤器是使用自然语言处理和机器学习算法构建的分类模