bayes-python 具体代码见:bayes_iris.py 我直接用了iris_data数据集,每种花我选取前45条数据当做训练集,剩下5条数据另外存入测试集iris_test_data,并将数据随机手动打乱 测试集如下: 因为这个数据集是连续性属性,所以需要利用概率密度函数。 具体实验步骤为: (1)先读取数据集 (2)计算训练数据集上每个类别的各个特征属性上的均值和方差 (3)开始对测试数据集进行分类 (4)首先估计先验概率,这里我每个类别所占整体数据集的比例是一样的 (5)利用概率密度函数,计算测试数据集上各个属性在每个类别上的条件概率 (6)计算后验概率=先验概率*条件概率 (7)比较在各个类别上的后验概率,取最大值,则分为这个类别 结果如下: 我们将结果与测试集比较发现结果完全正确!