@anboqing
2015-04-14T09:52:53.000000Z
字数 359
阅读 2045
未分类
当特征是连续变量时,无法用计数方法获得先验概率,有两种方法可以解决这个问题:
1.一个技巧是将连续值变为离散值,计算区间的概率。比如将F1分解成[0, 0.05]、(0.05, 0.2)、[0.2, +∞]三个区间,然后计算每个区间的概率
2.当样本太小,不足分割区间时:
通过样本计算出均值和方差,也就是得到正态分布的密度函数。有了密度函数,就可以把值代入,算出某一点的密度函数的值。
比如,男性的身高是均值5.855、方差0.035的正态分布。所以,男性的身高为6英尺的概率的相对值等于1.5789(大于1并没有关系,因为这里是密度函数的值,只用来反映各个值的相对可能性)。