i. 朴素贝叶斯分类器
朴素的贝叶斯分类器认为各个类别下属性均为相互独立,对于任一 $\boldsymbol x$,有:
$$ P(\boldsymbol x \ | \ c) = \prod_{d=1}^{N} P(x_d \ | \ c) $$
因而能最小化分类错误率的朴素贝叶斯最优分类器为:
$$ h^*(\boldsymbol x) = \argmax_{c \in [1, C] \cap \Z} P(c) P(\boldsymbol x \ | \ c) = \argmax_{c \in [1, C] \cap \Z} P(c) \prod_{d=1}^{N} P(x_d \ | \ c) $$
ii. $P(c)$ 的求法
iii. $P(x_d \ | \ c)$ 的求法
iv. 朴素贝叶斯分类器的使用方法
v. 朴素贝叶斯分类器的使用效果
i. 缺失离散属性样本的影响
ii. 修正方法:拉普拉斯修正
对 $P(c)$ 的求法,为每个类别增加一个样本:
$$ P(c) = \frac {|D_c|+ 1}{|D|+C} $$
对 $P(x_d \ | \ c)$ 的求法,为当前离散属性 $d$ 的每个取值增加一个样本($V_d$ 为离散属性 $d$ 的各个可能取值构成的集合):
$$ P(x_d \ | \ c) = \frac {|D_{c} \cap D_{[d:x_d]}| + 1}{|D_c| + |V_d|} $$
i. 缺失连续属性样本的影响
ii. 修正方法
i. 独依赖估计(ODE)
独依赖估计 (One-Dependent Estimator, ODE) 是半朴素贝叶斯分类器最常用的一种策略,其假设每个属性 $d$ 在类别之外,最多依赖于一个其他属性(记作 $pa_d$):
$$ P(\boldsymbol x \ | \ c) \propto \prod_{d=1}^{N} P(x_d \ | \ c, x_{pa_d}) $$
换句话说,如果把类别本身都算成一个节点,半朴素的依赖关系就构成了类似网络的结构,如下图(NB = Naive Bayesian)。