@lancelot-vim
2016-05-24T17:09:07.000000Z
字数 1110
阅读 1634
模式分类
假设我们要实现一个Parzen估计,共有n个d维度的样本,都是随机从c个类别中选取的,这种情况下,输入层由d个输入单元组成,每个输入单元都与n个模式单元相连。每一个模式单元都与c个类别中的其中之一相连。
从输入层到模式层的连线表示为可以修改的权系数,这些系数都可以通过训练得到。这些权重可以用一个向量表示,但为了与神经网络术语保持一致,统一改用向量w来表示,而一个类别单元都计算与之相连的各模式单元的输出结果和。
首先我们先把样本进行归一化处理,即,经过归一化后的样本置于输入层单元上。同时,连接输入单元和第一个模式层单元的那些连接被初始化为,然后从模式层的第一个单元到类别层中代表的那个类别建立了一个连接,如图所示
如此,当n个随机样本遍历完成之后,可以得到一个输入层到模式层的全连接网络,和一个模式层到类别层的一个稀疏连接网络
PNN训练算法
begin initialize j <- 0, n, <- 0, j = 1, ... n; i = 1, ..., c
do j <- j + 1
<-
<-
if then <- 1
until j = n
end
训练完成之后,对于测试样本,首先对测试样本进行归一化处理,然后供给输入节点,之后计算"净激活(net activation)"
PNN分类算法
begin initialize k <- 0, x<-测试数据
do k <- k + 1
<-
if then <-
until k = n
return class <-
end
PNN的好处之一就是学习速度很快,因为规则简单,而且新的训练样本容易被加入以前训练好的分类器中,但是它的关键问题实际上和Parzen窗一样,就是选取体积序列(在这里是选取),如果过大,会导致平滑效果太过明显,太小会导致变化特别剧烈,分类效果都不会太好,实际上可以使用交叉验证方法来确定一个比较恰当的值