@songying
2018-11-08T10:53:51.000000Z
字数 397
阅读 998
deep-learning
为了解决分母上溢下溢问题, 我们采用 来解决, 其中 ,那么 必然有一个为1, 这就免除了上溢和下溢的可能性。
但有时,分子产生下溢仍会导致表达式结果为0, 此时我们计算 时, 先计算 softmax, 再把结果传给log函数, 会错误得到 −∞, 因此我们需要实现一个函数来变换这个结果以稳定 log softmaxmax