摘要: 很简单的一个问题,当softmax的变量过大或过小怎么办,比如 softmax([100,101,102])的结果是什么? 有一个方法计算上溢的情况,也就是a56爆大奖在线娱乐变量都减去最大值,然后做softmax, a56爆大奖在线娱乐softmax([100,101,102])和softmax([-2,-1,0])是一样的结果 阅读全文
posted @ 2020-02-12 15:23 嶙羽 阅读(668) 评论(0) 推荐(0) 编辑