博客
关于我
Pytorch实践--eval 模式,每次预测相同的数据得到的概率不同
阅读量:789 次
发布时间:2019-03-25

本文共 831 字,大约阅读时间需要 2 分钟。

在使用PyTorch训练好的模型进行预测时,可能会遇到一个问题,此问题出现在模型被设置为评估模式(eval())后。具体来说,同一数据在每次预测时,概率值会出现变化。这种情况下,许多技术人员可能会感到困惑,不知道为什么相同数据的预测结果会截然不同。

分析与原因

使用eval()模式会将模型切换为评估模式,此时模型的Dropout和BatchNorm层(如果有的话)会生效。但需要注意的是,这些层必须包含在模块(_modules)中。只有当类成员的type派生于Module时,该成员才会被自动划归到_modules中。如果在设计网络时,某些包含Dropout或BatchNorm的层不被包含在模块中,那么在评估模式下,这些层将无法正常工作。

查看源码发现

通过检查模型的源码,可以发现以下情况:某些成员函数使用了nn.Dropout,尽管它应该属于模块。但是,由于某些原因,这个Dropout层不属于_modules,这就导致在评估模式下,Dropout层无法正常工作。这个问题导致每次对同一数据进行预测时,Dropout层的随机采样结果不同,从而造成概率值的变化。

解决方案

要解决此类问题,模型开发者需要确保在网络设计阶段,所有使用Dropout或BatchNorm的层都包含在模块(_modules)中。这样,在评估模式下,这些层才能正常工作。这是确保模型在评估模式下表现稳定和可靠的关键步骤。

建议开发人员在构建网络时,仔细检查每个使用Dropout或BatchNorm的层是否被正确地包含在模块中。如果某个特定的层不在模块中,应将该层所属的父容器或者整体网络结构进行检查,并确保它们被正确划归到模块中。如果在代码中没有明确地将这些层包含在模块中,可能需要手动调整模型的结构,使其符合PyTorch的模块化管理方式。

通过以上措施,可以确保模型在评估模式下,其Dropout和BatchNorm层能够正常工作,从而使得模型预测结果具有稳定性和可测量性。

转载地址:http://jjxuk.baihongyu.com/

你可能感兴趣的文章
mysql 查看锁_阿里/美团/字节面试官必问的Mysql锁机制,你真的明白吗
查看>>
MySql 查询以逗号分隔的字符串的方法(正则)
查看>>
MySQL 查询优化:提速查询效率的13大秘籍(避免使用SELECT 、分页查询的优化、合理使用连接、子查询的优化)(上)
查看>>
mysql 查询数据库所有表的字段信息
查看>>
【Java基础】什么是面向对象?
查看>>
mysql 查询,正数降序排序,负数升序排序
查看>>
MySQL 树形结构 根据指定节点 获取其下属的所有子节点(包含路径上的枝干节点和叶子节点)...
查看>>
mysql 死锁 Deadlock found when trying to get lock; try restarting transaction
查看>>
mysql 死锁(先delete 后insert)日志分析
查看>>
MySQL 死锁了,怎么办?
查看>>
MySQL 深度分页性能急剧下降,该如何优化?
查看>>
MySQL 深度分页性能急剧下降,该如何优化?
查看>>
MySQL 添加列,修改列,删除列
查看>>
mysql 添加索引
查看>>
MySQL 添加索引,删除索引及其用法
查看>>
mysql 状态检查,备份,修复
查看>>
MySQL 用 limit 为什么会影响性能?
查看>>
MySQL 用 limit 为什么会影响性能?有什么优化方案?
查看>>
MySQL 用户权限管理:授权、撤销、密码更新和用户删除(图文解析)
查看>>
mysql 用户管理和权限设置
查看>>