浅析激活函数之Relu函数,relu函数
如何更好地调试神经网络?
声明:本文适用于神经网络初学者。神经网络的调试要比绝大多数程序更困难,因为大多数bug不会导致运行错误,只会导致不良的收敛。也许还会有许多看似模棱两可的错误信息:性能错误:你的神经网络没有训练好(Performance Error: your neural net did not train well.)。
如果你经验丰富,就应该知道这表示代码还需要大改动。一、处理NaN?多数情况下,NaN错误在前100次迭代中出现,原因很简单:你的学习率过高了。当学习率非常高的时候,就会在前100次迭代的时候出现NaN错误。用因子为3来降低学习率,直到前100次迭代不再出现NaN错误。这么做一旦有效,你就有了一个非常好的学习率作为开端。
根据我的经验,最好的学习率是你得到NaN错误的范围的一到十分之一。如果你在100次迭代之后碰到了NaN错误,又有两种常见原因。如果你使用的是RNN,确保你使用了梯度下降,并对梯度使用L2正则化。RNN似乎在训练早期会产生梯度,10%或更少的批次有学习峰值,此时的梯度幅值是相当高的。没有对梯度削减,这些峰值会产生NaN。
如果写的是自定义的网络层,那么很有可能因为除以0而引发NaN。另一个众所周知会产生Nan错误的层是Softmax层。Softmax计算包括分子分母的exp(x)操作,它可以用无穷大除以无穷大,会产生NaN。确保你使用了稳定的Softmax实现。 二、神经网络无法学习?一旦你没有了NaN错误,那么你的神经网络就可以在上千次迭代中平稳运行,而且不会在前几百次迭代后减少训练损失。
当你第一次构建代码库的时候,最好别使用2000次迭代。这并不是因为所有的网络可以从低于2000次迭代开始学习。相反,从开头开始编码网络很可能出现bug,在达到高迭代次数之前,你会想要过早进行调试。现在的目的是一次又一次地缩小问题范围,直到你得到了一个在2000次迭代以下训练出来的网络。幸运地是,有两种方式来降低复杂性。
将训练集大小减小到10个实例。在几百次的迭代中,在这10个实例上,神经网络通常会出现过度拟合的情况。许多编码错误不会导致过拟合的出现。如果你的网络在10个实例的训练集上没有出现过度拟合,那么确保你使用的数据挂上了正确的标签。将批次大小减小到1来检查批次计算错误。在代码中添加打印语句确保输出与你期望的一致。
通常情况下,你可以通过上面介绍的纯粹蛮力来找出错误。一旦网络可以在10个实例上训练,你可以试着让它在100个实例上训练。如果这种方式运行正常,但效果不是很好,你可以试试下面的方法。解决你感兴趣的最简单的问题。如果你想翻译句子,首先可以建立一个针对特定语言的语言模型。如果你完成了,那么试着在给出3个词语的情况下预测翻译出来的第一个词。
如果你想检测图像中的物体,那么在训练回归网络之前,你可以对图像中物体数目进行分类。在网络能够解决的棘手问题和使用最少的时间让代码得到合适的数据之间需要权衡。这个时候就要发挥你的创造能力了。将神经网络运用于其他新场景的技巧是合理使用上面介绍的两个步骤。这是一种协调机制,并且效果不错。首先,你表明这个神经网络至少可以记住几个例子。
然后这个神经网络可以泛化到更简单问题的验证集中。你慢慢在取得稳步进展时提升难度。这并没有高手第一次使用的Karpathy风格那么有趣,但至少它起作用。有时候你会碰到棘手的问题,你会发现它在2000次迭代中不会继续学习了。那很棒!但它的迭代次数很少会是这个问题之前复杂度下迭代次数的10倍。如果你发现是这种情况,尝试搜索中等水平的复杂度。
三、调整超参数现在你的网络可以学习东西了,你可能会得意忘形。你还可能发现你训练的网络并不能够解决大多数复杂的问题。超参数调整就是解决问题的关键。有些人直接下载一个CNN的包然后在他们的数据集上运行,然后告诉你说使用超参数调整并没有带来什么不同。这是因为它们使用已经存在的架构来解决已经存在的问题。如果你要解决的问题需要新的架构呢,通过超参数调整来得到良好的设置就是必须的了。
你最好确保针对你要解决的问题阅读了超参数教程,不过我还是会在下面列出一些基本思想。可视化:不要怕在训练过程中花时间编写自定义可视化工具。如果你的可视化方法效果不行,那么考虑换另一种方法。权重初始化:一般情况下,较大的初始化权重是个不错的选择,但是太大又会导致NaN。确保权重看起来“健康”。要了解这是什么意思,我建议在IPython的notebook中查看现有网络的权重值。
花些时间来观察在诸如ImageNet或Penn Tree Bank这些标准的数据集上训练的成熟的网络中成分的权重的直方图应该是什么样的。神经网络的w.r.t.输入不是不变的,特别是在使用SGD而不是其他方法训练的时候,因为SGD不是尺度不变的方法。花时间用与扩展其他方面的方式来扩展输入数据和输出标签。
在训练过程中降低学习速率几乎总会给你带来提升。最好的衰减策略通常是:在k次迭代后,每n次迭代就用学习率除以1.5,k
本文地址:http://4879931.55jiaoyu.com/show-735920.html
本文由合作方发布,不代表展全思梦立场,转载联系作者并注明出处:展全思梦
推荐文档
- 11.广东南粤(广东南粤风采36选7走势图开奖结果查询)
- 12.雅思和托福考试时间预测预测(雅思和托福考试时间预测预测是什么时候)
- 13.新西兰用什么钱币新西兰货币元和人民币的汇率(新西兰的币种与中国人民币的兑换)
- 14.socks是什么意思(Shadowsocks是什么意思)
- 15.甘肃财经大学(甘肃财经大学录取分数线预测2022)
- 16.往年中考总分多少?各科成绩如何?
- 17.犯贱是什么意思_犯贱是什么意思解释
- 18.热心的用英语怎么读
- 19.漫画老师作文500字五年级上册优秀作文
- 20.鞍山话(为什么辽宁口音比较杂)
- 21.往年年招不满的二本大学-去年没有招满的二本学校(参考)
- 22.罗永浩看过的书,罗永浩推荐的书籍
- 23.中国电信网络客服电话,电信宽带电话客服
- 24.平行线的性质
- 25.公共汽车站简笔画_汽车简笔画
- 26.工业设计专业就业(工业设计专业就业前景怎么样)
- 27.往年属兔的多大岁数(属兔人往年多大)
- 28.新宾高中(新宾高中:青春成长的摇篮)
- 29.2022长沙民政职业技术学院分数线预测是多少分
- 30.湘西职院(湘西职院:探秘百年校史)
- 31.学播音主持大概需要多少钱,一般要花费多少
- 32.往年商务智能手机十大品牌排行榜-商务智能手机哪个牌子好
- 33.无欲则刚是什么意思;无欲则刚是什么意思?
- 34.交城中学(交城中学2022中考录取分数线预测)
- 35.西南政法大学属于什么级别的学校,西北政法大学属于什么档次
- 36.LZCS是什么意思LZCS是什么英文的缩写(lzcs是什么意思lzcs是什么英文的缩写)
- 37.iron是什么意思
- 38.优秀中队主要事迹材料
- 39.华东师范大学招生官网
- 40.2014安徽高考理综(2014安徽高考理综300分怎么分配)
- 41.防冻液保质期几年(防冻液保质期)
- 42.福建的大学排名一览表(福建省大学往年最新排名)
- 43.纠结什么意思_一个人纠结什么意思
- 44.往年大专报名入口官网(正在招生的全日制大专学校)
- 45.春节送礼送什么好_春节送礼送什么好长辈
- 46.幼儿园家长寄语鼓励孩子的话简短2篇
- 47.上海电力学院吧(国家电网直属的专科学校)
- 48.形容想人想的吃不下饭的成语(形容想人想的吃不下饭的成语是什么)
- 49.高考能源与环境系统工程专业未来就业前景和就业方向怎么样(解读)
- 50.沈阳科技学院是几本?是一本还是二本?(附辽宁省本科院校一览表
- 51.学幼师有前途吗(为什么说十个幼师九个婊)
- 52.家长试卷签字评语范文
- 53.学信网是干什么的有什么用(学信网是干什么的,有什么用)
- 54.西南财经大学怎么样(西南财经大学怎么样在全国排名第几)
- 55.鲁迅的社戏主要内容是什么
- 56.往年高考417分能上什么大学,高考417分可以上什么学校
- 57.横幅简笔画卡通
- 58.南华大学在哪
- 59.水文与水资源工程专业未来的发展方向和就业前景怎么样
- 60.师范类考研有哪些学校
- 51.独山基长现再怎么样,基长镇镇长为黄金果倾情代言
- 52.oppos39(oppos39忘记开机密码)
- 53.哈尔滨供电段怎么样,从70后到00后千里铁道线上
- 54.手机开不了机是什么原因,我的机子开不了机屏幕无反应,好像是黑屏请问是什么原因,,搜狗
- 55.中国移动olt怎么注册,ONU注册和授权认证
- 56.索尼爱立信官网首页(爱立信,索尼)
- 57.学习表情包,一组学习专用表情包
- 58.92002con,年内通胀或达10000倍
- 59.19148期双色球五种走势图,图感觉走势图
- 60.中国电建集团网上怎么上传标书,上传招标公告上传招标采购平台
- 61.西宁公交公司招聘怎么报名,学生乘公交车该如何实名认证
- 62.供电局不倒班什么岗位,国家电网人力资源招聘
- 63.高阳北二环公园叫什么,汇博上谷大观在高阳谁更胜一筹
- 64.商务局给的路由怎么设置,拥有这款路由器
- 65.永登武胜译有什么好玩的,丝路古镇武胜驿
- 66.不良人资质怎么分类,画江湖之不良人
- 67.曹县北街安置区在哪里,北街安置房工地破土开挖
- 68.肥东双桥新村什么时候开工的,咱肥东这4条公交线路调整
- 69.南宁梁村发生了什么事,南横高速公路第八合同段节后施工快马加鞭
- 70.抚顺哪里有收废卷材的,中国最牛的新材料企业有哪些

