|      1xjtu001 OP 第一次用 github 上传东西,不知道能不能打开哦 | 
|      2xjtu001 OP v2ex 竟然不能发图,有点懵,没法上传效果图 | 
|      3ivechan      2019-05-06 21:01:55 +08:00  3 ANN 和 DNN 这个概念先纠正一下。 ANN 应该是 artificial neural network,是比较广泛的概念,包含了 DNN。 DNN 是 deep neural network,有时候也称为 MLP,一般与 CNN, RNN 做区分。 你这里应该是三层网络( DNN )和单层网络(你说的 ANN )对比, 建议你把 DNN 中的 dropout 和 BatchNorm 先去掉,特别是 dropout ( 0.5 )可能太激进了。 另外注意下 Loss 曲线,三层比一层差可能有两个原因: 1. 过拟合,少训练一点时间就可以解决 2. 未拟合,建议增加时间,或者增加数据集。 | 
|      4xychang      2019-05-06 21:08:32 +08:00 via Android 你数据量多大啊?最后模型取的是第几个 epoch 的结果? | 
|  |      6ipwx      2019-05-06 21:46:26 +08:00 无脑上 BN 和 Dropout 的都是猛士。 | 
|  |      9loryyang      2019-05-06 21:50:31 +08:00 你的好和差到底是多少?至少要看到你的模型是欠拟合还是过拟合了,还是压根没有 work,然后相应地做调整 | 
|  |      11longbye0      2019-05-06 22:41:17 +08:00 只看了下你写的 mlp。 同#3,去掉 bn 和 dropout。 看你输入输出应该是 721 维向量,自己度量下输入向量的相关性,判断下隐藏层该取小于 721 还是大于。 取一个完整工况不做训练,来验证。 | 
|      12usingnamespace      2019-05-07 01:52:38 +08:00 via iPhone 还好有人纠正了你的概念。。。 | 
|  |      13jackOne      2019-05-07 09:15:07 +08:00 建议看下你模型训练过程中的训练损失曲线以及验证损失曲线,看模型是否 work 或者是过拟合 |