我发现在训练过程中,总是存在一些数据会在迭代过程中发散。并且,在训练过程中,loss总是根据数据的不同,来回震荡。请教下作者针对这两个问题,有什么解决办法呢?
我发现在训练过程中,总是存在一些数据会在迭代过程中发散。并且,在训练过程中,loss总是根据数据的不同,来回震荡。请教下作者针对这两个问题,有什么解决办法呢?