费曼学习法就是人工的反向传播。 读懂一个东西不够,还得用自己的话讲出来。 讲不清楚,说明梯度没有回传到底层,只是在表面记住了token的排列顺序,权重没更新。 费曼方法在测试梯度到底传到了哪一层...