LSTM隐层状态h0, c0通常初始化为0,大部分情况下模型也能工作的很好。但是有时将h0, c0作为随机值,或直接作为模型参数的一部分进行优化似乎更为合理。 这篇post给出了经验证明: Non-Z … Continue reading Pytorch LSTM/GRU更新h0, c0
LSTM隐层状态h0, c0通常初始化为0,大部分情况下模型也能工作的很好。但是有时将h0, c0作为随机值,或直接作为模型参数的一部分进行优化似乎更为合理。 这篇post给出了经验证明: Non-Z … Continue reading Pytorch LSTM/GRU更新h0, c0