GitHub - Howard-Zhou-77/LSTM-Demo

重构LSTM

目的：在不直接调用pytorch的nn.LSTM()的情况下，用pytorch的内部操作直接写出一个LSTM。

内容：

ReLSTM.py

重构的一层LSTM。

ReLSTM copy.py

重构的多层LSTM。默认层数是7，将main段中

train_LSTMlm(n_class,emb_size,1)

的第三个参数改为0即可实现2层。

多层LSTM的思路：

首先设计单位，然后用nn.Sequential()将多层单位连接成一个整体。这一“多层”是课件ppt图示中的一个纵列，因此，需要保存每一层的隐藏层和记忆层以保持网络工作。这里使用两个数组完成：

tensors:List[torch.Tensor] = list();
cells:List[torch.Tensor] = list();

其中，List[torch.Tensor]是从typing引入的标记，并无实际的编译作用。其起的作用是提示编辑器这是个torch.Tensor的数组，方便在调用数组元素的时候自动提示其成员函数。

其次，每次进行操作的时候，要把元素和上一层的隐藏层合到一起（最后一层除外）：

return torch.cat([hidden_state[0],model],dim=1)

因此要设计三种神经元，一种放在最开头，n_class个->n_class+n_hidden个；一种放在中间，n_class+n_hidden个->n_class+n_hidden个，最后一种放在最后，n_class+n_hidden个->n_class个。三种神经元分别设定为TextLSTM_1，TextLSTM_2和Text_LSTM_3。三种神经元运算过程大同小异，只是输出和输入的时候需要调整。同时三种神经元输出前还要更新对应的tensors和cells中的元素。

最后注意：本模型运算量较大，建议上GPU。

其他文件

seqtext.py和torchtest.py分别是测试nn.sequential()和nn.Linear()的测试文件。

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
__pycache__		__pycache__
assets		assets
models		models
penn_small		penn_small
README.md		README.md
ReLSTM copy.py		ReLSTM copy.py
ReLSTM.py		ReLSTM.py
give_valid_test.py		give_valid_test.py
seqtext.py		seqtext.py
torchtest.py		torchtest.py
总结.md		总结.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

重构LSTM

内容：

多层LSTM的思路：

其他文件

About

Releases

Packages

Languages

Howard-Zhou-77/LSTM-Demo

Folders and files

Latest commit

History

Repository files navigation

重构LSTM

内容：

多层LSTM的思路：

其他文件

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages