MyTransformer_pytorch

关于Transformer模型的最简洁pytorch实现，包含详细注释

本实现版本相比参考代码删去了每个模块不必要的返回（如注意力矩阵），力求最精简明晰的实现，适用于初学者入门学习

参考代码有：
1. https://wmathor.com/index.php/archives/1455/
2. http://nlp.seas.harvard.edu/annotated-transformer/ (哈佛NLP团队实现版本)
file_list
- MyTransformer.ipynb
  - jupyter notebook中的实现，与.py文件相比，添加了更多的说明文字
- images
  - 为方便理解绘制的一些图，在 MyTransformer.ipynb 中被用到
- data.py
  - 数据预处理
- model.py
  - 模型文件
- train.py
  - 训练模型
- test.py
  - 读入训练好的pth模型文件，测试模型，完成一个翻译任务
- .pth
  - My_Transformer.pth
    - 是按照原concat写法训练1000次后得到的模型，Loss约为3e-6
  - My_Transformer_concat.pth
    - 是按照我修改后的concat写法训练1000次后得到的模型，Loss也为3e-6
  - MyTransformer_fault.pth
    - 只训练了5个epoch的模型，用于验证所做的测试是有意义的（用此模型预测会出错）
训练好的模型文件链接：
- 链接：https://pan.baidu.com/s/133Ud8f0yHV3kFnawdZGsQA
- 提取码：2022
下载后解压到项目根目录下即可
我的邮箱：[email protected]
- 欢迎来信交流
以上内容均为原创，参考的代码已列出，如要转载请注明出处，best wishes.

Provide feedback

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
images		images
MyTransformer.ipynb		MyTransformer.ipynb
README.md		README.md
data.py		data.py
model.py		model.py
test.py		test.py
train.py		train.py