Skip to content

Latest commit

 

History

History
11 lines (7 loc) · 498 Bytes

README.md

File metadata and controls

11 lines (7 loc) · 498 Bytes

一个Transformer结构的简要代码实现,并做了一个能支持加减乘除四则运算的模型 代码讲解见博客:https://mp.weixin.qq.com/s/a23uVhSzDqQyHWt2QHznEg

两数相加.py:Transformer的代码实现,以及四则运算模型的训练代码

四则运算_推理代码.py 推理代码示例。加载已训练好的模型,直接推理

model_plus_final.pth:已经训练好的,成功率约70%

支持gpu运行 代码基于网上免费教材改写,欢迎免费使用