A novel prediction RNN model with torch.
The default novel is a chinese novel named '遮天'.
pip install -r requirements.txt
python main.py train --save_model_path <save_model_path>
torchrun --nproc_per_node=4 main.py train
python main.py predict --load_model_path <load_model_path> --prefix <prefix>
ATTENTION: If you are using cheinese words to predict. Please modify the code in
main.py
(i.epredict_parser.add_argument('--prefix', type=str, default="叶凡")
),
- 在read_novel中,使用更精细的方式对文本进行预处理
- read_novel中,打开文件的编码方式为
gbk
,是否需要对英文文本进行处理utf-8
- 添加网络下载小说
- jieba分词结果对模型的影响研究(可能需要把词汇表修改一下)
- 中文进行预测的时候,无法在命令行输入。