Paraphrasing

Seq2Seq supervised model

This model is based on the following research paper: https://www.aclweb.org/anthology/2020.coling-main.209/

Use

This model could be used for supervised tasks where we have (input, target) training data: e.g. paraphrasing, summarisation, translation, QA

Dataset

We're using a subset of the following dataset:

@inproceedings{lan2017continuously, author = {Lan, Wuwei and Qiu, Siyu and He, Hua and Xu, Wei}, title = {A Continuously Growing Dataset of Sentential Paraphrases}, booktitle = {Proceedings of The 2017 Conference on Empirical Methods on Natural Language Processing (EMNLP)}, year = {2017}, publisher = {Association for Computational Linguistics}, pages = {1235--1245}, location = {Copenhagen, Denmark} url = {http://aclweb.org/anthology/D17-1127} }

This dataset contains Twitter sentences and their paraphrased versions

Training

Since project is for educational purposes, model was only loosely trained on 1 epoch of 1/5 of training data (30k sample), but we can see from the 'logs' folder that model is learning on training data, and also on evaluational data that's coming from different data distribution. Sufficient training for real-world applications would require more computational resources.

Future updates

Improving sampling algorithm & making it trainable
Designing multi-objective training algorithm
Adding Flax model

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
experimental		experimental
logs		logs
.DS_Store		.DS_Store
.gitattributes		.gitattributes
LICENSE		LICENSE
README.md		README.md
metrics.py		metrics.py
model.py		model.py
prepare_data.py		prepare_data.py
sample.py		sample.py
train_model.py		train_model.py
training_loop.py		training_loop.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Paraphrasing

Use

Dataset

Training

Future updates

About

Releases

Packages

Languages

License

Yunodo/Seq2Seq

Folders and files

Latest commit

History

Repository files navigation

Paraphrasing

Use

Dataset

Training

Future updates

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages