Authors: Dario Della Mura - David Doci
Il lavoro presentato è stato sviluppato nel corso dell'attività di stage, come ricercatori nel campo della Natural Language Generation, presso il laboratorio Insid&s Lab di Milano-Bicocca. Il lavoro svolto si occupa della creazione un framework per la corretta valutazione dell'impatto della qualità dei dataset di input sulla qualità del testo generato dai modelli di NLG, nello specifico:
- Creazione delle versioni "Concept-Based" e "Entity-Based" del dataset di WebNLG;
- Valutazione della qualità dei dataset creati;
- Addestramento dei modelli LSTM e Transformer mediante l'utilizzo del tool OpenNMT;
- Generazione del testo in linguaggio naturale effettuato dai modelli LSTM e Transformer;
- Valutazione della qualità del testo generato dai modelli NLG;
- Analisi finali.
Per ricevere il materiale completo della tesi svolta contattarci alle seguenti email:
Dario Della Mura : [email protected] David Doci : [email protected]
The work presented was developed during the internship, as researchers in the field of Natural Language Generation, at the Insid&s Lab laboratory in Milan-Bicocca. The work carried out deals with the creation of a framework for the correct assessment of the impact of the quality of the input datasets on the quality of the text generated by the NLG models, specifically:
- Creation of the "Concept-Based" and "Entity-Based" versions of the WebNLG dataset;
- Evaluation of the quality of the datasets created;
- Training of LSTM and Transformer models using the OpenNMT tool;
- Natural language text generation by LSTM and Transformer models;
- Evaluation of the quality of the text generated by the NLG models;
- Final analysis.
To receive the complete material of your thesis please contact us at the following emails:
Dario Della Mura : [email protected] David Doci : [email protected]