Skip to content

artek0chumak/MothersFriendTextWriter

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MOTHER's FRIEND TEXT WRITER

Генератор текстов, обучающийся на основе других текстов. Модель обучения - n-граммы слов.

Getting Started.

Prerequisites

Проект написан на python 3.6, используются только стандартные библиотеки (pickle, random, argparse, collections). Для установки python перейдите по ссылке: https://www.python.org.

Training

Для запуска обучения модели используется файл train.py

    python3 train.py --lc --input-dir DIRECTORY --model MODEL --ngramms N --update
  1. lc - флаг перевода слов в прописной формат.
  2. DIRECTORY - папка с текстами на обучение в кодировке UTF-8 и в формате txt(*.txt). Если не указан, то используется текст с клавиатуры. Конец ввода с клавиатуры - EOF.
  3. MODEL - путь к файлу модели, которую надо обучить. Без флага update создается новая модель.
  4. N - количество слов в n-грамме. Если не указан, то используется N=2.
  5. update - флаг обновления существующей модели.

Generating

Для создания текстов на основе уже обученной модели используется файл generate.py

    python3 generate.py --model MODEL --seed SEED --length LENGTH --output OUTPUT
  1. MODEL - путь к файлу модели.
  2. SEED - первое слово в генерируемом тексте.
  3. LENGTH - длина текста в словах.
  4. OUTPUT - файл, куда записывается текст. Если не указан, то текст выводится на экран.

Example

python3 generate.py --model Маяк --length 10
бесплатно стол и квартира как врезать ей в радиоухо шепчу

Ссылка на модель в Google Drive (Использованы тексты В.В. Маяковского).

Authors

Артем Чумаченко - Разработка

License

This project is licensed under the MIT License - see the LICENSE file for details

About

Python project to create text generator.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages