Простой пармер чатов в телеграме с контекстом разговора
- Скачайте данный репозиторий на ваш пк
- Установите зафисимости с помощью
pip install -r requirements.txt
- Экспортируйте чат в telegram в формат json (выбирается в меню)
- Укажите путь к входному файлу и выходной директории
python parser.py --tg_history_path /path/to/history/file.json --output_path /path/to/output/directory
- Ожидайте завершения
- В указанной выходной директории будет 3 файла:
1. raw.csv - файл с неочищенными данными
2. train.jsonl и test.jsonl - данные готовые для дальнейшей обработки