В данной папке содержится простое решение задачи B.
Идея решения следующая: в качестве ответа выбирается целое предложение из параграфа, такое что оно сильнее всего пересекается со словами из вопроса.
- Склонируйте репозиторий себе на компьютер
- Зайдите в папке taskB
- Выполните команду:
python3 create_submission.py -p simple-baseline/predict.py -o output_simple.zip
(из файлаcreate_submission_simple.sh
) - Создастся архив: output_simple.zip, который можно отправить в систему
- Склонируйте репозиторий себе на компьютер
- Зайдите в папку taskB
- Положите в папку taskB файл с данными (
train.csv
) - Выполните
python3 split_train.py train.csv
, в результате появится два файла:train_without_validate.csv
,validate.csv
. Первый будем в будущем использовать для обучения, второй для проверка работы моделей. - Выполните
python3 check_solution.py -t docker --submission_folder ml-baseline --data_file validate.csv
, в результате вы увидите в конце строчку вида:{'f1': 0.3361121166011774}
- Теперь можете добавлять и улучшать модель.