Проект №1. Анализ данных сервиса Яндекс.Музыка |
На реальных данных Яндекс.Музыка провести проверку гипотез и сравнить поведение пользователей Москвы и Санкт-Петербурга |
pandas |
Проект №2. Исследование надёжности заёмщиков |
Заказчик — кредитный отдел банка. Нужно разобраться, влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок. Входные данные от банка — статистика о платёжеспособности клиентов. |
pandas, numpy, pymystem3 |
Проект №3. Исследование объявлений о продаже квартир |
Обработка и исследовательский анализ данных архива объявлений о продаже квартире в Санкт-Петербурге и соседних населенных пунктах. Выявление основных признаков, влияющих на стоимость недвижимости |
pandas, matplotlib, seaborn |
Проект №4. Определение перспективного тарифа для телеком компании |
Сравнение тарифов оператора сотовой связи |
pandas, numpy, seaborn, matplotlib, scipy |
Проект №5. Анализ рынка компьютерных игр |
Рекомендации по планированию рекламной компании интернет-магазина компьютерных игр |
pandas, numpy, seaborn, matplotlib, scipy |
Проект №6. Рекомендация тарифов |
Модель, рекомендующая клиентам подходящий тариф сотовой связи |
pandas, sklearn, matplotlib, seaborn |
Проект №7. Прогноз оттока клиентов банка |
Разработка модели, прогнозирующей, уйдёт клиент из банка в ближайшее время или нет |
pandas, numpy, sklearn, matplotlib, seaborn |
Проект №8. Выбор локации для скважин |
Выбор региона для разработки нефтяного месторождения на основании данных геологоразведки |
pandas, numpy, sklearn, matplotlib, seaborn |
Проект №9. Восстановление золота из руды |
Подготовка прототипа модели машинного обучения, предсказывающей коэффициент восстановления золота из золотосодержащей руды |
pandas, numpy, sklearn, matplotlib, seaborn, catboost |
Проект №10. Защита персональных данных клиентов |
Защита данных клиентов страховой компании. Разработка метода преобразования данных, по которым сложно восстановить персональные данные |
pandas, numpy, sklearn, matplotlib, seaborn |
Проект №11. Определение стоимости автомобилей |
Определение стоимости автомобилей на основании рыночной цены схожих автомобилей |
pandas, numpy, sklearn, seaborn, lightgbm, catboost |