В этом репозитории представлены мои учебные проекты выполненные в рамках курса Аналитик Данных
Программа обучения состоит из 14 спринтов по 2 недели на каждый и дипломного проекта состоящего из 3-ех проектов проходящего в формате буткемпа.
Более подробно в какой последовательности проходит обучение и какие темы затрагивает: Учебная программа с описанием спринтов
Во время обучения участвовал в дополнительном элективе по построению дашбордов в Microsoft Power BI и Yandex DataLens
# | Название и ссылка | О чем проект и навыки | Библиотеки и инструменты |
---|---|---|---|
1 | Вводный проект. Музыка больших городов | Сравниваем предпочтения и поведение пользователей Яндекс.Музыки по городам и дням недели. Навыки: Основы Python, предобработка данных | Python, Pandas |
2 | Исследование надежности заемщиков | Изучаем данные кредитного отдела банка на вопрос влияния семейного положения, кол-ва детей, уровня образования и дохода на факт погащения кредита в срок. Навыки: Основы Python, предобработка данных, использование функций, категоризация данных | Pandas |
3 | Исследование объявлений о продаже квартир | Изучаем архив объявлений о продаже квартир Яндекс.Недвижимости. Ищем зависимости параметров квартир на рыночную стоимость, изучаем аномалии и динамику. Навыки: предобработка данных, визуализация данных, исследовательский анализ данных | Pandas, Matplotlib |
4 | Определение перспективного тарифа для телеком-компании | Изучаем выборку клиентов по 2-ум тарифам для определение наиболее эффективного тарифа для компании и отвечаем на вопросы. Навыки: описательная статистика, проверка статистических гипотез | Pandas, NumPy, Matplotlib, SciPy |
5 | Сборный проект. Анализ рынка продаж видео-игр | Ищем закономерности в данных о продаже игры и выявляем те, которые определяют их успешность для возможности сделать ставку на потенциально популярный продукт и спланировать рекламные кампании магазина | Pandas, NumPy, Matplotlib, SciPy |
6 | Базовый SQL | Пишем запросы в БД с данными по стартапам, венчурными фондами и инвестициям. Навыки: Основы работы с БД, основы SQL | SQL, PostgreSQL |
7 | Анализ бизнес-показателей приложения | Изучаем данные и результаты по рекламным кампаниям и составляем рекомендации для маркетингово отдела. Навыки: когортный анализ, юнит-экономика, продуктовые метрики | Pandas, NumPy, Matplotlib, datetime |
8 | Продвинутый SQL | Пишем запросы в БД на основе данных из StackOverFlow. Навыки: оконные функции, продвинутые функции SQL | SQL, PostgreSQL |
9 | Приоритизация гипотез, анализ AB-теста | Приоритизируем гипотезы и анализируем результаты A/B-тестирования в крупном интернет-магазине. Навыки: приоритезация гипотез по фреймворкам ICE и RICE, проведение и анализ результатов A/B-тестирования | Pandas, NumPy, Matplotlib, SciPy |
10 | Анализ рынка заведений общественного питания Москвы | Исследование заведений общественного питания на основе открытых данных о заведениях общественного питания Москвы для определения наиболее перспективного формата для открытия нового концептуального заведения. Навыки: визуализация данных, подготовка презентация | Pandas, Plotly |
11 | Сборный проект. Изучение воронки продаж и результатов А/А/В теста | Изучаев поведение пользователей приложения стартапа и результаты проведения ААВ-теста. Навыки: анализ AAB-теста, построение и анализ воронки продаж | Pandas, Datetime, Numpy, Math, SciPy, Plotly |
12 | Дашборд для Яндекс.Дзен | Подключаемся через Jupyter Notebook к БД, изучаем и выгружаем данные по которым строим дашборд и готовим презентацию. Навыки: подключение к БД с помощью Jupyter Notebook, построение дашборда в Tableau, подготовка презентации | Pandas, Sqlalchemy, SQL, Tableau |
13 | Прогноз оттока клиентов фитнес-цента | Проводим анализ клиентов фитнес-центра и составляем портреты клиентов. Разрабатываем модель машинного обучения для прогнозирования оттока клиентов в фитнес-центре. Навыки: основы машинного обучение, кластеризация, классификация, логистическая регрессия, случайный лес | Pandas, NumPy, Seaborn, Matplotlib, SciPy, Scikit-learn |
14.1 | Дипломный проект. Анализ оттока клиентов банка | Проводим анализ клиентов банка с 3-мя отделениями. Составляем портреты клиентов, определяем наиболее склонных к оттоку клиентов, составляем рекомендации. Подготавливаем презентацию по исследованию и создаем дашборд по распредению клиентов по количеству используемых продуктов. | Pandas, Matplotlib, Seaborn, NumPy, SciPy, Math, Tableau |
14.2 | Дипломный проект. Анализ AB-теста | Проводим оценку AB-теста. Изучаем результаты и соответствия требованиям и правильности проведения тестов | Pandas, NumPy, Matplotlib, Seaborn, Plotly, Math, SciPy |
14.3 | Дипломный проект. SQL - Анализ базы книжного сервиса | Подключаемся к БД книжного сервиса и изучаем количество обзоров, оценок и популярных авторов на сервисе | Pandas, Sqlalchemy, SQL |