Привет! Это репозиторий с учебными проектами по Анализу данных от Яндекс.Практикума.
Учебная программа анализа данных включала в себя следующие вопросы: предварительная обработка данных, исследовательский анализ данных, статистический анализ данных, сбор и хранение данных (SQL), анализ бизнес-показателей (метрики и воронки, когортный анализ, unit-экономика), A/B-тестирование, визуализация данных, автоматизация (скрипты, пайплайны и дашборды), основы машинного обучения.
Репозиторий НЕ ВКЛЮЧАЕТ В СЕБЯ датасеты и полные описания заданий согласно пункту 3.1 Условий использования сервиса «Яндекс.Практикум». Все проекты представлены исключительно в ознакомительных целях.
Проекты содержат полезные примеры кода, которых мне недоставало в процессе обучения. Особенно это касается визуализации и обработки данных.
№ | Project name/Название проекта | Описание/Description |
---|---|---|
1 | Оптимизизация маркетинговых затрат согласно данным от Яндекс.Афиши. | Анализ пользовательского поведения и маркетинговых затрат согласно логу сервера с данными о посещениях сайта Яндекс.Афиши с июня 2017 по конец мая 2018 года, выгрузкой всех заказов за этот период и статистикой рекламных расходов. |
2 | Исследование воронки продаж и результатов A/A/B-эксперимента по изменению шрифтов мобильного приложения. | Изучение воронки продаж и пользовательского поведения. Исследование результатов A/A/B-эксперимента. |
3 | Исследование рынка заведений общепита в Москве. | Исследование рынка на основе открытых данных о заведениях общественного питания в Москве, составление рекомендаций и подготовка презентации. |
4 | Анализ и сегментация клиентов регионального банка по количеству потребляемых продуктов. | Формулировка и проверка статистических гипотез различия дохода между теми клиентами, которые пользуются двумя продуктами банка, и теми, которые пользуются одним. Сегментация пользователей на основе данных о количестве потребляемых продуктов. Исследовательский анализ данных. |
5 | A/B тестирование изменений, связанных с внедрением улучшенной рекомендательной системы интернет-магазина. | Оценка корректности проведения и анализ результатов A/B-теста, связанных с внедрением улучшенной рекомендательной системы. |
6 | Выгрузка информации SQL-запросами из базы данных книжных издательств. | Составление запросов о книгах, издательствах, авторах, а также пользовательских обзорах книг для ценностного предложения нового продукта. |
7 | Анализ и прогнозирование оттока клиентов средствами машинного обучения. | Прогнозирование вероятности оттока клиентов фитнес-центра, анализ признаков оттока, формирование типичных портретов клиентов, выводы и рекомендации. |
8 | Анализ изменения выручки интернет-магазина по результатам A/B-теста. | Приоритизация и проверка гипотез для увеличения выручки интернет-магазина. |
9 | Анализ информации в Python из базы данных авиаперевозок. | Исследование результатов запросов количества рейсов с вылетом в сентябре 2018 года на каждой модели самолёта и среднего количества прибывающих рейсов в день для каждого города за август 2018 года. |
10 | Анализ исторических данных о продажах видеоигр для планирования рекламных кампаний. | Анализ исторических данных (до 2016 года) о продажах игр, оценки пользователей и экспертов, жанры и платформы с целью планирования кампании на 2017-й. |
11 | Сравнительный анализ поведения клиентов тарифных планов федерального оператора сотовой связи. | Предварительный анализ тарифных планов федерального оператора сотовой связи на небольшой выборке клиентов, определение лучшего тарифа. |
12 | Анализ рынка недвижимости в Санкт-Петербурге по данным сервиса Яндекс.Недвижимость. | Исследовательский анализ данных архива объявлений о продаже квартир в Санкт-Петербурге и соседних населённых пунктах за несколько лет для определения рыночной стоимости объектов недвижимости и отслеживания аномалий. |
13 | Анализ статистики о платёжеспособности клиентов кредитного отдела банка. | Исследование зависимости семейного положения и количества детей клиента на факт погашения кредита в срок для построения модели кредитного скоринга. |
Основные инструменты разработки:
- язык программирования
Python3
и его библиотеки: - среда программирования
Jupyter Notebook
; - язык запросов (
SQL
).
Проекты выполнялись в онлайн-тренажёре Яндекс.Практикум. Для работы на локальном компьютере требуется установка дистрибутива Anaconda. Каждый проект представлен в трёх вариантах: тетрадь Jupyter Notebook
, сохранённая веб-страница и сохранённый pdf-файл.