Skip to content

Latest commit

 

History

History
56 lines (46 loc) · 11.1 KB

README_RUS.md

File metadata and controls

56 lines (46 loc) · 11.1 KB

Оглавление

Введение

Привет! Это репозиторий с учебными проектами по Анализу данных от Яндекс.Практикума.

Учебная программа анализа данных включала в себя следующие вопросы: предварительная обработка данных, исследовательский анализ данных, статистический анализ данных, сбор и хранение данных (SQL), анализ бизнес-показателей (метрики и воронки, когортный анализ, unit-экономика), A/B-тестирование, визуализация данных, автоматизация (скрипты, пайплайны и дашборды), основы машинного обучения.

Условия использования

Репозиторий НЕ ВКЛЮЧАЕТ В СЕБЯ датасеты и полные описания заданий согласно пункту 3.1 Условий использования сервиса «Яндекс.Практикум». Все проекты представлены исключительно в ознакомительных целях.

В чём смысл?

Проекты содержат полезные примеры кода, которых мне недоставало в процессе обучения. Особенно это касается визуализации и обработки данных.

List of projects

Project name/Название проекта Описание/Description
1 Оптимизизация маркетинговых затрат согласно данным от Яндекс.Афиши. Анализ пользовательского поведения и маркетинговых затрат согласно логу сервера с данными о посещениях сайта Яндекс.Афиши с июня 2017 по конец мая 2018 года, выгрузкой всех заказов за этот период и статистикой рекламных расходов.
2 Исследование воронки продаж и результатов A/A/B-эксперимента по изменению шрифтов мобильного приложения. Изучение воронки продаж и пользовательского поведения. Исследование результатов A/A/B-эксперимента.
3 Исследование рынка заведений общепита в Москве. Исследование рынка на основе открытых данных о заведениях общественного питания в Москве, составление рекомендаций и подготовка презентации.
4 Анализ и сегментация клиентов регионального банка по количеству потребляемых продуктов. Формулировка и проверка статистических гипотез различия дохода между теми клиентами, которые пользуются двумя продуктами банка, и теми, которые пользуются одним. Сегментация пользователей на основе данных о количестве потребляемых продуктов. Исследовательский анализ данных.
5 A/B тестирование изменений, связанных с внедрением улучшенной рекомендательной системы интернет-магазина. Оценка корректности проведения и анализ результатов A/B-теста, связанных с внедрением улучшенной рекомендательной системы.
6 Выгрузка информации SQL-запросами из базы данных книжных издательств. Составление запросов о книгах, издательствах, авторах, а также пользовательских обзорах книг для ценностного предложения нового продукта.
7 Анализ и прогнозирование оттока клиентов средствами машинного обучения. Прогнозирование вероятности оттока клиентов фитнес-центра, анализ признаков оттока, формирование типичных портретов клиентов, выводы и рекомендации.
8 Анализ изменения выручки интернет-магазина по результатам A/B-теста. Приоритизация и проверка гипотез для увеличения выручки интернет-магазина.
9 Анализ информации в Python из базы данных авиаперевозок. Исследование результатов запросов количества рейсов с вылетом в сентябре 2018 года на каждой модели самолёта и среднего количества прибывающих рейсов в день для каждого города за август 2018 года.
10 Анализ исторических данных о продажах видеоигр для планирования рекламных кампаний. Анализ исторических данных (до 2016 года) о продажах игр, оценки пользователей и экспертов, жанры и платформы с целью планирования кампании на 2017-й.
11 Сравнительный анализ поведения клиентов тарифных планов федерального оператора сотовой связи. Предварительный анализ тарифных планов федерального оператора сотовой связи на небольшой выборке клиентов, определение лучшего тарифа.
12 Анализ рынка недвижимости в Санкт-Петербурге по данным сервиса Яндекс.Недвижимость. Исследовательский анализ данных архива объявлений о продаже квартир в Санкт-Петербурге и соседних населённых пунктах за несколько лет для определения рыночной стоимости объектов недвижимости и отслеживания аномалий.
13 Анализ статистики о платёжеспособности клиентов кредитного отдела банка. Исследование зависимости семейного положения и количества детей клиента на факт погашения кредита в срок для построения модели кредитного скоринга.

Требования

Основные инструменты разработки:

  • язык программирования Python3 и его библиотеки:
    • аналитическая библиотекой Pandas;
    • библиотеки для выполнения научных и инженерных расчётов NumPy, math, SciPy;
    • библиотеки для визуализации данных Matplotlib, seaborn, plotly;
    • библиотека машинного обучения sklearn;
    • вспомогательные библиотеки datetime, display, warnings;
  • среда программирования Jupyter Notebook;
  • язык запросов (SQL).

Установка

Проекты выполнялись в онлайн-тренажёре Яндекс.Практикум. Для работы на локальном компьютере требуется установка дистрибутива Anaconda. Каждый проект представлен в трёх вариантах: тетрадь Jupyter Notebook, сохранённая веб-страница и сохранённый pdf-файл.

Обратная связь

[email protected]