Этот проект представляет анализ результатов A/B тестирования, проведенного в крупном дейтинговом приложении. Цель теста состояла в проверке влияния изменения стоимости премиум-подписки на поведение пользователей, их платежеспособность и выручку компании. Тест затрагивал новых пользователей из нескольких стран и предусматривал использование двух новых платежных систем.
- Загрузку и предобработку данных пользователей и транзакций.
- Выделение ключевых метрик для оценки результата теста:
- ARPPU (Average Revenue Per Paying User) — средний доход с платного пользователя.
- CR (Conversion Rate) — конверсия из пробных подписок в платные.
- Анализ поведения пользователей по различным категориям:
- Гендер, возраст, коэффициент привлекательности.
- Страны, откуда пользователи пришли.
- Частота и длительность посещения приложения.
- A/B тестирование с использованием статистических методов:
- Тесты на нормальность распределения и равенство дисперсий.
- Использование t-теста, хи-квадрат теста и бутстреп-методов для проверки гипотез.
- Средний доход:
- Изменение стоимости премиум-подписки снизило средний доход:
- На 6.4% для пользователей с пробной подпиской.
- На 25.7% для пользователей с постоянной подпиской.
- Изменение стоимости премиум-подписки снизило средний доход:
- Конверсия:
- Изменение стоимости не оказало значимого влияния на конверсию пользователей из пробной подписки в постоянную.
- Общие результаты теста:
- Изменение стоимости негативно сказалось на выручке с платных пользователей.
- Эксперимент не был успешен.
- users_*.csv — информация о пользователях (демография, активность, премиум-статус).
- transactions_*.csv — информация о платежах (выручка, тип подписки, источник оплаты).
- uid — идентификатор пользователя.
- age, gender, attraction_coeff — характеристики пользователя.
- was_premium, is_premium — статус премиум-подписки.
- revenue, total_revenue — нормированная выручка.
- product_type — тип продукта (пробная или постоянная подписка).
Проект реализован на Python с использованием следующих библиотек:
- Pandas, NumPy — работа с данными.
- Matplotlib, Seaborn, Plotly — визуализация.
- Scipy, Statsmodels — статистический анализ.
- Bootstrap — оценка доверительных интервалов.
- Скачайте данные с указанных источников (например, облачное хранилище).
- Выполните предобработку данных, следуя коду в проекте.
- Проведите анализ ключевых метрик и A/B тестирование.
- Используйте результаты для принятия решений по ценообразованию в приложении.