Skip to content

учебный проект по автоматизации airflow

Notifications You must be signed in to change notification settings

anastasiya-h79/etl_pipeline

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 

Repository files navigation

Учебный проект курса "Симулятор аналитика" от karpov.courses.

DAG в airflow, который считается каждый день за вчерашний день.

  1. Параллельно обрабатываем две таблицы. В feed_actions для каждого юзера считаем число просмотров и лайков контента. В message_actions для каждого юзера считаем, сколько он получает и отсылает сообщений, скольким людям он пишет, сколько людей пишут ему. Каждая выгрузка - в отдельном таске.

  2. Далее объединяем две таблицы в одну.

  3. Для этой таблицы считаем все эти метрики в разрезе по полу, возрасту и ос. Делаем три разных таска на каждый срез.

  4. И финальные данные со всеми метриками записываем в отдельную таблицу в ClickHouse.

  5. Каждый день таблица дополняется новыми данными.

About

учебный проект по автоматизации airflow

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published