From 8cfea43b0d9cbc7c3fdd70d6c4ce0b64162ad9cd Mon Sep 17 00:00:00 2001
From: patriciacatandi <62657143+patriciacatandi@users.noreply.github.com>
Date: Wed, 28 Feb 2024 13:11:23 +0000
Subject: [PATCH] =?UTF-8?q?Deploying=20to=20gh-pages=20from=20@=20prefeitu?=
 =?UTF-8?q?ra-rio/pipelines@770843827b370bb2d9de3700da7832cc59b1b3ed=20?=
 =?UTF-8?q?=F0=9F=9A=80?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 rj_cor/comando/eventos/constants.html |   9 +-
 rj_cor/comando/eventos/flows.html     | 287 +++++++++++++-------
 rj_cor/comando/eventos/tasks.html     | 370 ++++++++++++++++----------
 rj_cor/comando/eventos/utils.html     | 133 ++++++++-
 4 files changed, 568 insertions(+), 231 deletions(-)
diff --git a/rj_cor/comando/eventos/constants.html b/rj_cor/comando/eventos/constants.html
index 0a542f33c..3ee72eb45 100644
--- a/rj_cor/comando/eventos/constants.html
+++ b/rj_cor/comando/eventos/constants.html
@@ -45,7 +45,7 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.constants</code>
     DATASET_ID = &#34;adm_cor_comando&#34;
     TABLE_ID_EVENTOS = &#34;ocorrencias_nova_api&#34;
     REDIS_NAME = &#34;cor_api_last_days&#34;
-    # TABLE_ID_ATIVIDADES_EVENTOS = &#34;ocorrencias_orgaos_responsaveis&#34;
+    TABLE_ID_ATIVIDADES_EVENTOS = &#34;ocorrencias_orgaos_responsaveis_nova_api&#34;
     # TABLE_ID_POPS = &#34;procedimento_operacional_padrao&#34;
     # TABLE_ID_ATIVIDADES_POPS = &#34;procedimento_operacional_padrao_orgaos_responsaveis&#34;
     RAIN_DASHBOARD_FLOW_SCHEDULE_PARAMETERS = {
@@ -238,7 +238,7 @@ <h2 class="section-title" id="header-classes">Classes</h2>
     DATASET_ID = &#34;adm_cor_comando&#34;
     TABLE_ID_EVENTOS = &#34;ocorrencias_nova_api&#34;
     REDIS_NAME = &#34;cor_api_last_days&#34;
-    # TABLE_ID_ATIVIDADES_EVENTOS = &#34;ocorrencias_orgaos_responsaveis&#34;
+    TABLE_ID_ATIVIDADES_EVENTOS = &#34;ocorrencias_orgaos_responsaveis_nova_api&#34;
     # TABLE_ID_POPS = &#34;procedimento_operacional_padrao&#34;
     # TABLE_ID_ATIVIDADES_POPS = &#34;procedimento_operacional_padrao_orgaos_responsaveis&#34;
     RAIN_DASHBOARD_FLOW_SCHEDULE_PARAMETERS = {
@@ -428,6 +428,10 @@ <h3>Class variables</h3>
 <dd>
 <div class="desc"></div>
 </dd>
+<dt id="pipelines.rj_cor.comando.eventos.constants.constants.TABLE_ID_ATIVIDADES_EVENTOS"><code class="name">var <span class="ident">TABLE_ID_ATIVIDADES_EVENTOS</span></code></dt>
+<dd>
+<div class="desc"></div>
+</dd>
 <dt id="pipelines.rj_cor.comando.eventos.constants.constants.TABLE_ID_EVENTOS"><code class="name">var <span class="ident">TABLE_ID_EVENTOS</span></code></dt>
 <dd>
 <div class="desc"></div>
@@ -504,6 +508,7 @@ <h4><code><a title="pipelines.rj_cor.comando.eventos.constants.constants" href="
 <li><code><a title="pipelines.rj_cor.comando.eventos.constants.constants.RAIN_DASHBOARD_FLOW_SCHEDULE_PARAMETERS" href="#pipelines.rj_cor.comando.eventos.constants.constants.RAIN_DASHBOARD_FLOW_SCHEDULE_PARAMETERS">RAIN_DASHBOARD_FLOW_SCHEDULE_PARAMETERS</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.constants.constants.RAIN_DASHBOARD_LAST_2H_FLOW_SCHEDULE_PARAMETERS" href="#pipelines.rj_cor.comando.eventos.constants.constants.RAIN_DASHBOARD_LAST_2H_FLOW_SCHEDULE_PARAMETERS">RAIN_DASHBOARD_LAST_2H_FLOW_SCHEDULE_PARAMETERS</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.constants.constants.REDIS_NAME" href="#pipelines.rj_cor.comando.eventos.constants.constants.REDIS_NAME">REDIS_NAME</a></code></li>
+<li><code><a title="pipelines.rj_cor.comando.eventos.constants.constants.TABLE_ID_ATIVIDADES_EVENTOS" href="#pipelines.rj_cor.comando.eventos.constants.constants.TABLE_ID_ATIVIDADES_EVENTOS">TABLE_ID_ATIVIDADES_EVENTOS</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.constants.constants.TABLE_ID_EVENTOS" href="#pipelines.rj_cor.comando.eventos.constants.constants.TABLE_ID_EVENTOS">TABLE_ID_EVENTOS</a></code></li>
 </ul>
 </li>
diff --git a/rj_cor/comando/eventos/flows.html b/rj_cor/comando/eventos/flows.html
index 59d791e05..2b8322017 100644
--- a/rj_cor/comando/eventos/flows.html
+++ b/rj_cor/comando/eventos/flows.html
@@ -47,11 +47,13 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.flows</code></h1
 )
 from pipelines.rj_cor.comando.eventos.schedules import every_hour  # , every_month
 from pipelines.rj_cor.comando.eventos.tasks import (
-    download_data,
+    download_data_ocorrencias,
+    download_data_atividades,
     get_date_interval,
     get_redis_df,
     save_data,
-    treat_data,
+    treat_data_ocorrencias,
+    treat_data_atividades,
 )
 
 from pipelines.rj_escritorio.rain_dashboard.constants import (
@@ -67,7 +69,7 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.flows</code></h1
 )
 
 with Flow(
-    &#34;COR: Comando - Eventos e Atividades do Evento&#34;,
+    &#34;COR: Comando - Ocorrências&#34;,
     code_owners=[
         &#34;paty&#34;,
     ],
@@ -104,22 +106,21 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.flows</code></h1
     redis_mode = Parameter(&#34;redis_mode&#34;, default=&#34;dev&#34;, required=False)
 
     dataset_id = comando_constants.DATASET_ID.value
-    table_id_eventos = comando_constants.TABLE_ID_EVENTOS.value
+    table_id = comando_constants.TABLE_ID_EVENTOS.value
     redis_name = comando_constants.REDIS_NAME.value
-    # table_id_atividades_eventos = comando_constants.TABLE_ID_ATIVIDADES_EVENTOS.value
 
     first_date, last_date = get_date_interval(first_date, last_date)
 
-    dfr = download_data(first_date, last_date)
+    dfr = download_data_ocorrencias(first_date, last_date)
 
     dfr_redis = get_redis_df(
         dataset_id=dataset_id,
-        table_id=table_id_eventos,
+        table_id=table_id,
         name=redis_name,
         mode=redis_mode,
     )
 
-    dfr_treated, dfr_redis = treat_data(
+    dfr_treated, dfr_redis = treat_data_ocorrencias(
         dfr,
         dfr_redis=dfr_redis,
         columns=[&#34;id_evento&#34;, &#34;data_inicio&#34;, &#34;status&#34;],
@@ -142,24 +143,15 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.flows</code></h1
     # )
 
     path = save_data(dfr_treated)
-    task_upload_eventos = create_table_and_upload_to_gcs(
+    task_upload = create_table_and_upload_to_gcs(
         data_path=path,
         dataset_id=dataset_id,
-        table_id=table_id_eventos,
+        table_id=table_id,
         dump_mode=dump_mode,
         biglake_table=False,
         wait=path,
     )
 
-    # task_upload_atividade_eventos = create_table_and_upload_to_gcs(
-    #     data_path=atividade_eventos_path,
-    #     dataset_id=dataset_id,
-    #     table_id=table_id_atividades_eventos,
-    #     dump_mode=dump_mode,
-    #     biglake_table=False,
-    #     wait=atividade_eventos_path,
-    # )
-
     # Warning: this task won&#39;t execute if we provide a date interval
     # on parameters. The reason this happens is for if we want to
     # perform backfills, it won&#39;t mess with the Redis interval.
@@ -178,115 +170,62 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.flows</code></h1
     with case(materialize_after_dump, True):
         # Trigger DBT flow run
         current_flow_labels = get_current_flow_labels()
-        eventos_materialization_flow = create_flow_run(
+        materialization_flow = create_flow_run(
             flow_name=utils_constants.FLOW_EXECUTE_DBT_MODEL_NAME.value,
             project_name=constants.PREFECT_DEFAULT_PROJECT.value,
             parameters={
                 &#34;dataset_id&#34;: dataset_id,
-                &#34;table_id&#34;: table_id_eventos,
+                # &#34;table_id&#34;: table_id_eventos,
+                &#34;table_id&#34;: &#34;ocorrencias&#34;,  # change to table_id
                 &#34;mode&#34;: materialization_mode,
                 &#34;materialize_to_datario&#34;: materialize_to_datario,
             },
             labels=current_flow_labels,
-            run_name=f&#34;Materialize {dataset_id}.{table_id_eventos}&#34;,
+            run_name=f&#34;Materialize {dataset_id}.{table_id}&#34;,
         )
-        # atividade_eventos_materialization_flow = create_flow_run(
-        #     flow_name=utils_constants.FLOW_EXECUTE_DBT_MODEL_NAME.value,
-        #     project_name=constants.PREFECT_DEFAULT_PROJECT.value,
-        #     parameters={
-        #         &#34;dataset_id&#34;: dataset_id,
-        #         &#34;table_id&#34;: table_id_atividades_eventos,
-        #         &#34;mode&#34;: materialization_mode,
-        #         &#34;materialize_to_datario&#34;: materialize_to_datario,
-        #     },
-        #     labels=current_flow_labels,
-        #     run_name=f&#34;Materialize {dataset_id}.{table_id_atividades_eventos}&#34;,
-        # )
-
-        eventos_materialization_flow.set_upstream(task_upload_eventos)
-        # atividade_eventos_materialization_flow.set_upstream(
-        #     task_upload_atividade_eventos
-        # )
-
-        wait_for_eventos_materialization = wait_for_flow_run(
-            eventos_materialization_flow,
+
+        materialization_flow.set_upstream(task_upload)
+
+        wait_for_materialization = wait_for_flow_run(
+            materialization_flow,
             stream_states=True,
             stream_logs=True,
             raise_final_state=True,
         )
 
-        # wait_for_atividade_eventos_materialization = wait_for_flow_run(
-        #     atividade_eventos_materialization_flow,
-        #     stream_states=True,
-        #     stream_logs=True,
-        #     raise_final_state=True,
-        # )
-
-        wait_for_eventos_materialization.max_retries = (
+        wait_for_materialization.max_retries = (
             dump_db_constants.WAIT_FOR_MATERIALIZATION_RETRY_ATTEMPTS.value
         )
 
-        # wait_for_atividade_eventos_materialization.max_retries = (
-        #     dump_db_constants.WAIT_FOR_MATERIALIZATION_RETRY_ATTEMPTS.value
-        # )
-
-        wait_for_eventos_materialization.retry_delay = timedelta(
+        wait_for_materialization.retry_delay = timedelta(
             seconds=dump_db_constants.WAIT_FOR_MATERIALIZATION_RETRY_INTERVAL.value
         )
 
-        # wait_for_atividade_eventos_materialization.retry_delay = timedelta(
-        #     seconds=dump_db_constants.WAIT_FOR_MATERIALIZATION_RETRY_INTERVAL.value
-        # )
-
         with case(dump_to_gcs, True):
             # Trigger Dump to GCS flow run with project id as datario
-            dump_eventos_to_gcs_flow = create_flow_run(
+            dump_to_gcs_flow = create_flow_run(
                 flow_name=utils_constants.FLOW_DUMP_TO_GCS_NAME.value,
                 project_name=constants.PREFECT_DEFAULT_PROJECT.value,
                 parameters={
                     &#34;project_id&#34;: &#34;datario&#34;,
                     &#34;dataset_id&#34;: dataset_id,
-                    &#34;table_id&#34;: table_id_eventos,
+                    &#34;table_id&#34;: table_id,
                     &#34;maximum_bytes_processed&#34;: maximum_bytes_processed,
                 },
                 labels=[
                     &#34;datario&#34;,
                 ],
-                run_name=f&#34;Dump to GCS {dataset_id}.{table_id_eventos}&#34;,
+                run_name=f&#34;Dump to GCS {dataset_id}.{table_id}&#34;,
             )
-            dump_eventos_to_gcs_flow.set_upstream(wait_for_eventos_materialization)
-
-            # dump_atividade_eventos_to_gcs_flow = create_flow_run(
-            #     flow_name=utils_constants.FLOW_DUMP_TO_GCS_NAME.value,
-            #     project_name=constants.PREFECT_DEFAULT_PROJECT.value,
-            #     parameters={
-            #         &#34;project_id&#34;: &#34;datario&#34;,
-            #         &#34;dataset_id&#34;: dataset_id,
-            #         &#34;table_id&#34;: table_id_atividades_eventos,
-            #         &#34;maximum_bytes_processed&#34;: maximum_bytes_processed,
-            #     },
-            #     labels=[
-            #         &#34;datario&#34;,
-            #     ],
-            #     run_name=f&#34;Dump to GCS {dataset_id}.{table_id_atividades_eventos}&#34;,
-            # )
-            # dump_atividade_eventos_to_gcs_flow.set_upstream(
-            #     wait_for_atividade_eventos_materialization
-            # )
+            dump_to_gcs_flow.set_upstream(wait_for_materialization)
 
             wait_for_dump_to_gcs = wait_for_flow_run(
-                dump_eventos_to_gcs_flow,
+                dump_to_gcs_flow,
                 stream_states=True,
                 stream_logs=True,
                 raise_final_state=True,
             )
 
-            # wait_for_dump_atividade_eventos_to_gcs = wait_for_flow_run(
-            #     dump_atividade_eventos_to_gcs_flow,
-            #     stream_states=True,
-            #     stream_logs=True,
-            #     raise_final_state=True,
-            # )
     with case(TRIGGER_RAIN_DASHBOARD_UPDATE, True):
         # Trigger rain dashboard update flow run
         rain_radar_dashboard_update_flow = create_flow_run(
@@ -301,7 +240,7 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.flows</code></h1
                 skip_on_upstream_skip=False,
             ),
         )
-        rain_radar_dashboard_update_flow.set_upstream(task_upload_eventos)
+        rain_radar_dashboard_update_flow.set_upstream(task_upload)
 
         wait_for_rain_dashboard_update = wait_for_flow_run(
             flow_run_id=rain_radar_dashboard_update_flow,
@@ -323,7 +262,7 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.flows</code></h1
                 skip_on_upstream_skip=False,
             ),
         )
-        rain_radar_dashboard_last_2h_update_flow.set_upstream(task_upload_eventos)
+        rain_radar_dashboard_last_2h_update_flow.set_upstream(task_upload)
 
         wait_for_rain_dashboard_last_2h_update = wait_for_flow_run(
             flow_run_id=rain_radar_dashboard_last_2h_update_flow,
@@ -342,6 +281,174 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.flows</code></h1
 rj_cor_comando_eventos_flow.schedule = every_hour
 
 
+with Flow(
+    &#34;COR: Comando - Atividades do evento&#34;,
+    code_owners=[
+        &#34;paty&#34;,
+    ],
+) as rj_cor_comando_atividades_evento_flow:
+    dump_mode = Parameter(&#34;dump_mode&#34;, default=&#34;append&#34;, required=False)
+
+    # Materialization parameters
+    materialize_after_dump = Parameter(
+        &#34;materialize_after_dump&#34;, default=False, required=False
+    )
+    materialization_mode = Parameter(
+        &#34;materialization_mode&#34;, default=&#34;prod&#34;, required=False
+    )
+    materialize_to_datario = Parameter(
+        &#34;materialize_to_datario&#34;, default=False, required=False
+    )
+    TRIGGER_RAIN_DASHBOARD_UPDATE = Parameter(
+        &#34;trigger_rain_dashboard_update&#34;, default=False, required=False
+    )
+
+    # Dump to GCS after? Should only dump to GCS if materializing to datario
+    dump_to_gcs = Parameter(&#34;dump_to_gcs&#34;, default=False, required=False)
+    maximum_bytes_processed = Parameter(
+        &#34;maximum_bytes_processed&#34;,
+        required=False,
+        default=dump_to_gcs_constants.MAX_BYTES_PROCESSED_PER_TABLE.value,
+    )
+
+    # Get date interval from parameters
+    first_date = Parameter(&#34;first_date&#34;, required=False, default=None)
+    last_date = Parameter(&#34;last_date&#34;, required=False, default=None)
+
+    # Redis interval mode
+    redis_mode = Parameter(&#34;redis_mode&#34;, default=&#34;dev&#34;, required=False)
+
+    dataset_id = comando_constants.DATASET_ID.value
+    redis_name = comando_constants.REDIS_NAME.value
+    table_id = comando_constants.TABLE_ID_ATIVIDADES_EVENTOS.value
+
+    first_date, last_date = get_date_interval(first_date, last_date)
+
+    dfr = download_data_atividades(first_date, last_date)
+
+    dfr_redis = get_redis_df(
+        dataset_id=dataset_id,
+        table_id=table_id,
+        name=redis_name,
+        mode=redis_mode,
+    )
+
+    dfr_treated, dfr_redis = treat_data_atividades(
+        dfr,
+        dfr_redis=dfr_redis,
+        columns=[&#34;id_evento&#34;, &#34;data_inicio&#34;, &#34;sigla&#34;, &#34;descricao&#34;, &#34;status&#34;],
+    )
+
+    # dfr = compare_actual_df_with_redis_df(
+    #     dfr,
+    #     dfr_redis=dfr_redis,
+    #     columns=columns,
+
+    # )
+
+    # save_redis_df(
+    #     dfr_redis,
+    #     dataset_id,
+    #     table_id,
+    #     redis_name,
+    #     keep_n_days=1,
+    #     mode = mode,
+    # )
+
+    path = save_data(dfr_treated)
+
+    task_upload = create_table_and_upload_to_gcs(
+        data_path=path,
+        dataset_id=dataset_id,
+        table_id=table_id,
+        dump_mode=dump_mode,
+        biglake_table=False,
+        wait=path,
+    )
+
+    # Warning: this task won&#39;t execute if we provide a date interval
+    # on parameters. The reason this happens is for if we want to
+    # perform backfills, it won&#39;t mess with the Redis interval.
+    # with case(date_interval_text, None):
+    #     set_redis_date_task = set_last_updated_on_redis(
+    #         dataset_id=dataset_id,
+    #         table_id=table_id_eventos,
+    #         mode=redis_mode,
+    #         current_time=current_time,
+    #         problem_ids_atividade=problem_ids_atividade,
+    #         # melhoria: adicionar forma de salvar os ids de atividades com problemas no backfill
+    #     )
+    #     set_redis_date_task.set_upstream(task_upload_eventos)
+    #     set_redis_date_task.set_upstream(task_upload_atividade_eventos)
+
+    with case(materialize_after_dump, True):
+        # Trigger DBT flow run
+        current_flow_labels = get_current_flow_labels()
+
+        materialization_flow = create_flow_run(
+            flow_name=utils_constants.FLOW_EXECUTE_DBT_MODEL_NAME.value,
+            project_name=constants.PREFECT_DEFAULT_PROJECT.value,
+            parameters={
+                &#34;dataset_id&#34;: dataset_id,
+                &#34;table_id&#34;: &#34;ocorrencias_orgaos_responsaveis&#34;,  # change to table_id
+                &#34;mode&#34;: materialization_mode,
+                &#34;materialize_to_datario&#34;: materialize_to_datario,
+            },
+            labels=current_flow_labels,
+            run_name=f&#34;Materialize {dataset_id}.ocorrencias_orgaos_responsaveis&#34;,
+        )
+
+        materialization_flow.set_upstream(task_upload)
+
+        wait_for_materialization = wait_for_flow_run(
+            materialization_flow,
+            stream_states=True,
+            stream_logs=True,
+            raise_final_state=True,
+        )
+
+        wait_for_materialization.max_retries = (
+            dump_db_constants.WAIT_FOR_MATERIALIZATION_RETRY_ATTEMPTS.value
+        )
+        wait_for_materialization.retry_delay = timedelta(
+            seconds=dump_db_constants.WAIT_FOR_MATERIALIZATION_RETRY_INTERVAL.value
+        )
+
+        with case(dump_to_gcs, True):
+            # Trigger Dump to GCS flow run with project id as datario
+            dump_to_gcs_flow = create_flow_run(
+                flow_name=utils_constants.FLOW_DUMP_TO_GCS_NAME.value,
+                project_name=constants.PREFECT_DEFAULT_PROJECT.value,
+                parameters={
+                    &#34;project_id&#34;: &#34;datario&#34;,
+                    &#34;dataset_id&#34;: dataset_id,
+                    &#34;table_id&#34;: table_id,
+                    &#34;maximum_bytes_processed&#34;: maximum_bytes_processed,
+                },
+                labels=[
+                    &#34;datario&#34;,
+                ],
+                run_name=f&#34;Dump to GCS {dataset_id}.{table_id}&#34;,
+            )
+            dump_to_gcs_flow.set_upstream(wait_for_materialization)
+
+            wait_for_dump_to_gcs = wait_for_flow_run(
+                dump_to_gcs_flow,
+                stream_states=True,
+                stream_logs=True,
+                raise_final_state=True,
+            )
+
+rj_cor_comando_atividades_evento_flow.storage = GCS(constants.GCS_FLOWS_BUCKET.value)
+rj_cor_comando_atividades_evento_flow.run_config = KubernetesRun(
+    image=constants.DOCKER_IMAGE.value,
+    labels=[
+        constants.RJ_COR_AGENT_LABEL.value,
+    ],
+)
+rj_cor_comando_atividades_evento_flow.schedule = every_hour
+
+
 # with Flow(
 #     &#34;COR: Comando - POPs e Atividades dos POPs&#34;,
 #     code_owners=[
diff --git a/rj_cor/comando/eventos/tasks.html b/rj_cor/comando/eventos/tasks.html
index afedc50e2..cbf1c667c 100644
--- a/rj_cor/comando/eventos/tasks.html
+++ b/rj_cor/comando/eventos/tasks.html
@@ -36,7 +36,6 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.tasks</code></h1
 
 # from copy import deepcopy
 from datetime import timedelta
-import json
 import os
 from pathlib import Path
 from typing import Any, Union, Tuple
@@ -47,79 +46,26 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.tasks</code></h1
 import pendulum
 from prefect import task
 
-# from prefect.engine.signals import ENDRUN
-# from prefect.engine.state import Skipped
+from prefect.engine.signals import ENDRUN
+from prefect.engine.state import Skipped
+
 # from prefect.triggers import all_successful
 
 from pipelines.rj_cor.comando.eventos.utils import (
     build_redis_key,
+    compare_actual_df_with_redis_df,
+    get_redis_output,  # TODO: atualizar o do utils.utils
     format_date,
     treat_wrong_id_pop,
 )
 from pipelines.utils.utils import (
-    get_redis_client,
     get_vault_secret,
     log,
     parse_date_columns,
     to_partitions,
-    treat_redis_output,
 )
 
 
-def get_redis_output(redis_key, is_df: bool = False):
-    &#34;&#34;&#34;
-    Get Redis output
-    Example: {b&#39;date&#39;: b&#39;2023-02-27 07:29:04&#39;}
-    &#34;&#34;&#34;
-    redis_client = get_redis_client()  # (host=&#34;127.0.0.1&#34;)
-
-    if is_df:
-        json_data = redis_client.get(redis_key)
-        print(type(json_data))
-        print(json_data)
-        if json_data:
-            # If data is found, parse the JSON string back to a Python object (dictionary)
-            data_dict = json.loads(json_data)
-            # Convert the dictionary back to a DataFrame
-            return pd.DataFrame(data_dict)
-
-        return pd.DataFrame()
-
-    output = redis_client.hgetall(redis_key)
-    if len(output) &gt; 0:
-        output = treat_redis_output(output)
-    return output
-
-
-def compare_actual_df_with_redis_df(
-    dfr: pd.DataFrame,
-    dfr_redis: pd.DataFrame,
-    columns: list,
-) -&gt; pd.DataFrame:
-    &#34;&#34;&#34;
-    Compare df from redis to actual df and return only the rows from actual df
-    that are not already saved on redis.
-    &#34;&#34;&#34;
-    for col in columns:
-        if col not in dfr_redis.columns:
-            dfr_redis[col] = None
-        dfr_redis[col] = dfr_redis[col].astype(dfr[col].dtypes)
-    log(f&#34;\nEnded conversion types from dfr to dfr_redis: \n{dfr_redis.dtypes}&#34;)
-
-    dfr_diff = (
-        pd.merge(dfr, dfr_redis, how=&#34;left&#34;, on=columns, indicator=True)
-        .query(&#39;_merge == &#34;left_only&#34;&#39;)
-        .drop(&#34;_merge&#34;, axis=1)
-    )
-    log(
-        f&#34;\nDf resulted from the difference between dft_redis and dfr: \n{dfr_diff.head()}&#34;
-    )
-
-    updated_dfr_redis = pd.concat([dfr_redis, dfr_diff[columns]])
-
-    return dfr_diff, updated_dfr_redis
-
-
 @task
 def get_date_interval(first_date, last_date) -&gt; Tuple[dict, str]:
     &#34;&#34;&#34;
@@ -174,11 +120,11 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.tasks</code></h1
 
 
 @task(
-    nout=3,
+    nout=1,
     max_retries=3,
     retry_delay=timedelta(seconds=60),
 )
-def download_data(first_date, last_date, wait=None) -&gt; pd.DataFrame:
+def download_data_ocorrencias(first_date, last_date, wait=None) -&gt; pd.DataFrame:
     &#34;&#34;&#34;
     Download data from API
     &#34;&#34;&#34;
@@ -186,7 +132,6 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.tasks</code></h1
 
     url_secret = get_vault_secret(&#34;comando&#34;)[&#34;data&#34;]
     url_eventos = url_secret[&#34;endpoint_eventos&#34;]
-    ## url_atividades_evento = url_secret[&#34;endpoint_atividades_evento&#34;]
 
     dfr = pd.read_json(f&#34;{url_eventos}/?data_i={first_date}&amp;data_f={last_date}&#34;)
 
@@ -194,7 +139,7 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.tasks</code></h1
 
 
 @task(nout=2)
-def treat_data(
+def treat_data_ocorrencias(
     dfr: pd.DataFrame,
     dfr_redis: pd.DataFrame,
     columns: list,
@@ -229,7 +174,7 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.tasks</code></h1
     if dfr.shape[0] == 0:
         skip_text = &#34;No new data available on API&#34;
         print(skip_text)
-        # raise ENDRUN(state=Skipped(skip_text))
+        raise ENDRUN(state=Skipped(skip_text))
 
     dfr[&#34;tipo&#34;] = dfr[&#34;tipo&#34;].replace(
         {
@@ -277,6 +222,109 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.tasks</code></h1
     # Treat id_pop col
     dfr[&#34;id_pop&#34;] = dfr[&#34;id_pop&#34;].astype(float).astype(int)
 
+    for col in [&#34;data_inicio&#34;, &#34;data_fim&#34;]:
+        dfr[col] = pd.to_datetime(dfr[col], errors=&#34;coerce&#34;)
+
+    for col in [&#34;data_inicio&#34;, &#34;data_fim&#34;]:
+        dfr[col] = dfr[col].dt.strftime(&#34;%Y-%m-%d %H:%M:%S&#34;)
+
+    # Set the order to match the original table
+    dfr = dfr[mandatory_cols]
+
+    # Create a column with time of row creation to keep last event on dbt
+    dfr[&#34;created_at&#34;] = pendulum.now(tz=&#34;America/Sao_Paulo&#34;).strftime(
+        &#34;%Y-%m-%d %H:%M:%S&#34;
+    )
+
+    return dfr.drop_duplicates(), dfr_redis
+
+
+@task(
+    nout=1,
+    max_retries=3,
+    retry_delay=timedelta(seconds=60),
+)
+def download_data_atividades(first_date, last_date, wait=None) -&gt; pd.DataFrame:
+    &#34;&#34;&#34;
+    Download data from API
+    &#34;&#34;&#34;
+
+    url_secret = get_vault_secret(&#34;comando&#34;)[&#34;data&#34;]
+    url_atividades_evento = url_secret[&#34;endpoint_atividades_evento&#34;]
+
+    dfr = pd.read_json(
+        f&#34;{url_atividades_evento}/?data_i={first_date}&amp;data_f={last_date}&#34;
+    )
+
+    return dfr
+
+
+@task(nout=2)
+def treat_data_atividades(
+    dfr: pd.DataFrame,
+    dfr_redis: pd.DataFrame,
+    columns: list,
+) -&gt; Tuple[pd.DataFrame, pd.DataFrame]:
+    &#34;&#34;&#34;
+    Normalize data to be similiar to old API.
+    &#34;&#34;&#34;
+
+    print(&#34;Start treating data&#34;)
+    dfr.orgao = dfr.orgao.replace([&#34;\r&#34;, &#34;\n&#34;], [&#34;&#34;, &#34;&#34;], regex=True)
+
+    print(f&#34;Dataframe before comparing with last data saved on redis {dfr.head()}&#34;)
+
+    dfr, dfr_redis = compare_actual_df_with_redis_df(
+        dfr,
+        dfr_redis,
+        columns,
+    )
+    print(f&#34;Dataframe after comparing with last data saved on redis {dfr.head()}&#34;)
+
+    # If df is empty stop flow
+    if dfr.shape[0] == 0:
+        skip_text = &#34;No new data available on API&#34;
+        print(skip_text)
+        raise ENDRUN(state=Skipped(skip_text))
+
+    mandatory_cols = [
+        &#34;id_evento&#34;,
+        &#34;sigla&#34;,
+        &#34;orgao&#34;,  # esse não tem na tabela antiga
+        &#34;data_chegada&#34;,
+        &#34;data_inicio&#34;,
+        &#34;data_fim&#34;,
+        &#34;descricao&#34;,
+        &#34;status&#34;,
+    ]
+
+    # Create cols if they don exist on new API
+    for col in mandatory_cols:
+        if col not in dfr.columns:
+            dfr[col] = None
+
+    categorical_cols = [
+        &#34;sigla&#34;,
+        &#34;orgao&#34;,
+        &#34;descricao&#34;,
+        &#34;status&#34;,
+    ]
+
+    print(&#34;\n\nDEBUG&#34;, dfr[categorical_cols])
+    for i in categorical_cols:
+        dfr[i] = dfr[i].str.capitalize()
+        # dfr[i] = dfr[i].apply(unidecode)
+
+    for col in [&#34;data_inicio&#34;, &#34;data_fim&#34;, &#34;data_chegada&#34;]:
+        dfr[col] = pd.to_datetime(dfr[col], errors=&#34;coerce&#34;)
+
+    # TODO: Essa conversão é temporária
+    for col in [&#34;data_inicio&#34;, &#34;data_fim&#34;, &#34;data_chegada&#34;]:
+        dfr[col] = dfr[col].dt.tz_convert(&#34;America/Sao_Paulo&#34;)
+
+    for col in [&#34;data_inicio&#34;, &#34;data_fim&#34;, &#34;data_chegada&#34;]:
+        dfr[col] = dfr[col].dt.strftime(&#34;%Y-%m-%d %H:%M:%S&#34;)
+
     # Set the order to match the original table
     dfr = dfr[mandatory_cols]
 
@@ -348,47 +396,37 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.tasks</code></h1
 <section>
 <h2 class="section-title" id="header-functions">Functions</h2>
 <dl>
-<dt id="pipelines.rj_cor.comando.eventos.tasks.compare_actual_df_with_redis_df"><code class="name flex">
-<span>def <span class="ident">compare_actual_df_with_redis_df</span></span>(<span>dfr: pandas.core.frame.DataFrame, dfr_redis: pandas.core.frame.DataFrame, columns: list) ‑> pandas.core.frame.DataFrame</span>
+<dt id="pipelines.rj_cor.comando.eventos.tasks.download_data_atividades"><code class="name flex">
+<span>def <span class="ident">download_data_atividades</span></span>(<span>first_date, last_date, wait=None) ‑> pandas.core.frame.DataFrame</span>
 </code></dt>
 <dd>
-<div class="desc"><p>Compare df from redis to actual df and return only the rows from actual df
-that are not already saved on redis.</p></div>
+<div class="desc"><p>Download data from API</p></div>
 <details class="source">
 <summary>
 <span>Expand source code</span>
 </summary>
-<pre><code class="python">def compare_actual_df_with_redis_df(
-    dfr: pd.DataFrame,
-    dfr_redis: pd.DataFrame,
-    columns: list,
-) -&gt; pd.DataFrame:
+<pre><code class="python">@task(
+    nout=1,
+    max_retries=3,
+    retry_delay=timedelta(seconds=60),
+)
+def download_data_atividades(first_date, last_date, wait=None) -&gt; pd.DataFrame:
     &#34;&#34;&#34;
-    Compare df from redis to actual df and return only the rows from actual df
-    that are not already saved on redis.
+    Download data from API
     &#34;&#34;&#34;
-    for col in columns:
-        if col not in dfr_redis.columns:
-            dfr_redis[col] = None
-        dfr_redis[col] = dfr_redis[col].astype(dfr[col].dtypes)
-    log(f&#34;\nEnded conversion types from dfr to dfr_redis: \n{dfr_redis.dtypes}&#34;)
 
-    dfr_diff = (
-        pd.merge(dfr, dfr_redis, how=&#34;left&#34;, on=columns, indicator=True)
-        .query(&#39;_merge == &#34;left_only&#34;&#39;)
-        .drop(&#34;_merge&#34;, axis=1)
-    )
-    log(
-        f&#34;\nDf resulted from the difference between dft_redis and dfr: \n{dfr_diff.head()}&#34;
-    )
+    url_secret = get_vault_secret(&#34;comando&#34;)[&#34;data&#34;]
+    url_atividades_evento = url_secret[&#34;endpoint_atividades_evento&#34;]
 
-    updated_dfr_redis = pd.concat([dfr_redis, dfr_diff[columns]])
+    dfr = pd.read_json(
+        f&#34;{url_atividades_evento}/?data_i={first_date}&amp;data_f={last_date}&#34;
+    )
 
-    return dfr_diff, updated_dfr_redis</code></pre>
+    return dfr</code></pre>
 </details>
 </dd>
-<dt id="pipelines.rj_cor.comando.eventos.tasks.download_data"><code class="name flex">
-<span>def <span class="ident">download_data</span></span>(<span>first_date, last_date, wait=None) ‑> pandas.core.frame.DataFrame</span>
+<dt id="pipelines.rj_cor.comando.eventos.tasks.download_data_ocorrencias"><code class="name flex">
+<span>def <span class="ident">download_data_ocorrencias</span></span>(<span>first_date, last_date, wait=None) ‑> pandas.core.frame.DataFrame</span>
 </code></dt>
 <dd>
 <div class="desc"><p>Download data from API</p></div>
@@ -397,11 +435,11 @@ <h2 class="section-title" id="header-functions">Functions</h2>
 <span>Expand source code</span>
 </summary>
 <pre><code class="python">@task(
-    nout=3,
+    nout=1,
     max_retries=3,
     retry_delay=timedelta(seconds=60),
 )
-def download_data(first_date, last_date, wait=None) -&gt; pd.DataFrame:
+def download_data_ocorrencias(first_date, last_date, wait=None) -&gt; pd.DataFrame:
     &#34;&#34;&#34;
     Download data from API
     &#34;&#34;&#34;
@@ -409,7 +447,6 @@ <h2 class="section-title" id="header-functions">Functions</h2>
 
     url_secret = get_vault_secret(&#34;comando&#34;)[&#34;data&#34;]
     url_eventos = url_secret[&#34;endpoint_eventos&#34;]
-    ## url_atividades_evento = url_secret[&#34;endpoint_atividades_evento&#34;]
 
     dfr = pd.read_json(f&#34;{url_eventos}/?data_i={first_date}&amp;data_f={last_date}&#34;)
 
@@ -491,41 +528,6 @@ <h2 class="section-title" id="header-functions">Functions</h2>
     return dfr_redis</code></pre>
 </details>
 </dd>
-<dt id="pipelines.rj_cor.comando.eventos.tasks.get_redis_output"><code class="name flex">
-<span>def <span class="ident">get_redis_output</span></span>(<span>redis_key, is_df: bool = False)</span>
-</code></dt>
-<dd>
-<div class="desc"><p>Get Redis output
-Example: {b'date': b'2023-02-27 07:29:04'}</p></div>
-<details class="source">
-<summary>
-<span>Expand source code</span>
-</summary>
-<pre><code class="python">def get_redis_output(redis_key, is_df: bool = False):
-    &#34;&#34;&#34;
-    Get Redis output
-    Example: {b&#39;date&#39;: b&#39;2023-02-27 07:29:04&#39;}
-    &#34;&#34;&#34;
-    redis_client = get_redis_client()  # (host=&#34;127.0.0.1&#34;)
-
-    if is_df:
-        json_data = redis_client.get(redis_key)
-        print(type(json_data))
-        print(json_data)
-        if json_data:
-            # If data is found, parse the JSON string back to a Python object (dictionary)
-            data_dict = json.loads(json_data)
-            # Convert the dictionary back to a DataFrame
-            return pd.DataFrame(data_dict)
-
-        return pd.DataFrame()
-
-    output = redis_client.hgetall(redis_key)
-    if len(output) &gt; 0:
-        output = treat_redis_output(output)
-    return output</code></pre>
-</details>
-</dd>
 <dt id="pipelines.rj_cor.comando.eventos.tasks.not_none"><code class="name flex">
 <span>def <span class="ident">not_none</span></span>(<span>something: Any) ‑> bool</span>
 </code></dt>
@@ -606,8 +608,94 @@ <h2 class="section-title" id="header-functions">Functions</h2>
     return path_to_directory</code></pre>
 </details>
 </dd>
-<dt id="pipelines.rj_cor.comando.eventos.tasks.treat_data"><code class="name flex">
-<span>def <span class="ident">treat_data</span></span>(<span>dfr: pandas.core.frame.DataFrame, dfr_redis: pandas.core.frame.DataFrame, columns: list) ‑> Tuple[pandas.core.frame.DataFrame, pandas.core.frame.DataFrame]</span>
+<dt id="pipelines.rj_cor.comando.eventos.tasks.treat_data_atividades"><code class="name flex">
+<span>def <span class="ident">treat_data_atividades</span></span>(<span>dfr: pandas.core.frame.DataFrame, dfr_redis: pandas.core.frame.DataFrame, columns: list) ‑> Tuple[pandas.core.frame.DataFrame, pandas.core.frame.DataFrame]</span>
+</code></dt>
+<dd>
+<div class="desc"><p>Normalize data to be similiar to old API.</p></div>
+<details class="source">
+<summary>
+<span>Expand source code</span>
+</summary>
+<pre><code class="python">@task(nout=2)
+def treat_data_atividades(
+    dfr: pd.DataFrame,
+    dfr_redis: pd.DataFrame,
+    columns: list,
+) -&gt; Tuple[pd.DataFrame, pd.DataFrame]:
+    &#34;&#34;&#34;
+    Normalize data to be similiar to old API.
+    &#34;&#34;&#34;
+
+    print(&#34;Start treating data&#34;)
+    dfr.orgao = dfr.orgao.replace([&#34;\r&#34;, &#34;\n&#34;], [&#34;&#34;, &#34;&#34;], regex=True)
+
+    print(f&#34;Dataframe before comparing with last data saved on redis {dfr.head()}&#34;)
+
+    dfr, dfr_redis = compare_actual_df_with_redis_df(
+        dfr,
+        dfr_redis,
+        columns,
+    )
+    print(f&#34;Dataframe after comparing with last data saved on redis {dfr.head()}&#34;)
+
+    # If df is empty stop flow
+    if dfr.shape[0] == 0:
+        skip_text = &#34;No new data available on API&#34;
+        print(skip_text)
+        raise ENDRUN(state=Skipped(skip_text))
+
+    mandatory_cols = [
+        &#34;id_evento&#34;,
+        &#34;sigla&#34;,
+        &#34;orgao&#34;,  # esse não tem na tabela antiga
+        &#34;data_chegada&#34;,
+        &#34;data_inicio&#34;,
+        &#34;data_fim&#34;,
+        &#34;descricao&#34;,
+        &#34;status&#34;,
+    ]
+
+    # Create cols if they don exist on new API
+    for col in mandatory_cols:
+        if col not in dfr.columns:
+            dfr[col] = None
+
+    categorical_cols = [
+        &#34;sigla&#34;,
+        &#34;orgao&#34;,
+        &#34;descricao&#34;,
+        &#34;status&#34;,
+    ]
+
+    print(&#34;\n\nDEBUG&#34;, dfr[categorical_cols])
+    for i in categorical_cols:
+        dfr[i] = dfr[i].str.capitalize()
+        # dfr[i] = dfr[i].apply(unidecode)
+
+    for col in [&#34;data_inicio&#34;, &#34;data_fim&#34;, &#34;data_chegada&#34;]:
+        dfr[col] = pd.to_datetime(dfr[col], errors=&#34;coerce&#34;)
+
+    # TODO: Essa conversão é temporária
+    for col in [&#34;data_inicio&#34;, &#34;data_fim&#34;, &#34;data_chegada&#34;]:
+        dfr[col] = dfr[col].dt.tz_convert(&#34;America/Sao_Paulo&#34;)
+
+    for col in [&#34;data_inicio&#34;, &#34;data_fim&#34;, &#34;data_chegada&#34;]:
+        dfr[col] = dfr[col].dt.strftime(&#34;%Y-%m-%d %H:%M:%S&#34;)
+
+    # Set the order to match the original table
+    dfr = dfr[mandatory_cols]
+
+    # Create a column with time of row creation to keep last event on dbt
+    dfr[&#34;created_at&#34;] = pendulum.now(tz=&#34;America/Sao_Paulo&#34;).strftime(
+        &#34;%Y-%m-%d %H:%M:%S&#34;
+    )
+
+    return dfr.drop_duplicates(), dfr_redis</code></pre>
+</details>
+</dd>
+<dt id="pipelines.rj_cor.comando.eventos.tasks.treat_data_ocorrencias"><code class="name flex">
+<span>def <span class="ident">treat_data_ocorrencias</span></span>(<span>dfr: pandas.core.frame.DataFrame, dfr_redis: pandas.core.frame.DataFrame, columns: list) ‑> Tuple[pandas.core.frame.DataFrame, pandas.core.frame.DataFrame]</span>
 </code></dt>
 <dd>
 <div class="desc"><p>Rename cols and normalize data.</p></div>
@@ -616,7 +704,7 @@ <h2 class="section-title" id="header-functions">Functions</h2>
 <span>Expand source code</span>
 </summary>
 <pre><code class="python">@task(nout=2)
-def treat_data(
+def treat_data_ocorrencias(
     dfr: pd.DataFrame,
     dfr_redis: pd.DataFrame,
     columns: list,
@@ -651,7 +739,7 @@ <h2 class="section-title" id="header-functions">Functions</h2>
     if dfr.shape[0] == 0:
         skip_text = &#34;No new data available on API&#34;
         print(skip_text)
-        # raise ENDRUN(state=Skipped(skip_text))
+        raise ENDRUN(state=Skipped(skip_text))
 
     dfr[&#34;tipo&#34;] = dfr[&#34;tipo&#34;].replace(
         {
@@ -699,6 +787,12 @@ <h2 class="section-title" id="header-functions">Functions</h2>
     # Treat id_pop col
     dfr[&#34;id_pop&#34;] = dfr[&#34;id_pop&#34;].astype(float).astype(int)
 
+    for col in [&#34;data_inicio&#34;, &#34;data_fim&#34;]:
+        dfr[col] = pd.to_datetime(dfr[col], errors=&#34;coerce&#34;)
+
+    for col in [&#34;data_inicio&#34;, &#34;data_fim&#34;]:
+        dfr[col] = dfr[col].dt.strftime(&#34;%Y-%m-%d %H:%M:%S&#34;)
+
     # Set the order to match the original table
     dfr = dfr[mandatory_cols]
 
@@ -774,15 +868,15 @@ <h1>Index</h1>
 </li>
 <li><h3><a href="#header-functions">Functions</a></h3>
 <ul class="">
-<li><code><a title="pipelines.rj_cor.comando.eventos.tasks.compare_actual_df_with_redis_df" href="#pipelines.rj_cor.comando.eventos.tasks.compare_actual_df_with_redis_df">compare_actual_df_with_redis_df</a></code></li>
-<li><code><a title="pipelines.rj_cor.comando.eventos.tasks.download_data" href="#pipelines.rj_cor.comando.eventos.tasks.download_data">download_data</a></code></li>
+<li><code><a title="pipelines.rj_cor.comando.eventos.tasks.download_data_atividades" href="#pipelines.rj_cor.comando.eventos.tasks.download_data_atividades">download_data_atividades</a></code></li>
+<li><code><a title="pipelines.rj_cor.comando.eventos.tasks.download_data_ocorrencias" href="#pipelines.rj_cor.comando.eventos.tasks.download_data_ocorrencias">download_data_ocorrencias</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.tasks.get_date_interval" href="#pipelines.rj_cor.comando.eventos.tasks.get_date_interval">get_date_interval</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.tasks.get_redis_df" href="#pipelines.rj_cor.comando.eventos.tasks.get_redis_df">get_redis_df</a></code></li>
-<li><code><a title="pipelines.rj_cor.comando.eventos.tasks.get_redis_output" href="#pipelines.rj_cor.comando.eventos.tasks.get_redis_output">get_redis_output</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.tasks.not_none" href="#pipelines.rj_cor.comando.eventos.tasks.not_none">not_none</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.tasks.save_data" href="#pipelines.rj_cor.comando.eventos.tasks.save_data">save_data</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.tasks.save_no_partition" href="#pipelines.rj_cor.comando.eventos.tasks.save_no_partition">save_no_partition</a></code></li>
-<li><code><a title="pipelines.rj_cor.comando.eventos.tasks.treat_data" href="#pipelines.rj_cor.comando.eventos.tasks.treat_data">treat_data</a></code></li>
+<li><code><a title="pipelines.rj_cor.comando.eventos.tasks.treat_data_atividades" href="#pipelines.rj_cor.comando.eventos.tasks.treat_data_atividades">treat_data_atividades</a></code></li>
+<li><code><a title="pipelines.rj_cor.comando.eventos.tasks.treat_data_ocorrencias" href="#pipelines.rj_cor.comando.eventos.tasks.treat_data_ocorrencias">treat_data_ocorrencias</a></code></li>
 </ul>
 </li>
 </ul>
diff --git a/rj_cor/comando/eventos/utils.html b/rj_cor/comando/eventos/utils.html
index fe92fef41..49ec71f86 100644
--- a/rj_cor/comando/eventos/utils.html
+++ b/rj_cor/comando/eventos/utils.html
@@ -37,7 +37,13 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.utils</code></h1
 from requests.adapters import HTTPAdapter, Retry
 
 import pendulum
-from pipelines.utils.utils import get_vault_secret, log
+import pandas as pd
+from pipelines.utils.utils import (
+    get_redis_client,
+    get_vault_secret,
+    log,
+    treat_redis_output,
+)
 
 
 def format_date(first_date, last_date):
@@ -52,6 +58,58 @@ <h1 class="title">Module <code>pipelines.rj_cor.comando.eventos.utils</code></h1
     return first_date, last_date
 
 
+def get_redis_output(redis_key, is_df: bool = False):
+    &#34;&#34;&#34;
+    Get Redis output. Use get to obtain a df from redis or hgetall if is a key value pair.
+    &#34;&#34;&#34;
+    redis_client = get_redis_client()  # (host=&#34;127.0.0.1&#34;)
+
+    if is_df:
+        json_data = redis_client.get(redis_key)
+        log(f&#34;[DEGUB] json_data {json_data}&#34;)
+        if json_data:
+            # If data is found, parse the JSON string back to a Python object (dictionary)
+            data_dict = json.loads(json_data)
+            # Convert the dictionary back to a DataFrame
+            return pd.DataFrame(data_dict)
+
+        return pd.DataFrame()
+
+    output = redis_client.hgetall(redis_key)
+    if len(output) &gt; 0:
+        output = treat_redis_output(output)
+    return output
+
+
+def compare_actual_df_with_redis_df(
+    dfr: pd.DataFrame,
+    dfr_redis: pd.DataFrame,
+    columns: list,
+) -&gt; pd.DataFrame:
+    &#34;&#34;&#34;
+    Compare df from redis to actual df and return only the rows from actual df
+    that are not already saved on redis.
+    &#34;&#34;&#34;
+    for col in columns:
+        if col not in dfr_redis.columns:
+            dfr_redis[col] = None
+        dfr_redis[col] = dfr_redis[col].astype(dfr[col].dtypes)
+    log(f&#34;\nEnded conversion types from dfr to dfr_redis: \n{dfr_redis.dtypes}&#34;)
+
+    dfr_diff = (
+        pd.merge(dfr, dfr_redis, how=&#34;left&#34;, on=columns, indicator=True)
+        .query(&#39;_merge == &#34;left_only&#34;&#39;)
+        .drop(&#34;_merge&#34;, axis=1)
+    )
+    log(
+        f&#34;\nDf resulted from the difference between dft_redis and dfr: \n{dfr_diff.head()}&#34;
+    )
+
+    updated_dfr_redis = pd.concat([dfr_redis, dfr_diff[columns]])
+
+    return dfr_diff, updated_dfr_redis
+
+
 def treat_wrong_id_pop(dfr):
     &#34;&#34;&#34;
     Create id_pop based on pop_titulo column
@@ -174,6 +232,45 @@ <h2 class="section-title" id="header-functions">Functions</h2>
     return key</code></pre>
 </details>
 </dd>
+<dt id="pipelines.rj_cor.comando.eventos.utils.compare_actual_df_with_redis_df"><code class="name flex">
+<span>def <span class="ident">compare_actual_df_with_redis_df</span></span>(<span>dfr: pandas.core.frame.DataFrame, dfr_redis: pandas.core.frame.DataFrame, columns: list) ‑> pandas.core.frame.DataFrame</span>
+</code></dt>
+<dd>
+<div class="desc"><p>Compare df from redis to actual df and return only the rows from actual df
+that are not already saved on redis.</p></div>
+<details class="source">
+<summary>
+<span>Expand source code</span>
+</summary>
+<pre><code class="python">def compare_actual_df_with_redis_df(
+    dfr: pd.DataFrame,
+    dfr_redis: pd.DataFrame,
+    columns: list,
+) -&gt; pd.DataFrame:
+    &#34;&#34;&#34;
+    Compare df from redis to actual df and return only the rows from actual df
+    that are not already saved on redis.
+    &#34;&#34;&#34;
+    for col in columns:
+        if col not in dfr_redis.columns:
+            dfr_redis[col] = None
+        dfr_redis[col] = dfr_redis[col].astype(dfr[col].dtypes)
+    log(f&#34;\nEnded conversion types from dfr to dfr_redis: \n{dfr_redis.dtypes}&#34;)
+
+    dfr_diff = (
+        pd.merge(dfr, dfr_redis, how=&#34;left&#34;, on=columns, indicator=True)
+        .query(&#39;_merge == &#34;left_only&#34;&#39;)
+        .drop(&#34;_merge&#34;, axis=1)
+    )
+    log(
+        f&#34;\nDf resulted from the difference between dft_redis and dfr: \n{dfr_diff.head()}&#34;
+    )
+
+    updated_dfr_redis = pd.concat([dfr_redis, dfr_diff[columns]])
+
+    return dfr_diff, updated_dfr_redis</code></pre>
+</details>
+</dd>
 <dt id="pipelines.rj_cor.comando.eventos.utils.format_date"><code class="name flex">
 <span>def <span class="ident">format_date</span></span>(<span>first_date, last_date)</span>
 </code></dt>
@@ -196,6 +293,38 @@ <h2 class="section-title" id="header-functions">Functions</h2>
     return first_date, last_date</code></pre>
 </details>
 </dd>
+<dt id="pipelines.rj_cor.comando.eventos.utils.get_redis_output"><code class="name flex">
+<span>def <span class="ident">get_redis_output</span></span>(<span>redis_key, is_df: bool = False)</span>
+</code></dt>
+<dd>
+<div class="desc"><p>Get Redis output. Use get to obtain a df from redis or hgetall if is a key value pair.</p></div>
+<details class="source">
+<summary>
+<span>Expand source code</span>
+</summary>
+<pre><code class="python">def get_redis_output(redis_key, is_df: bool = False):
+    &#34;&#34;&#34;
+    Get Redis output. Use get to obtain a df from redis or hgetall if is a key value pair.
+    &#34;&#34;&#34;
+    redis_client = get_redis_client()  # (host=&#34;127.0.0.1&#34;)
+
+    if is_df:
+        json_data = redis_client.get(redis_key)
+        log(f&#34;[DEGUB] json_data {json_data}&#34;)
+        if json_data:
+            # If data is found, parse the JSON string back to a Python object (dictionary)
+            data_dict = json.loads(json_data)
+            # Convert the dictionary back to a DataFrame
+            return pd.DataFrame(data_dict)
+
+        return pd.DataFrame()
+
+    output = redis_client.hgetall(redis_key)
+    if len(output) &gt; 0:
+        output = treat_redis_output(output)
+    return output</code></pre>
+</details>
+</dd>
 <dt id="pipelines.rj_cor.comando.eventos.utils.get_token"><code class="name flex">
 <span>def <span class="ident">get_token</span></span>(<span>)</span>
 </code></dt>
@@ -373,7 +502,9 @@ <h1>Index</h1>
 <li><h3><a href="#header-functions">Functions</a></h3>
 <ul class="">
 <li><code><a title="pipelines.rj_cor.comando.eventos.utils.build_redis_key" href="#pipelines.rj_cor.comando.eventos.utils.build_redis_key">build_redis_key</a></code></li>
+<li><code><a title="pipelines.rj_cor.comando.eventos.utils.compare_actual_df_with_redis_df" href="#pipelines.rj_cor.comando.eventos.utils.compare_actual_df_with_redis_df">compare_actual_df_with_redis_df</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.utils.format_date" href="#pipelines.rj_cor.comando.eventos.utils.format_date">format_date</a></code></li>
+<li><code><a title="pipelines.rj_cor.comando.eventos.utils.get_redis_output" href="#pipelines.rj_cor.comando.eventos.utils.get_redis_output">get_redis_output</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.utils.get_token" href="#pipelines.rj_cor.comando.eventos.utils.get_token">get_token</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.utils.get_url" href="#pipelines.rj_cor.comando.eventos.utils.get_url">get_url</a></code></li>
 <li><code><a title="pipelines.rj_cor.comando.eventos.utils.treat_wrong_id_pop" href="#pipelines.rj_cor.comando.eventos.utils.treat_wrong_id_pop">treat_wrong_id_pop</a></code></li>