Simplifying logic

galvana · galvana · commit b5910dd229c5 · 2025-03-09T00:15:21.000-08:00
diff --git a/src/fides/api/service/connectors/query_configs/bigquery_query_config.py b/src/fides/api/service/connectors/query_configs/bigquery_query_config.py
@@ -18,7 +18,13 @@
 from fides.api.service.connectors.query_configs.query_config import (
     QueryStringWithoutTuplesOverrideQueryConfig,
 )
-from fides.api.util.collection_util import Row, filter_nonempty_values, unflatten_dict
+from fides.api.util.collection_util import (
+    Row,
+    filter_nonempty_values,
+    flatten_dict,
+    merge_dicts,
+    unflatten_dict,
+)
 
 
 class BigQueryQueryConfig(QueryStringWithoutTuplesOverrideQueryConfig):
@@ -124,44 +130,28 @@ def generate_update(
         This implementation handles nested fields by grouping them as JSON objects rather than
         individual field updates.
         """
-        # Get initial update value map
+        # Get initial update value map (already flattened)
         update_value_map: Dict[str, Any] = self.update_value_map(row, policy, request)
 
-        # Convert flattened paths to nested structure using unflatten_dict
-        unflattened_update_map = unflatten_dict(update_value_map)
-
-        # Prepare final update map, preserving original nested structures
-        final_update_map = {}
-        for field, value in unflattened_update_map.items():
-            if isinstance(value, dict):
-                # For nested fields, preserve original structure and update only changed values
-                original_struct = row.get(field, {})
-                if isinstance(original_struct, dict):
-                    updated_struct = {**original_struct, **value}
-                    final_update_map[field] = updated_struct
-            elif isinstance(value, list):
-                # Handle array fields, preserving unmodified values
-                original_array = row.get(field, [])
-                if isinstance(original_array, list):
-                    updated_array = []
-
-                    # For each item in the original array
-                    for i, original_item in enumerate(original_array):
-                        if i < len(value):
-                            updated_item = value[i]
-                            # If both are dictionaries, merge them to preserve unmodified fields
-                            if isinstance(original_item, dict) and isinstance(
-                                updated_item, dict
-                            ):
-                                updated_item = {**original_item, **updated_item}
-                            updated_array.append(updated_item)
-                        else:
-                            updated_array.append(original_item)
-
-                    final_update_map[field] = updated_array
-            else:
-                # Keep regular fields
-                final_update_map[field] = value
+        # 1. Take update_value_map as-is (already flattened)
+
+        # 2. Flatten the row
+        flattened_row = flatten_dict(row)
+
+        # 3. Merge flattened_row with update_value_map (update_value_map takes precedence)
+        merged_dict = merge_dicts(flattened_row, update_value_map)
+
+        # 4. Unflatten the merged dictionary
+        nested_result = unflatten_dict(merged_dict)
+
+        # 5. Only keep top-level keys that are in the update_value_map
+        # Get unique top-level keys from update_value_map
+        top_level_keys = {key.split(".")[0] for key in update_value_map.keys()}
+
+        # Filter the nested result to only include those top-level keys
+        final_update_map = {
+            k: v for k, v in nested_result.items() if k in top_level_keys
+        }
 
         # Use existing non-empty reference fields mechanism for WHERE clause
         non_empty_reference_field_keys: Dict[str, Field] = filter_nonempty_values(
diff --git a/src/fides/api/util/collection_util.py b/src/fides/api/util/collection_util.py
@@ -176,3 +176,60 @@ def unflatten_dict(flat_dict: Dict[str, Any], separator: str = ".") -> Dict[str,
                 f"Error unflattening dictionary, conflicting levels detected: {exc}"
             )
     return output
+
+
+def flatten_dict(data: Any, prefix: str = "", separator: str = ".") -> Dict[str, Any]:
+    """
+    Recursively flatten a dictionary or list into a flat dictionary with dot-notation keys.
+    Handles nested dictionaries and arrays with proper indices.
+
+    example:
+
+    {
+        "A": {
+            "B": "1",
+            "C": "2"
+        },
+        "D": [
+            {"E": "3"},
+            {"E": "4"}
+        ]
+    }
+
+    becomes
+
+    {
+        "A.B": "1",
+        "A.C": "2",
+        "D.0.E": "3",
+        "D.1.E": "4"
+    }
+
+    Args:
+        data: The data to flatten (dict, list, or scalar value)
+        prefix: The current key prefix (used in recursion)
+        separator: The separator to use between key segments (default: ".")
+
+    Returns:
+        A flattened dictionary with dot-notation keys
+    """
+    items = {}
+
+    if isinstance(data, dict):
+        for k, v in data.items():
+            new_key = f"{prefix}{separator}{k}" if prefix else k
+            if isinstance(v, (dict, list)):
+                items.update(flatten_dict(v, new_key, separator))
+            else:
+                items[new_key] = v
+    elif isinstance(data, list):
+        for i, v in enumerate(data):
+            new_key = f"{prefix}{separator}{i}"
+            if isinstance(v, (dict, list)):
+                items.update(flatten_dict(v, new_key, separator))
+            else:
+                items[new_key] = v
+    else:
+        items[prefix] = data
+
+    return items