awslabs · kashif · May 11, 2022 · May 11, 2022 · May 12, 2022 · May 12, 2022
diff --git a/src/gluonts/core/serde/pd.py b/src/gluonts/core/serde/pd.py
@@ -32,6 +32,20 @@ def encode_pd_timestamp(v: pd.Timestamp) -> Any:
     }
 
 
+@encode.register(pd.DatetimeIndex)
+def encode_pd_datetime_index(v: pd.DatetimeIndex) -> Any:
+    """
+    Specializes :func:`encode` for invocations where ``v`` is an instance of
+    the :class:`~pandas.DatetimeIndex` class.
+    """
+    return {
+        "__kind__": Kind.Instance,
+        "class": "pandas.DatetimeIndex",
+        "args": [encode([str(indx) for indx in v])],
+        "kwargs": {"freq": v.freqstr if v.freq else None},
+    }
+
+
 @encode.register(pd.Period)
 def encode_pd_period(v: pd.Period) -> Any:
     """

diff --git a/src/gluonts/dataset/common.py b/src/gluonts/dataset/common.py
@@ -290,6 +290,8 @@ def __call__(self, data: DataEntry) -> DataEntry:
                 data[self.name] = pd.Timestamp(data[self.name])
             else:
                 data[self.name] = _as_period(data[self.name], self.freq)
+            if FieldName.INDEX in data:
+                data[FieldName.INDEX] = pd.DatetimeIndex(data[FieldName.INDEX])
         except (TypeError, ValueError) as e:
             raise GluonTSDataError(
                 f'Error "{e}" occurred, when reading field "{self.name}"'

diff --git a/src/gluonts/dataset/field_names.py b/src/gluonts/dataset/field_names.py
@@ -46,3 +46,5 @@ class FieldName:
     FORECAST_START = "forecast_start"
 
     TARGET_DIM_INDICATOR = "target_dimension_indicator"
+
+    INDEX = "index"
diff --git a/src/gluonts/dataset/util.py b/src/gluonts/dataset/util.py
@@ -50,7 +50,9 @@ def to_pandas(entry: DataEntry, freq: Optional[str] = None) -> pd.Series:
     pandas.Series
         Pandas time series object.
     """
-    return pd.Series(
-        entry[FieldName.TARGET],
-        index=period_index(entry, freq=freq),
-    )
+    if FieldName.INDEX in entry:
+        index = entry[FieldName.INDEX]
+    else:
+        index = period_index(entry, freq=freq)
+
+    return pd.Series(entry[FieldName.TARGET], index=index)
diff --git a/src/gluonts/model/forecast.py b/src/gluonts/model/forecast.py
@@ -353,7 +353,7 @@ def plot(
             )
 
     @property
-    def index(self) -> pd.PeriodIndex:
+    def index(self) -> Union[pd.DatetimeIndex, pd.PeriodIndex]:
         if self._index is None:
             self._index = pd.period_range(
                 self.start_date,
@@ -408,6 +408,8 @@ class SampleForecast(Forecast):
     info
         additional information that the forecaster may provide e.g. estimated
         parameters, number of iterations ran etc.
+    index
+        optional datatime index of the forecast for irregular time series.
     """
 
     @validated()
@@ -417,6 +419,7 @@ def __init__(
         start_date: pd.Period,
         item_id: Optional[str] = None,
         info: Optional[Dict] = None,
+        index: Optional[Union[pd.DatetimeIndex, pd.PeriodIndex]] = None,
     ) -> None:
         assert isinstance(
             samples, np.ndarray
@@ -431,6 +434,8 @@ def __init__(
         self._dim = None
         self.item_id = item_id
         self.info = info
+        if index is not None:
+            self._index = index[-self.prediction_length :]
 
         assert isinstance(
             start_date, pd.Period
@@ -494,6 +499,7 @@ def copy_dim(self, dim: int) -> "SampleForecast":
             start_date=self.start_date,
             item_id=self.item_id,
             info=self.info,
+            index=self.index,
         )
 
     def copy_aggregate(self, agg_fun: Callable) -> "SampleForecast":
@@ -507,6 +513,7 @@ def copy_aggregate(self, agg_fun: Callable) -> "SampleForecast":
             start_date=self.start_date,
             item_id=self.item_id,
             info=self.info,
+            index=self.index,
         )
 
     def dim(self) -> int:
@@ -543,6 +550,7 @@ def to_quantile_forecast(self, quantiles: List[str]) -> "QuantileForecast":
             forecast_keys=quantiles,
             item_id=self.item_id,
             info=self.info,
+            index=self.index,
         )
 
 
@@ -563,6 +571,8 @@ class QuantileForecast(Forecast):
     info
         additional information that the forecaster may provide e.g. estimated
         parameters, number of iterations ran etc.
+    index
+        optional datatime index of the forecast for irregular time series.
     """
 
     def __init__(
@@ -572,6 +582,7 @@ def __init__(
         forecast_keys: List[str],
         item_id: Optional[str] = None,
         info: Optional[Dict] = None,
+        index: Optional[Union[pd.DatetimeIndex, pd.PeriodIndex]] = None,
     ) -> None:
         self.forecast_array = forecast_arrays
         assert isinstance(
@@ -598,6 +609,8 @@ def __init__(
             k: self.forecast_array[i] for i, k in enumerate(self.forecast_keys)
         }
         self._nan_out = np.array([np.nan] * self.prediction_length)
+        if index is not None:
+            self._index = index[-self.prediction_length :]
 
     def quantile(self, inference_quantile: Union[float, str]) -> np.ndarray:
         sorted_forecast_dict = dict(sorted(self._forecast_dict.items()))

diff --git a/src/gluonts/model/forecast_generator.py b/src/gluonts/model/forecast_generator.py
@@ -133,6 +133,9 @@ def __call__(
                     else None,
                     info=batch["info"][i] if "info" in batch else None,
                     forecast_keys=self.quantiles,
+                    index=batch[FieldName.INDEX][i]
+                    if FieldName.INDEX in batch
+                    else None,
                 )
             assert i + 1 == len(batch[FieldName.FORECAST_START])
 
@@ -179,6 +182,9 @@ def __call__(
                     if FieldName.ITEM_ID in batch
                     else None,
                     info=batch["info"][i] if "info" in batch else None,
+                    index=batch[FieldName.INDEX][i]
+                    if FieldName.INDEX in batch
+                    else None,
                 )
             assert i + 1 == len(batch[FieldName.FORECAST_START])
 
@@ -219,5 +225,8 @@ def __call__(
                     if FieldName.ITEM_ID in batch
                     else None,
                     info=batch["info"][i] if "info" in batch else None,
+                    index=batch[FieldName.INDEX][i]
+                    if FieldName.INDEX in batch
+                    else None,
                 )
             assert i + 1 == len(batch[FieldName.FORECAST_START])
diff --git a/src/gluonts/mx/model/forecast.py b/src/gluonts/mx/model/forecast.py
@@ -57,6 +57,7 @@ def __init__(
         start_date: pd.Period,
         item_id: Optional[str] = None,
         info: Optional[Dict] = None,
+        index: Optional[pd.DatetimeIndex] = None,
     ) -> None:
         self.distribution = distribution
         self.shape = (
@@ -65,6 +66,8 @@ def __init__(
         self.prediction_length = self.shape[0]
         self.item_id = item_id
         self.info = info
+        if index is not None:
+            self._index = index[-self.prediction_length :]
 
         assert isinstance(
             start_date, pd.Period
@@ -102,6 +105,7 @@ def to_sample_forecast(self, num_samples: int = 200) -> SampleForecast:
             start_date=self.start_date,
             item_id=self.item_id,
             info=self.info,
+            index=self.index,
         )
 
     def to_quantile_forecast(self, quantiles: List[Union[float, str]]):
@@ -111,4 +115,5 @@ def to_quantile_forecast(self, quantiles: List[Union[float, str]]):
             start_date=self.start_date,
             item_id=self.item_id,
             info=self.info,
+            index=self.index,
         )
diff --git a/src/gluonts/torch/model/forecast.py b/src/gluonts/torch/model/forecast.py
@@ -52,6 +52,7 @@ def __init__(
         start_date: pd.Period,
         item_id: Optional[str] = None,
         info: Optional[Dict] = None,
+        index: Optional[Union[pd.DatetimeIndex, pd.PeriodIndex]] = None,
     ) -> None:
         self.distribution = distribution
         self.shape = distribution.batch_shape + distribution.event_shape
@@ -65,6 +66,8 @@ def __init__(
         self.start_date = start_date
 
         self._mean = None
+        if index is not None:
+            self._index = index[-self.prediction_length :]
 
     @property
     def mean(self) -> np.ndarray:
@@ -100,4 +103,5 @@ def to_sample_forecast(self, num_samples: int = 200) -> SampleForecast:
             start_date=self.start_date,
             item_id=self.item_id,
             info=self.info,
+            index=self.index,
         )
diff --git a/src/gluonts/transform/feature.py b/src/gluonts/transform/feature.py
@@ -332,6 +332,8 @@ class AddTimeFeatures(MapTransformation):
         list of time features to use.
     pred_length
         Prediction length
+    index_field:
+        Field with the array containing the datetime index for irregular data.
     """
 
     @validated()
@@ -342,26 +344,31 @@ def __init__(
         output_field: str,
         time_features: List[TimeFeature],
         pred_length: int,
+        index_field: Optional[str] = FieldName.INDEX,
         dtype: Type = np.float32,
     ) -> None:
         self.date_features = time_features
         self.pred_length = pred_length
         self.start_field = start_field
         self.target_field = target_field
         self.output_field = output_field
+        self.index_field = index_field
         self.dtype = dtype
 
     def map_transform(self, data: DataEntry, is_train: bool) -> DataEntry:
         if not self.date_features:
             data[self.output_field] = None
             return data
 
-        start = data[self.start_field]
-        length = target_transformation_length(
-            data[self.target_field], self.pred_length, is_train=is_train
-        )
+        if self.index_field in data:
+            index = data[self.index_field]
+        else:
+            start = data[self.start_field]
+            length = target_transformation_length(
+                data[self.target_field], self.pred_length, is_train=is_train
+            )
 
-        index = pd.period_range(start, periods=length, freq=start.freq)
+            index = pd.period_range(start, periods=length, freq=start.freq)
 
         data[self.output_field] = np.vstack(
             [feat(index) for feat in self.date_features]
@@ -411,15 +418,35 @@ def __init__(
         self.dtype = dtype
 
     def map_transform(self, data: DataEntry, is_train: bool) -> DataEntry:
-        length = target_transformation_length(
-            data[self.target_field], self.pred_length, is_train=is_train
-        )
-
-        if self.log_scale:
-            age = np.log10(2.0 + np.arange(length, dtype=self.dtype))
+        if FieldName.INDEX in data:
+            length = len(data[FieldName.INDEX])
+            components = pd.TimedeltaIndex(
+                data[FieldName.INDEX] - data[FieldName.INDEX][0]
+            ).components
+            base_freq = data[FieldName.START].freq
+            if base_freq == "ns":
+                age = components.nanoseconds.values.astype(self.dtype)
+            elif base_freq == "us":
+                age = components.microseconds.values.astype(self.dtype)
+            elif base_freq == "ms":
+                age = components.milliseconds.values.astype(self.dtype)
+            elif base_freq == "S":
+                age = components.seconds.values.astype(self.dtype)
+            elif base_freq == "min" or base_freq == "T":
+                age = components.minutes.values.astype(self.dtype)
+            elif base_freq == "H":
+                age = components.hours.values.astype(self.dtype)
+            else:
+                age = components.days.values.astype(self.dtype)
         else:
+            length = target_transformation_length(
+                data[self.target_field], self.pred_length, is_train=is_train
+            )
             age = np.arange(length, dtype=self.dtype)
 
+        if self.log_scale:
+            age = np.log10(2.0 + age)
+
         data[self.feature_name] = age.reshape((1, length))
 
         return data
@@ -500,7 +527,7 @@ def __init__(
             )
 
     def map_transform(self, data: DataEntry, is_train: bool) -> DataEntry:
-        assert self.base_freq == data["start"].freq
+        assert self.base_freq == data[FieldName.START].freq
 
         # convert to pandas Series for easier indexing and aggregation
         if is_train:

diff --git a/src/gluonts/transform/split.py b/src/gluonts/transform/split.py
@@ -14,6 +14,7 @@
 from typing import Iterator, List, Optional, Tuple
 
 import numpy as np
+import pandas as pd
 from pandas.tseries.offsets import BaseOffset
 
 from gluonts.core.component import validated
@@ -136,7 +137,7 @@ def _split_instance(self, entry: DataEntry, idx: int) -> DataEntry:
             if self.output_NTC:
                 past_piece = past_piece.transpose()
                 future_piece = future_piece.transpose()
-
+                
             entry[self._past(ts_field)] = past_piece
             entry[self._future(ts_field)] = future_piece
             del entry[ts_field]