src/Numeric/ADEV/Diff.hs

{-# LANGUAGE FlexibleInstances, FunctionalDependencies #-}

module Numeric.ADEV.Diff (
  ADEV(..), diff
) where

import Numeric.ADEV.Class
import Numeric.ADEV.Interp()
import Control.Monad.Bayes.Class (
  MonadDistribution, 
  uniform, 
  uniformD,
  logCategorical,
  poisson,
  bernoulli,
  normal)
import Control.Monad.Cont (ContT(..))
import Numeric.AD.Internal.Forward.Double (
  ForwardDouble, 
  bundle, 
  primal, 
  tangent)
import Control.Monad (replicateM, mapM)
import Numeric.Log (Log(..))
import qualified Numeric.Log as Log (sum)
import Data.List (zipWith4)
import qualified Data.Vector as V

split :: ForwardDouble -> (Double, Double)
split dx = (primal dx, tangent dx)

-- | ADEV translation of an ADEV program.
-- Implements the built-in derivative for every ADEV primitive.
--   * Reals are interpreted as ForwardDoubles, pairs of Doubles.
--   * Underlying randomness is provided by a monad @m@ satisfying the 
--     monad-bayes @MonadSample@ interface.
--   * ADEV probabilistic programs are represented by the monad
--     @ContT ForwardDouble m@: they know how to transform estimators of
--     losses and loss derivatives into estimators of *expected* losses and
--     loss derivatives, where the expectation is taken over the probabilistic
--     program in question.
instance MonadDistribution m => ADEV (ContT ForwardDouble) m ForwardDouble where  
  sample = ContT $ \dloss -> do
    u <- uniform 0 1
    dloss (bundle u 0)
  
  flip_enum dp = ContT $ \dloss -> do
    dl1 <- dloss True
    dl2 <- dloss False
    return (dp * dl1 + (1 - dp) * dl2)

  flip_reinforce dp = ContT $ \dloss -> do
    b           <- bernoulli (primal dp)
    (l, l')     <- fmap split (dloss b)
    let logpdf' = tangent (log $ if b then dp else 1 - dp)
    return (bundle l (l' + l * logpdf'))

  normal_reparam dmu dsig = do
    deps <- stdnorm
    return $ (deps * dsig) + dmu
    where 
      stdnorm = ContT $ \dloss -> do
        eps <- normal 0 1
        dloss (bundle eps 0)

  normal_reinforce dmu dsig = ContT $ \dloss -> do
    x           <- normal (primal dmu) (primal dsig)
    let dx      =  bundle x 0
    (l, l')     <- fmap split (dloss dx)
    let logpdf' =  tangent $ (-1 * log dsig) - 0.5 * ((dx - dmu) / dsig)^2
    return (bundle l (l' + l * logpdf'))
    
  add_cost dcost = ContT $ \dloss -> do
    dl <- dloss ()
    return (dl + dcost)
   
  expect prog = runContT prog return
  
  plus_ estimate_da estimate_db = do -- different from paper's estimator
    da <- estimate_da
    db <- estimate_db
    return (da + db)
  
  times_ estimate_da estimate_db = do
    da <- estimate_da
    db <- estimate_db
    return (da * db)
    
  exp_ estimate_dx = do
    (x, x') <- (fmap split estimate_dx)
    s <- exp_ (fmap primal estimate_dx)
    return (bundle x (s * x'))
  
  minibatch_ n m estimate_df = do
    indices <- replicateM m (uniformD [1..n])
    dfs <- mapM (\i -> estimate_df i) indices
    return $ (sum dfs) * (fromIntegral n / fromIntegral m)
  
  exact_ = return

  baseline dp db  = do
    dl <- runContT dp (\dx -> return (dx - db))
    return (dl + db)

  reinforce (D dsamp dpdf) = ContT $ \dloss -> do
    x <- dsamp
    (l, l') <- fmap split (dloss x)
    let logpdf' = tangent $ ln (dpdf x)
    return (bundle l (l' + l * logpdf'))

  leave_one_out m (D dsamp dpdf) = ContT $ \dloss -> do
    xs <- replicateM m dsamp
    dlosses <- mapM dloss xs
    let (ls, l's) = unzip (map split dlosses)
    -- For each l, average the other ls to get a baseline
    let bs = map (\i -> (sum (take i ls) + sum (drop (i + 1) ls)) / (fromIntegral (m - 1))) [0..m-1]
    let logpdfs = map (tangent . ln . dpdf) xs
    return $ bundle (sum ls / fromIntegral m) (sum (zipWith4 (\l l' b lpdf -> l' + (l - b) * lpdf) ls l's bs logpdfs) / fromIntegral m)

  implicit_reparam (C samp pdf dcdf) = ContT $ \dloss -> do
    x <- samp
    let f' = tangent $ (exp . ln . dcdf) (bundle x 0)
    let p  = (exp . ln . pdf) x
    dloss (bundle x (-f' / p))

  poisson_weak drate = ContT $ \dloss -> do
    let (rate, rate') = split (exp (ln drate))
    x_neg <- poisson rate
    let x_pos = x_neg + 1
    y_neg <- dloss x_neg
    y_pos <- dloss x_pos
    let grad = primal y_pos - primal y_neg
    return (bundle (primal y_neg) (grad * rate'))

  reparam_reject (D s spdf) h (D p ppdf) (D q qpdf) m = ContT $ \dloss -> 
    runContT (reinforce dpi) (dloss . h)
    where
    pi = do
      eps <- s 
      let x = h eps
      let w = exp ((primal (ln (ppdf x))) - (primal (ln (qpdf x))))
      u <- uniform 0 1
      if u < w then return eps else pi
    dpi_density deps = spdf deps * ppdf (h deps) / qpdf (h deps)
    dpi = D pi dpi_density
  
  smc dp (D q0samp q0dens) dq df n k = do
    particles <- iterateM step init n
    values <- mapM (\(v, w) -> do
      (f, f') <- fmap split (df v)
      let logpdf' = tangent $ ln (dp v)
      return (bundle f (exp (ln w) * (f' + f * logpdf')))) particles
    return $ sum values / fromIntegral k
    where
    iterateM k m n = if n == 0 then m else do
      x <- m
      iterateM k (k x) (n - 1)
    pp = Exp . primal . ln . dp
    qq0 = Exp . primal . ln . q0dens
    init = replicateM k (do
      x <- q0samp
      return ([x], pp [x] / qq0 x))
    resample particles = do
      let weights = map snd particles
      let total_weight = Log.sum weights
      let normed_weights = map (\w -> w / total_weight) weights
      indices <- replicateM k (logCategorical (V.fromList normed_weights))
      let new_weights = replicate k (total_weight / fromIntegral k)
      return $ zip (map (\i -> fst (particles !! i)) indices) new_weights
    propagate particle = do
      let (v, w) = particle
      let (D qs qd) = dq (head v)
      let qqd = Exp . primal . ln . qd
      v' <- qs
      return (v':v, w * (pp (v':v) / pp v) / qqd v')
    step particles = do 
      particles <- resample particles
      mapM propagate particles

diff :: MonadDistribution m => (ForwardDouble -> m ForwardDouble) -> Double -> m Double
diff f x = do
  df <- f (bundle x 1)
  return (tangent df)