models/ACCGAN.py

"""
Auxiliary Classifier Conditional GAN
Bioinformatics, Politecnico di Torino
Authors: Gilberto Manunza, Silvia Giammarinaro
"""

import os

import keras
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import tensorflow as tf
from keras.layers import *
from keras.models import *
from keras.optimizers import *


class ACCGAN():

        def __init__(self,
                     n_epochs=250,
                     batch_size=512,
                     input_shape=(128, 128, 1),
                     latent_size=100,
                     n_classes = 3,
                     alpha=0.2,
                     drop_rate=0.5,
                     discriminator_lr=1e-4,
                     generator_lr=1e-4,
                     logging_step=10,
                     out_images_path="outImages",
                     checkpoint_dir="checkpoints",
                     use_residual=False):

                self.n_epochs = n_epochs
                self.batch_size = batch_size
                self.input_shape = input_shape
                self.latent_size = latent_size
                self.n_classes = n_classes
                self.alpha = alpha
                self.drop_rate = drop_rate
                self.discriminator_lr = discriminator_lr
                self.generator_lr = generator_lr
                self.logging_step = logging_step
                self.out_images_path = out_images_path
                self.checkpoint_dir = checkpoint_dir
                self.use_residual = use_residual
                

                self.model = self._build_model()

        def create_discriminator(self):
                inputs = Input(shape=self.input_shape)
                leaky = tf.keras.layers.LeakyReLU(self.alpha)

                conv1 = Conv2D(32, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(inputs)
                conv1 = Dropout(0.2)(conv1)

                conv1 = Conv2D(32, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(conv1)
                pool1 = MaxPooling2D(pool_size=(2, 2))(conv1)

                conv2 = Conv2D(64, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(pool1)
                conv2 = Dropout(0.2)(conv2)

                conv2 = Conv2D(64, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(conv2)
                pool2 = MaxPooling2D(pool_size=(2, 2))(conv2)

                conv3 = Conv2D(128, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(pool2)
                conv3 = Dropout(0.2)(conv3)

                conv3 = Conv2D(128, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(conv3)
                pool3 = MaxPooling2D(pool_size=(2, 2))(conv3)

                conv4 = Conv2D(256, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(pool3)
                conv4 = Dropout(0.2)(conv4)

                conv4 = Conv2D(256, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(conv4)
                pool4 = MaxPooling2D(pool_size=(2, 2))(conv4)

                conv5 = Conv2D(512, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(pool4)
                conv5 = Dropout(0.2)(conv5)

                conv5 = Conv2D(512, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(conv5)
                drop5 = Dropout(0.5)(conv5)

                gap1 = GlobalAveragePooling2D()(drop5)
                fc1 = Dense(128)(gap1)
                        
                output_disc = Dense(1, activation="linear")(fc1)
                output_class = Dense(self.n_classes, activation="linear")(fc1)

                model = Model(inputs=inputs, outputs=[output_disc, output_class])
                
                return model

        def create_generator(self):
                leaky = tf.keras.layers.LeakyReLU(self.alpha)

                input_noise = Input(shape=self.latent_size)

                input_label = Input(shape=(1,))

                # Embedding for categorical input
                li = Embedding(self.n_classes, 50)(input_label)
                
                # Match initial image size
                n_nodes = 8 * 8
                li = Dense(n_nodes)(li)
                # reshape to add additional channel
                li = Reshape((8, 8, 1))(li)

                dense1 = Dense(8*8*256, use_bias=False, input_shape=(self.latent_size,))(input_noise)
                dense1 = BatchNormalization()(dense1)
                dense1 = leaky(dense1)
                dense1 = Reshape((8, 8, 256))(dense1)

                merge = Concatenate()([dense1, li])

                up1 = Conv2DTranspose(256, 2, strides=(2, 2), activation=leaky, padding='same', kernel_initializer='he_normal')(merge)
                conv1 = Conv2D(256, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(up1)
                conv1 = Dropout(0.2)(conv1)
                conv1 = Conv2D(512, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(conv1)

                # Residual connection
                up_res_1 = UpSampling2D(size=(2,2))(up1)

                up2 = Conv2DTranspose(128, 2, strides=(2, 2), activation=leaky, padding='same', kernel_initializer='he_normal')(conv1)
                merge2 = concatenate([up_res_1,up2], axis = 3)
                conv2 = Conv2D(128, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(merge2)
                conv2 = Dropout(0.2)(conv2)
                conv2 = Conv2D(128, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(conv2)

                # Residual connection
                up_res_2 = UpSampling2D(size=(2,2))(up2)


                up3 = Conv2DTranspose(64, 2, strides=(2, 2), activation=leaky, padding='same', kernel_initializer='he_normal')(conv2)
                merge3 = concatenate([up_res_2,up3], axis = 3)
                conv3= Conv2D(64, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(merge3)
                conv3= Dropout(0.2)(conv3)
                conv3= Conv2D(64, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(conv3)

                # Residual connection
                up_res_3 = UpSampling2D(size=(2,2))(up3)

                up4 = Conv2DTranspose(32, 2, strides=(2, 2), activation=leaky, padding='same', kernel_initializer='he_normal')(conv3)
                merge4 = concatenate([up_res_3,up4], axis = 3)
                conv4 = Conv2D(32, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(merge4)
                conv4 = Dropout(0.2)(conv4)
                conv4 = Conv2D(32, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(conv4)
                conv4 = Dropout(0.2)(conv4)
                conv4 = Conv2D(2, 3, activation=leaky, padding='same', kernel_initializer='he_normal')(conv4)

                output = Conv2D(1, (1, 1), activation='tanh', padding='same', name="out_dec")(conv4)
                model = Model(inputs=[input_noise, input_label], outputs=[output])
                return model

        class _ACCGANModel(keras.Model):
                def __init__(self, discriminator, generator, latent_size, num_classes):
                        super(ACCGAN._ACCGANModel, self).__init__()
                        self.discriminator = discriminator
                        self.generator = generator
                        self.latent_size = latent_size
                        self.num_classes = num_classes

                        self.loss_tracker_generator = keras.metrics.Mean(name="gen_loss")
                        self.loss_tracker_discriminator = keras.metrics.Mean(name="disc_loss")
                        self.loss_true_tracker_discriminator = keras.metrics.Mean(name="disc_loss_real")
                        self.loss_fake_tracker_discriminator = keras.metrics.Mean(name="disc_loss_fake")
                        self.accuracy_real_tracker_discriminator = keras.metrics.Mean(name="disc_acc_real")
                        self.accuracy_fake_tracker_discriminator = keras.metrics.Mean(name="disc_acc_fake")

                def call(self, x):
                    return x

                def compile(self, discriminator_optimizer, generator_optimizer):
                    super(ACCGAN._ACCGANModel, self).compile()
                    self.generator_optimizer = generator_optimizer
                    self.discriminator_optimizer = discriminator_optimizer

                # Define and element-wise binary cross entropy loss
                def element_wise_cross_entropy_from_logits(self, labels, logits):
                    # Compute the loss element-wise
                    losses = tf.nn.sigmoid_cross_entropy_with_logits(labels = labels, logits = logits)
                    # Compute average to reduce everything to a specific number
                    loss = tf.reduce_mean(losses)
                    return loss

                def generator_loss(self, fake_output):
                    return self.element_wise_cross_entropy_from_logits(tf.ones_like(fake_output), fake_output)

                def discriminator_loss(self, real_output, fake_output):
                    real_loss = self.element_wise_cross_entropy_from_logits(tf.ones_like(real_output), real_output)
                    fake_loss = self.element_wise_cross_entropy_from_logits(tf.zeros_like(fake_output), fake_output)
                    total_loss = real_loss + fake_loss
                    return real_loss, fake_loss, total_loss

                def classification_loss(self, labels, logits):
                    ce_loss = tf.nn.sparse_softmax_cross_entropy_with_logits(labels = tf.cast(labels, tf.int32), logits = logits)
                    
                    return ce_loss

                def train_step(self, data):
                        images, labels = data

                        noise = tf.random.normal([images.shape[0], self.latent_size])
                        fake_labels = np.random.randint(0, self.num_classes, labels.shape[0])

                        with tf.GradientTape() as gen_tape, tf.GradientTape() as disc_tape:

                            generated_images = self.generator((noise, fake_labels), training=True)
                            
                            real_output = self.discriminator(images, training=True)
                            fake_output = self.discriminator(generated_images, training=True)

                            real_output_disc = real_output[0]
                            fake_output_disc = fake_output[0]

                            real_output_class = real_output[1]
                            fake_output_class = fake_output[1]
                            
                            gen_loss = self.classification_loss(fake_labels, fake_output_class)  + self.generator_loss(fake_output_disc)
                            
                            disc_real_loss, disc_fake_loss, disc_loss = self.discriminator_loss(real_output_disc, fake_output_disc)
                            class_real_loss = self.classification_loss(labels, real_output_class)
                            class_fake_loss = self.classification_loss(fake_labels, fake_output_class) 

                            total_disc_loss = class_real_loss + class_fake_loss + disc_loss
                            
                        gradients_of_generator = gen_tape.gradient(gen_loss, self.generator.trainable_variables)
                        gradients_of_discriminator = disc_tape.gradient(total_disc_loss, self.discriminator.trainable_variables)
                            
                        self.generator_optimizer.apply_gradients(zip(gradients_of_generator, self.generator.trainable_variables))
                        self.discriminator_optimizer.apply_gradients(zip(gradients_of_discriminator, self.discriminator.trainable_variables))

                        # Compute metrics
                        self.loss_tracker_generator.update_state(gen_loss)
                        self.loss_tracker_discriminator.update_state(total_disc_loss)
                        self.loss_true_tracker_discriminator.update_state(disc_real_loss+class_real_loss)
                        self.loss_fake_tracker_discriminator.update_state(disc_fake_loss+class_fake_loss)

                        preds_real = tf.round(tf.sigmoid(real_output_disc))
                        accuracy_real = tf.math.reduce_mean(tf.cast(tf.math.equal(preds_real, tf.ones_like(preds_real)), tf.float32))
                        self.accuracy_real_tracker_discriminator.update_state(accuracy_real)

                        preds_fake = tf.round(tf.sigmoid(fake_output_disc))
                        accuracy_fake = tf.math.reduce_mean(tf.cast(tf.math.equal(preds_fake, tf.zeros_like(preds_fake)), tf.float32))
                        self.accuracy_fake_tracker_discriminator.update_state(accuracy_fake)


                        return {'gen_loss': self.loss_tracker_generator.result(), 'disc_loss': self.loss_tracker_discriminator.result(),
                                'disc_loss_real': self.loss_true_tracker_discriminator.result(), 'disc_loss_fake': self.loss_fake_tracker_discriminator.result(), \
                                'disc_acc_real': self.accuracy_real_tracker_discriminator.result(), 'disc_acc_fake': self.accuracy_fake_tracker_discriminator.result()}
                            
                def test_step(self, data):
                        pass

                @property
                def metrics(self):
                        # We list our `Metric` objects here so that `reset_states()` can be
                        # called automatically at the start of each epoch
                        # or at the start of `evaluate()`.
                        # If you don't implement this property, you have to call
                        # `reset_states()` yourself at the time of your choosing.
                        return [self.loss_tracker_generator, self.loss_tracker_discriminator, \
                                self.loss_true_tracker_discriminator, self.loss_fake_tracker_discriminator, \
                                self.accuracy_real_tracker_discriminator, self.accuracy_fake_tracker_discriminator]

        def _build_model(self):
                self.generator = self.create_generator()

                self.discriminator = self.create_discriminator()

                model = self._ACCGANModel(generator=self.generator, discriminator=self.discriminator, latent_size=self.latent_size, num_classes=self.n_classes)

                self.generator_optimizer = tf.keras.optimizers.Adam(self.generator_lr, beta_1=0.5, clipvalue=5)
                self.discriminator_optimizer = tf.keras.optimizers.Adam(self.discriminator_lr, beta_1=0.5)

                model.compile(generator_optimizer=self.generator_optimizer, discriminator_optimizer=self.discriminator_optimizer)

                return model

        def generate_latent_points(self):
            # generate points in the latent space
                x_input = np.random.randn(self.latent_size * self.batch_size)
                # reshape into a batch of inputs for the network
                x_input = x_input.reshape(self.batch_size, self.latent_size )
                # generate labels
                labels = np.random.randint(0, self.n_classes, self.batch_size)
                return [x_input, labels]

        
        def train_model(self, train_ds, benchmark_noise, benchmark_labels):
                # set checkpoint directory
                checkpoint_prefix = os.path.join(self.checkpoint_dir, "ckpt")
                checkpoint = tf.train.Checkpoint(generator_optimizer=self.model.generator_optimizer,
                                                                                discriminator_optimizer=self.model.discriminator_optimizer,
                                                                                model=self.model)

                # creating dictionaries for history and accuracy for the plots
                self.history = {}
                self.history['G loss'] = []
                self.history['D loss'] = []
                self.history['D loss Real'] = []
                self.history['D loss Fake'] = []
                self.accuracy = {}
                self.accuracy['D accuracy Real'] = []
                self.accuracy['D accuracy Fake'] = []

                print("Starting training of the AC-GAN model.")

                print("Batches per epoch ", len(train_ds))

                for epoch in range(self.n_epochs+1):
                        # Keep track of the losses at each step
                        epoch_gen_loss = []
                        epoch_disc_loss = []
                        epoch_disc_loss_real = []
                        epoch_disc_loss_fake = []
                        epoch_disc_acc_real = []
                        epoch_disc_acc_fake = []

                        print(f"Starting epoch {epoch} of {self.n_epochs}")

                        for step, batch in enumerate(train_ds):
                                images, labels = batch
                                g_loss, d_loss, d_loss_real, d_loss_fake, d_acc_real, d_acc_fake = self.model.train_on_batch(images, labels)

                                epoch_gen_loss.append(g_loss)
                                epoch_disc_loss.append(d_loss)
                                epoch_disc_loss_real.append(d_loss_real)
                                epoch_disc_loss_fake.append(d_loss_fake)
                                epoch_disc_acc_real.append(d_acc_real)
                                epoch_disc_acc_fake.append(d_acc_fake)

                                if step % self.logging_step == 0:
                                        print(f"\tLosses at step {step}:")
                                        print(f"\t\tGenerator Loss: {g_loss}")
                                        print(f"\t\tDiscriminator Loss: {d_loss}")
                                        print(f"\t\tDisc. Acc Real: {d_acc_real}")
                                        print(f"\t\tDisc. Acc Fake: {d_acc_fake}")
                        if epoch % self.logging_step == 0:
                            generator_images = self.model.generator((benchmark_noise, benchmark_labels), training=False)
        
                            print("Generated images: ")
                            self.plot_fake_figures(generator_images, benchmark_labels, 4, epoch, self.out_images_path)

                        if epoch % (self.logging_step*5) == 0:
                            checkpoint.save(file_prefix=checkpoint_prefix)

                        self.history["G loss"].append(np.array(epoch_gen_loss).mean())
                        self.history["D loss"].append(np.array(epoch_disc_loss).mean())
                        self.history["D loss Real"].append(np.array(epoch_disc_loss_real).mean())
                        self.history["D loss Fake"].append(np.array(epoch_disc_loss_fake).mean())
                        self.accuracy["D accuracy Real"].append(np.array(epoch_disc_acc_real).mean())
                        self.accuracy["D accuracy Fake"].append(np.array(epoch_disc_acc_fake).mean())
 
        def plot_stats(self, data, xaxis, yaxis, ylim=0):
                pd.DataFrame(data).plot(figsize=(10,8))
                plt.grid(True)
                plt.xlabel(xaxis)
                plt.ylabel(yaxis)
                if ylim!=0:
                    plt.ylim(0, ylim)
                plt.show()
 
        @staticmethod
        def plot_fake_figures(x, labels, n, epoch, dir='./'):
 
                labels_dict = {
                      0: "covid-19",
                      1: "normal",
                      2: "viral-pneumonia"
                }
 
                fig = plt.figure(figsize=(6,6))
        
                for i in range(n*n):
                    plt.subplot(n,n,i+1)
                    plt.xticks([])
                    plt.yticks([])
                    img=x[i,:,:,:]
                    # rescale for visualization purposes
                    img = tf.keras.preprocessing.image.array_to_img(img)
                    plt.imshow(img, cmap="gray")
                    plt.xlabel(labels_dict[labels[i]])
                    plt.imshow(img, cmap='gray')
                    plt.savefig('{}/image_at_epoch_{:04d}.png'.format(dir, epoch))
        
                plt.show()