DM3-ML : Unsupervised Learning and Dimensionality Reduction

URL to have access to all the codes : https://github.com/ChristopheYe/DM3-ML.git

I. PROJECT'S TITLE

DM3 ML

II. PROJECT DESCRIPTION

The code is written with Python on different Jupyter Notebook In addition of many classic libraries like pandas, numpy, time, and matplotlib, I used sklearn libraries : import numpy as np import time import pandas as pd import io import matplotlib.pyplot as plt import mlrose_hiive from sklearn.cluster import KMeans from sklearn.mixture import GaussianMixture from sklearn.decomposition import PCA from sklearn.decomposition import FastICA from sklearn.random_projection import GaussianRandomProjection from sklearn.datasets import make_classification from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score from sklearn.model_selection import cross_val_score from sklearn.preprocessing import LabelEncoder, MinMaxScaler, StandardScaler from sklearn.metrics.cluster import homogeneity_score from sklearn.metrics.cluster import v_measure_score from sklearn.metrics.cluster import completeness_score

First part : Experimentation with two clustering algorithms :

K-means clustering
Expectation Maximization

Second part : Experimentation with four dimensionality reduction algorithms :

Principal Component Analysis
Independant Component Analysis
Gaussian Random Projection
Decision Tree

All the different clustering and dimensionality reduction algorithms used were taken from the library sklearn.

The 2 initial datasets I work with :

wine-quality-white-and-red.csv
Movie Dataset.csv

And then I worked with plenty of others : 3. wine_quality_pca.csv 4. wine_quality_ica.csv 5. wine_quality_grp.csv 6. wine_quality_DT.csv 7. wine_quality_Kmeans.csv 8. wine_quality_EM.csv 9. Movie_pca.csv 10. Movie_ica.csv 11. Movie_grp.csv 12. Movie_DT.csv 13. Movie Dataset_Kmeans.csv 14. Movie_EM.csv

Third part : Experimentation with clustering after dimensionality reduction

Fourth part : Neural network after dimensionality reduction on my dataset about 'wine' and compare the performance to a Neural network without dimensionality reduction

Fifth part : Neural Network on a new dataset with clustering feature n my dataset about 'movie' and compare the performance to the original dataset.

III. HOW TO INSTALL AND RUN THE PROJECT

Download Anaconda-Navigator
Use a Jupyter Notebook
Import all the libraries
Run all the different codes in the GitHub

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DM3-ML : Unsupervised Learning and Dimensionality Reduction

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
ML_A3_ Step2_ Features selection_DecisionTreeRegressor_Dataset1.ipynb		ML_A3_ Step2_ Features selection_DecisionTreeRegressor_Dataset1.ipynb
ML_A3_ Step2_ Features selection_LCA_Dataset2.ipynb		ML_A3_ Step2_ Features selection_LCA_Dataset2.ipynb
ML_A3_ Step3_DT + EM Clustering_Dataset1.ipynb		ML_A3_ Step3_DT + EM Clustering_Dataset1.ipynb
ML_A3_ Step3_DT + EM Clustering_Dataset2.ipynb		ML_A3_ Step3_DT + EM Clustering_Dataset2.ipynb
ML_A3_ Step3_DT + K means Clustering_Dataset1.ipynb		ML_A3_ Step3_DT + K means Clustering_Dataset1.ipynb
ML_A3_ Step3_Gaussian RP + EM Clustering_Dataset1.ipynb		ML_A3_ Step3_Gaussian RP + EM Clustering_Dataset1.ipynb
ML_A3_ Step3_Gaussian RP + EM Clustering_Dataset2.ipynb		ML_A3_ Step3_Gaussian RP + EM Clustering_Dataset2.ipynb
ML_A3_ Step3_Gaussian RP + K means Clustering_Dataset1.ipynb		ML_A3_ Step3_Gaussian RP + K means Clustering_Dataset1.ipynb
ML_A3_ Step3_Gaussian RP + K means Clustering_Dataset2.ipynb		ML_A3_ Step3_Gaussian RP + K means Clustering_Dataset2.ipynb
ML_A3_ Step3_ICA + EM Clustering_Dataset1.ipynb		ML_A3_ Step3_ICA + EM Clustering_Dataset1.ipynb
ML_A3_ Step3_ICA + EM Clustering_Dataset2.ipynb		ML_A3_ Step3_ICA + EM Clustering_Dataset2.ipynb
ML_A3_ Step3_ICA + K means Clustering_Dataset1.ipynb		ML_A3_ Step3_ICA + K means Clustering_Dataset1.ipynb
ML_A3_ Step3_ICA + K means Clustering_Dataset2.ipynb		ML_A3_ Step3_ICA + K means Clustering_Dataset2.ipynb
ML_A3_ Step3_PCA + EM Clustering_Dataset1.ipynb		ML_A3_ Step3_PCA + EM Clustering_Dataset1.ipynb
ML_A3_ Step3_PCA + EM Clustering_Dataset2.ipynb		ML_A3_ Step3_PCA + EM Clustering_Dataset2.ipynb
ML_A3_ Step3_PCA + K means Clustering_Dataset1.ipynb		ML_A3_ Step3_PCA + K means Clustering_Dataset1.ipynb
ML_A3_ Step3_PCA + K means Clustering_Dataset2.ipynb		ML_A3_ Step3_PCA + K means Clustering_Dataset2.ipynb
ML_A3_Step1_Expectation Maximization_Dataset1.ipynb		ML_A3_Step1_Expectation Maximization_Dataset1.ipynb
ML_A3_Step1_Expectation Maximization_Dataset2.ipynb		ML_A3_Step1_Expectation Maximization_Dataset2.ipynb
ML_A3_Step1_K Means Clustering_Dataset1.ipynb		ML_A3_Step1_K Means Clustering_Dataset1.ipynb
ML_A3_Step1_K Means Clustering_Dataset2.ipynb		ML_A3_Step1_K Means Clustering_Dataset2.ipynb
ML_A3_Step2_ Features selection_GaussianRandomProjection_Dataset1.ipynb		ML_A3_Step2_ Features selection_GaussianRandomProjection_Dataset1.ipynb
ML_A3_Step2_ Features selection_GaussianRandomProjection_Dataset2.ipynb		ML_A3_Step2_ Features selection_GaussianRandomProjection_Dataset2.ipynb
ML_A3_Step2_ Features selection_PCA_Dataset1.ipynb		ML_A3_Step2_ Features selection_PCA_Dataset1.ipynb
ML_A3_Step2_ Features selection_PCA_Dataset2.ipynb		ML_A3_Step2_ Features selection_PCA_Dataset2.ipynb
ML_A3_Step2_Features selection_ICA_Dataset1.ipynb		ML_A3_Step2_Features selection_ICA_Dataset1.ipynb
ML_A3_Step2_Features selection_ICA_Dataset2.ipynb		ML_A3_Step2_Features selection_ICA_Dataset2.ipynb
ML_A3_Step4_ICA + Neural Network Clustering_Dataset2.ipynb		ML_A3_Step4_ICA + Neural Network Clustering_Dataset2.ipynb
ML_A3_Step4_PCA + Neural Network Clustering_Dataset2.ipynb		ML_A3_Step4_PCA + Neural Network Clustering_Dataset2.ipynb
ML_A3_Step5_Clustering(EM) + Neural Network Clustering_Dataset 2.ipynb		ML_A3_Step5_Clustering(EM) + Neural Network Clustering_Dataset 2.ipynb
ML_A3_Step5_Clustering(K-Means) + Neural Network Clustering_Dataset 2.ipynb		ML_A3_Step5_Clustering(K-Means) + Neural Network Clustering_Dataset 2.ipynb
Movie Dataset.csv		Movie Dataset.csv
Movie Dataset_Kmeans.csv		Movie Dataset_Kmeans.csv
Movie_DT.csv		Movie_DT.csv
Movie_EM.csv		Movie_EM.csv
Movie_grp.csv		Movie_grp.csv
Movie_ica.csv		Movie_ica.csv
Movie_pca.csv		Movie_pca.csv
README.md		README.md
wine-quality-white-and-red.csv		wine-quality-white-and-red.csv
wine_quality_DT.csv		wine_quality_DT.csv
wine_quality_EM.csv		wine_quality_EM.csv
wine_quality_Kmeans.csv		wine_quality_Kmeans.csv
wine_quality_grp.csv		wine_quality_grp.csv
wine_quality_ica.csv		wine_quality_ica.csv
wine_quality_pca.csv		wine_quality_pca.csv

ChristopheYe/DM3-ML

Folders and files

Latest commit

History

Repository files navigation

DM3-ML : Unsupervised Learning and Dimensionality Reduction

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages