Financial Data Challenge - 2022
LATAR BELAKANG Challenge ini dibuat atas kerjasama PT.Sharing Vision Indonesia dengan BRI (PT Bank Rakyat Indonesia, Tbk) dengan tujuan:
- Membuka kesempatan untuk peserta dari seluruh indonesia, dari Sabang sampai Marauke untuk merasakan Challenge terhadap real financial use case.
USE CASE Goal: Membuat model klasifikasi yang dapat menentukan apakah seorang nasabah akan churn atau tidak Model harus dibuat sekurang-kurangnya meliputi:
- Exploratory data analysis (EDA)
- Feature Engineering
- Modeling
- Model Evaluation
================
Parameter Tuning
Dalam hal tahap tuning ini, penulis menggunakan metode GeneticSelectionCV dari Library Scikit.learn. Metode ini digunakan untuk Feature Selection, mengeliminasi sejumlah feature yang digunakan dalam proses pemodelan dengan target: MENINGKATKAN KECEPATAN PEMODELAN.
from genetic_selection import GeneticSelectionCV
Feature Selection
Dengan menggunakan library algoritma ini kita mampu mereduksi kombinasi sejumlah variabel yang digunakan untuk menghasilkan output model yang optimum.
Dalam hal ini, kita melakukan reduksi sejumlah feature dari sumberdata sebesar 124 --> 50 feature.
Selanjutnya kombinasi fitur ini digunakan untuk melakukan pemodelan data yang digunakan.