Part 2 Data Science in Finance : Credit Risk Analysis

Nurul Fadilah Syahrul
2 min readSep 13, 2021

--

Halo, postingan sebelumnya sudah ada penjelasan bagian awal dari “credit risk analysis” bisa dibaca pada link ini https://numericitian-nurulfdlhsyhrl.medium.com/data-science-in-finance-credit-risk-analysis-2e2fea4a38 dan sudah ada sedikit penjelasan tentang credit risk bisa dibaca pada link ini https://numericitian-nurulfdlhsyhrl.medium.com/penjelasan-singkat-credit-risk-76e41ebc3dc0

Singkatnya, class variabel yang digunakan pada dataset ini adalah variabel “risk rating”. Semakin tinggi “risk rating” yang dihasilkan suatu model, kecenderungan resikonya semakin tinggi dan dapat membuat seorang konsumen yang mengajukan pinjamannya ditolak (rating 4 dan 5).

Dalam model yang sudah ada, kita akan menggunakan dua variabel input juga mengikut model sebelumnya. Variabel yang digunakan, meliputi “jumlah tanggungan” dan “durasi pinjaman (dalam bulan)”. Kedua variabel ini bertipe numerik. Misal kasusnya, kita akan memasukkan data pengajuan baru seorang konsumen yang memiliki jumlah tanggungan 5 orang dan durasi pinjaman adalah 24 bulan. Kasus ini dapat dijalankan melalui syntax berikut:

aplikasi_baru <- data.frame(jumlah_tanggungan = 5, durasi_pinjaman_bulan = 24)

Untuk menampilkan hasil dari perintah di atas, dapat dijalankan melalui syntax berikut:

print(aplikasi_baru)

Hasil yang ditampilkan dari perintah “print”

Kemudian, lakukan prediksi modelnya terhadap data pengajuan baru yang telah diinput sebelumnya. Jalankan dengan perintah ini.

predict(risk_rating_model, aplikasi_baru)

Hasil yang ditampilkan pada perintah di atas:

Output yang ditampilkan adalah rating 4. Ini menandakan bahwa bisa saja aplikasi pengajuan pinjaman yang ditawarkan konsumen ini akan ditolak karena tingkat resiko yang ditunjukkan cukup tinggi.

Bagaimana yang mengajukan pada satu hari tidak hanya satu konsumen, apakah proses prediksi terhadap pengajuan baru juga sama? Tentu saja sama, hal yang membedakan hanya pada penginputan data framenya. Misalnya terdapat 5 konsumen yang mengajukan pengajuan baru. Jumlah tanggungan dan durasi pinjaman (dalam bulan) ditulis sebagai berikut (dibaca dari kiri ke kanan).
• Jumlah tanggungan : 4, 7, 3, 6, dan 2
• Durasi pinjaman : 24, 28, 18, 20, dan 26.

Perintah dan hasil output dari kasus di atas adalah sebagai berikut:

Output di atas menjelaskan bahwa konsumen ke-1, 3, dan 5, pengajuannya diterima, sedangkan konsumen ke-2 dan 4 pengajuannya ditolak karena tingkat resikonya cukup tinggi.

Bagaimana mudah kan? sejauh ini input variable yang digunakan hanya ada dua variabel. Untuk praktik selanjutnya, bisa menambahkan beberapa variabel input ke dalam model dan dapat menambahkan atau mengurangkan data training dan data testing.

Selamat mencoba. Semoga bermanfaat.

--

--

Nurul Fadilah Syahrul
Nurul Fadilah Syahrul

Written by Nurul Fadilah Syahrul

numericitian (numeric-statistician-mathematician)

No responses yet