Electronic Resource
Penerapan Algoritma Logistic Regression Untuk Klasifikasi Penyakit Stroke
Stroke merupakan salah satu penyakit dengan tingkat kematian tertinggi di
dunia setelah penyakit jantung dan kanker. Pentingnya deteksi dini terhadap
potensi stroke adalah untuk memungkinkan penanganan lebih cepat dan tepat.
Tujuan dari penelitian ini adalah guna menerapkan algoritma Logistic Regression
dalam mengklasifikasikan penyakit stroke berdasarkan faktor-faktor risiko seperti
Jenis kelamin, Umur, Hipertensi, Penyakit jantung, status pernikahan, jenis
pekerjaan, Jenis tempat tinggal, avg glucose, BMI, status Merokok, Status stroke.
Dataset yang digunakan bersumber dari Kaggle dengan jumlah 5110 data pasien.
Proses penelitian meliputi tahapan data cleaning, transformasi data, normalisasi
memanfaatkan Min-Max Scaler, serta pembagian data menjadi training dan
testing menggunakan pendekatan beberapa variasi proporsi (90%-10%, 85%-15%,
80%-20%, 70%-30%, dan 65%-35%). Evaluasi dijalankan dengan memanfaatkan
Confusion Matrix menggunakan pendekatan metrik akurasi, presisi, recall, dan
F1-score. Berdasarkan hasil analisis didapatkan bahwa proporsi pembagian data
training dan testing sebesar 90%-10% memberikan akurasi tertinggi yaitu 76,17%,
dengan nilai precision dan recall yang menunjukkan kemampuan model dalam
mengenali data non-stroke secara baik. Namun, performa pada kelas minoritas
(stroke) masih rendah sehingga perlu dikerjakan perbaikan, seperti penanganan
ketidakseimbangan data. Secara keseluruhan, penerapan algoritma Logistic
Regression terbukti cukup efektif dalam klasifikasi awal penyakit stroke, namun
akurasinya dapat ditingkatkan menggunakan pendekatan pengembangan metode
resampling atau optimasi model lanjutan.
| SB00954S | KKI 001.6 AME p/s | Perpustakaan Unikama | Tersedia |
Tidak tersedia versi lain