Sidebar Menu

SmartstatXL menyediakan berbagai jenis analisis regresi untuk memodelkan hubungan antara variabel bebas (independen) dan variabel terikat (dependen). Salah satu jenis analisis yang dapat dilakukan dengan SmartstatXL adalah Regresi Logit dan Probit.

Regresi Logit dan Probit, yang dikenal juga sebagai regresi logistik, adalah metode yang sesuai untuk digunakan ketika variabel dependen bersifat dikotomis atau biner. Regresi logistik memungkinkan kita untuk memprediksi dan menjelaskan hubungan antara variabel dependen biner (dengan dua kemungkinan hasil) dan satu atau lebih variabel independen, baik itu nominal, ordinal, interval, atau rasio. Beberapa contoh dari variabel dependen biner meliputi: Ya atau Tidak, Lulus atau Gagal, Spam atau Bukan, serta 0 atau 1.

Fitur unggulan analisis regresi logit dan probit dengan SmartstatXL meliputi:

  1. Diagnostik Regresi:
    • Informasi data pencilan.
  2. Kemampuan untuk mengkodekan outcome dalam bentuk angka (0, 1) atau teks (Ya, Tidak; Y, T; Sukses, Gagal, dan lain-lain).
  3. Penyesuaian respons event untuk outcome.
  4. Output berupa:
    • Persamaan Regresi.
    • Statistik Regresi/Kebaikan Suai: R², Cox-Snell R², Nagelkerke R², AIC, AICc, BIC, Log Likelihood.
    • Estimasi Koefisien Regresi: Nilai Koefisien, Standard error, Wald Stat, p-value, Upper/Lower, VIF.
    • Tabel Analisis Devians.
    • Confusion Matrix (Tabel Klasifikasi dan Metrik).
    • Grafik:
      • Kurva Regresi Logistik/Probit.
      • ROC Curve.
      • Metrik Performance.
      • Outcome vs. Prediction.

Contoh Kasus

Database Diabetes Suku Pima

Dataset ini aslinya berasal dari Lembaga Nasional Penyakit Diabetes dan Pencernaan dan Ginjal. Tujuan dari dataset ini adalah untuk mendiagnosis secara prediktif apakah pasien memiliki diabetes atau tidak, berdasarkan beberapa pengukuran diagnostik yang disertakan dalam dataset. Beberapa batasan ditempatkan pada pemilihan contoh-contoh ini dari database yang lebih besar. Semua pasien di sini adalah perempuan yang berusia minimal 21 tahun dari warisan suku Pima.

Dataset terdiri dari beberapa variabel prediktor medis dan satu variabel target, Hasil (Outcome).

  • Pregnancies(Kehamilan): Jumlah kali hamil
  • Glucose(Glukosa): Konsentrasi glukosa plasma 2 jam dalam tes toleransi glukosa oral
  • BloodPressure(TekananDarah): Tekanan darah diastolik (mm Hg)
  • SkinThickness(KetebalanKulit): Ketebalan lipatan kulit triceps (mm)
  • Insulin: Insulin serum 2 jam (mu U/ml)
  • BMI: Indeks massa tubuh (berat dalam kg/(tinggi dalam m)^2)
  • DiabetesPedigreeFunction(FungsiKeturunanDiabetes): Fungsi keturunan diabetes
  • Age(Usia): Usia (tahun)
  • Outcome(Hasil): Variabel kelas (0 atau 1). 1 berarti orang tersebut diabetik dan 0 berarti orang tersebut tidak.

Source: Pima Indians Diabetes Database

Langkah-langkah Analisis Regresi Logit dan Probit

  1. Aktifkan lembar kerja (Sheet) yang akan dianalisis.
  2. Tempatkan kursor pada dataset (untuk membuat dataset, lihat cara Persiapan Data).
  3. Jika sel aktif (Active Cell) tidak berada pada dataset, SmartstatXL akan secara otomatis mencoba menentukan dataset.
  4. Aktifkan Tab SmartstatXL
  5. Klik Menu Regresi > Regresi Logistik/Probit.
  6. SmartstatXL akan menampilkan kotak dialog untuk memastikan apakah dataset sudah benar atau belum (biasanya dataset sudah otomatis dipilih dengan benar).
  7. Apabila sudah benar, Klik Tombol Selanjutnya
  8. Selanjutnya akan tampil Kotak Dialog Analisis RegresiPilih Variabel Prediktor (Independen) dan satu atau lebih Variabel Respons (Dependen).
  9. Tekan tombol "Selanjutnya"
  10. Pilih output regresi seperti pada tampilan berikut:

    Kategori yang dijadikan sebagai acuan (referensi), bisa kategori pertama (0) atau kategori terakhir (1), karena hanya ada dua level. Kategori referensi juga bisa langsung dipilih dari level outcome. Pada contoh ini, misalnya Respons Event angka 1
  11. Tekan tombol OK untuk membuat outputnya dalam Lembar Output

Hasil Analisis

Regresi Logit

Informasi Analisis: tipe regresi yang digunakan, metode regresi, respons dan prediktor

Persamaan Regresi

Dalam analisis regresi logistik yang dilakukan, variabel respons yang digunakan adalah "Outcome", yang mengindikasikan apakah seseorang memiliki diabetes atau tidak. Sementara itu, ada delapan variabel prediktor yang digunakan dalam model, yaitu: Kehamilan, Glukosa, Tekanan Darah, Ketebalan Kulit, Insulin, BMI, Fungsi Keturunan Diabetes, dan Usia.

Dari hasil analisis, persamaan regresi yang dihasilkan adalah:

Y=−8.4047+0.1232×Kehamilan+0.0352×Glukosa−0.0133×Tekanan Darah+0.0006×Ketebalan Kulit−0.0012×Insulin+0.0897×BMI+0.9452×Fungsi Keturunan Diabetes+0.0149×Usia

Dari persamaan di atas, kita dapat menarik beberapa interpretasi:

  1. Intercept (-8.4047): Ini adalah log-odds dari Outcome ketika semua variabel prediktor bernilai nol. Dalam konteks praktis, interpretasi dari intercept sering kali tidak relevan karena tidak mungkin semua variabel prediktor bernilai nol.
  2. Kehamilan (0.1232): Untuk setiap peningkatan satu unit dalam jumlah kehamilan, log-odds dari Outcome (memiliki diabetes) akan meningkat sebesar 0.1232, dengan variabel lain tetap konstan.
  3. Glukosa (0.0352): Setiap kenaikan satu unit dalam konsentrasi glukosa akan meningkatkan log-odds dari Outcome sebesar 0.0352, dengan variabel lain tetap konstan.
  4. ... dan seterusnya untuk variabel lainnya.

Nilai R2 sebesar 0.272 menunjukkan bahwa sekitar 27.2% variabilitas dalam Outcome dapat dijelaskan oleh variabel-variabel prediktor dalam model ini. Meskipun ini mungkin tampak rendah, perlu diingat bahwa dalam konteks regresi logistik, R2 tidak selalu harus tinggi seperti dalam regresi linier.

Nilai Chi-Squared sebesar 270.039 dengan signifikansi 0.00 menunjukkan bahwa model secara keseluruhan adalah signifikan, artinya setidaknya salah satu dari prediktor memiliki efek signifikan terhadap Outcome.

Kesimpulannya, model regresi logistik ini menunjukkan hubungan yang signifikan antara variabel prediktor dan Outcome (memiliki atau tidak memiliki diabetes). Meskipun demikian, sebaiknya dilakukan analisis lebih lanjut untuk menentukan signifikansi masing-masing variabel prediktor dan mempertimbangkan faktor-faktor lain yang mungkin mempengaruhi model.

Ketepatan Model (Goodness of Fit)

Nilai statistik kebaikan suai regresi dan estimasi koefisien regresi

A screenshot of a computer Description automatically generated

Interpretasi dan Pembahasan Kebaikan Suai Regresi:

  1. R2 (0.2718): Nilai R2 dalam regresi logistik menggambarkan seberapa baik variabel-variabel independen dalam model memprediksi variabel dependen. Sebuah R2 sebesar 0.2718 menunjukkan bahwa sekitar 27.18% dari variabilitas dalam Outcome dapat dijelaskan oleh variabel-variabel prediktor dalam model.
  2. Cox-Snell R2 (0.2964): Cox-Snell R2 adalah salah satu dari beberapa versi dari R2 yang dirancang untuk regresi logistik. Nilai ini menunjukkan bahwa sekitar 29.64% dari variabilitas dalam Outcome dapat dijelaskan oleh model.
  3. Nagelkerke R2 (0.4085): Nagelkerke R2 adalah modifikasi dari Cox-Snell R2 yang dinormalisasi sehingga memiliki rentang yang mungkin antara 0 dan 1. Sebuah Nagelkerke R2 sebesar 0.4085 menunjukkan bahwa sekitar 40.85% dari variabilitas dalam Outcome dapat dijelaskan oleh model. Nilai ini sering dianggap sebagai ukuran kebaikan suai yang lebih interpretable dibandingkan dengan Cox-Snell R2.
  4. AIC (741.4454) dan AICc (741.6828): AIC (Akaike Information Criterion) dan AICc (Akaike Information Criterion dikoreksi) adalah ukuran kebaikan suai yang mempertimbangkan kompleksitas model. Nilai yang lebih rendah menunjukkan model yang lebih baik. Jika membandingkan beberapa model, model dengan AIC atau AICc terendah lebih diutamakan.
  5. BIC (783.2395): BIC (Bayesian Information Criterion) juga merupakan ukuran kebaikan suai yang mempertimbangkan jumlah parameter dalam model dan ukuran sampel. Seperti AIC, nilai BIC yang lebih rendah menunjukkan model yang lebih baik.
  6. Log Likelihood (-361.7227): Ini adalah ukuran dari kemungkinan model, dengan kata lain, seberapa baik model memprediksi data yang diberikan. Dalam konteks pembandingan model, model dengan log likelihood yang lebih tinggi (atau nilai absolut yang lebih rendah untuk nilai negatif) dianggap lebih baik.

Kesimpulan: Ketika menilai kebaikan suai dari model regresi logistik, penting untuk mempertimbangkan berbagai ukuran statistik. Dalam hal ini, meskipun R2 mungkin tampak rendah, Nagelkerke R2 menunjukkan kebaikan suai yang relatif lebih baik. Selain itu, AIC, AICc, dan BIC dapat digunakan untuk membandingkan model ini dengan model alternatif lainnya untuk menentukan model mana yang paling sesuai dengan data. Log likelihood juga memberikan informasi tambahan tentang seberapa baik model memprediksi data yang diberikan.

Estimasi Koefisien Regresi

Interpretasi dan Pembahasan Estimasi Koefisien Regresi:

  1. Intercept (-8.405):
    • Koefisien: Intercept dari model adalah -8.405. Ini adalah log-odds dari Outcome ketika semua variabel prediktor bernilai nol. Meskipun dalam banyak kasus interpretasi dari intercept mungkin tidak relevan, dalam konteks ini menunjukkan log-odds dasar sebelum mempertimbangkan variabel lain.
    • Wald Statistik: Nilai Wald Statistik sebesar 137.546 dengan nilai-P 0.000 menunjukkan bahwa intercept ini signifikan pada level nyata 1%.
  2. Kehamilan (0.123):
    • Koefisien: Untuk setiap peningkatan satu unit dalam jumlah kehamilan, log-odds dari Outcome (memiliki diabetes) akan meningkat sebesar 0.123, dengan variabel lain tetap konstan.
    • Wald Statistik: Dengan nilai Wald Statistik 14.747 dan nilai-P 0.000, variabel ini signifikan pada level nyata 1%.
    • Interval Kepercayaan 95%: Koefisien untuk kehamilan berkisar antara 0.060 dan 0.186.
    • VIF (1.431): Nilai VIF (Variance Inflation Factor) menunjukkan tidak adanya masalah multikolinearitas, karena nilainya jauh di bawah ambang batas umum 10.
  3. Glukosa (0.035):
    • Koefisien: Setiap kenaikan satu unit dalam konsentrasi glukosa akan meningkatkan log-odds dari Outcome sebesar 0.035.
    • Wald Statistik: Dengan nilai Wald Statistik 89.897 dan nilai-P 0.000, variabel ini signifikan pada level nyata 1%.
    • Interval Kepercayaan 95%: Koefisien untuk glukosa berkisar antara 0.028 dan 0.042.
    • VIF (1.299): Tidak ada indikasi multikolinearitas.
    • ... dan seterusnya untuk variabel lainnya.

Kesimpulan:

Berdasarkan hasil analisis, beberapa variabel seperti Kehamilan, Glukosa, Tekanan Darah, BMI, dan Fungsi Keturunan Diabetes menunjukkan signifikansi statistik terhadap Outcome. Sedangkan variabel Ketebalan Kulit, Insulin, dan Usia tidak signifikan dalam model ini.

Variabel dengan bintang dua (**) menunjukkan signifikansi pada level 1%, sedangkan yang bertanda satu bintang (*) signifikan pada level 5%. Variabel yang tidak memiliki tanda bintang (tn) tidak signifikan dalam model.

Penting untuk dicatat bahwa VIF untuk semua variabel berada di bawah ambang batas umum 10, yang menunjukkan bahwa tidak ada masalah multikolinearitas yang signifikan dalam model.

Analisis Deviance/Ragam

A screenshot of a calculator Description automatically generated

Analisis deviance digunakan untuk menilai kecocokan dari model regresi logistik. Ini serupa dengan analisis varians (ANOVA) dalam regresi linier, tetapi untuk regresi logistik, deviance digunakan sebagai ukuran varian yang dijelaskan oleh model.

  1. Regresi:
    • DB (Derajat Bebas): Ada 8 derajat bebas, yang sesuai dengan jumlah variabel prediktor dalam model.
    • Deviance: Nilai deviance untuk komponen regresi adalah 270.039. Ini mengukur seberapa baik model dengan variabel prediktor memprediksi data dibandingkan dengan model tanpa variabel prediktor (hanya intercept).
    • Nilai-P: Nilai-P sebesar 0.000 menunjukkan bahwa model dengan variabel prediktor memberikan penjelasan yang signifikan terhadap variabilitas dalam Outcome dibandingkan dengan model tanpa variabel prediktor. Variabel prediktor secara kolektif signifikan dalam menjelaskan Outcome.
    • Chi.05 dan Chi.01: Nilai deviance regresi melebihi ambang batas Chi-squared baik pada level signifikansi 5% maupun 1%. Ini menegaskan lagi bahwa variabel prediktor secara kolektif signifikan.
  2. Galat:
    • DB (Derajat Bebas): Ada 759 derajat bebas.
    • Deviance: Nilai deviance untuk galat adalah 723.4454. Ini mengukur seberapa jauh prediksi model dari data aktual ketika menggunakan variabel prediktor.
  3. Total:
    • DB (Derajat Bebas): Ada 767 derajat bebas.
    • Deviance: Deviance total adalah 993.4839, yang merupakan jumlah deviance regresi dan galat.

Kesimpulan:

Dari analisis deviance, dapat disimpulkan bahwa variabel prediktor dalam model memberikan penjelasan yang signifikan terhadap variabilitas dalam Outcome. Nilai deviance untuk regresi yang signifikan pada level 1% menunjukkan bahwa model dengan variabel prediktor lebih baik dalam memprediksi data dibandingkan dengan model tanpa variabel prediktor.

Tabel Klasifikasi (Matriks Konfusi)

A screenshot of a computer Description automatically generated

Tabel klasifikasi, juga dikenal sebagai matriks konfusi, adalah alat yang digunakan untuk menilai kinerja model klasifikasi. Dalam konteks ini, tabel menunjukkan seberapa baik model regresi logistik memprediksi Outcome (yaitu, memiliki diabetes atau tidak).

  1. Aktual vs. Prediksi:
    • Aktual 0, Prediksi 0: Sebanyak 445 kasus sebenarnya tidak memiliki diabetes (Aktual 0) dan model juga memprediksi mereka tidak memiliki diabetes (Prediksi 0).
    • Aktual 0, Prediksi 1: Sebanyak 55 kasus sebenarnya tidak memiliki diabetes (Aktual 0) tetapi model salah memprediksi mereka memiliki diabetes (Prediksi 1).
    • Aktual 1, Prediksi 0: Sebanyak 112 kasus sebenarnya memiliki diabetes (Aktual 1) tetapi model salah memprediksi mereka tidak memiliki diabetes (Prediksi 0).
    • Aktual 1, Prediksi 1: Sebanyak 156 kasus sebenarnya memiliki diabetes (Aktual 1) dan model juga memprediksi mereka memiliki diabetes (Prediksi 1).
  2. Akurasi Klasifikasi:
    • Untuk Aktual 0: Dari total 500 kasus yang sebenarnya tidak memiliki diabetes, model memprediksi dengan benar sebanyak 445 kasus, dengan akurasi 89.00%.
    • Untuk Aktual 1: Dari total 268 kasus yang sebenarnya memiliki diabetes, model memprediksi dengan benar sebanyak 156 kasus, dengan akurasi 58.21%.
    • Total: Secara keseluruhan, model memprediksi dengan benar sebanyak 78.26% dari semua kasus.

Kesimpulan:

Model regresi logistik ini memiliki tingkat akurasi yang cukup baik, dengan 78.26% dari semua kasus diklasifikasikan dengan benar. Namun, ada perbedaan dalam akurasi antara kelompok yang sebenarnya memiliki diabetes (58.21%) dan yang tidak memiliki diabetes (89.00%). Ini menunjukkan bahwa model mungkin lebih cenderung memprediksi dengan benar individu yang tidak memiliki diabetes dibandingkan dengan mereka yang memiliki diabetes. Penting untuk mempertimbangkan metrik lain seperti sensitivitas, spesifisitas, nilai prediksi positif, dan nilai prediksi negatif untuk mendapatkan pemahaman yang lebih lengkap tentang kinerja model.

Metrik Evaluasi Kinerja Model Klasifikasi untuk Prediksi Diabetes

A screenshot of a computer Description automatically generated

Interpretasi dan Pembahasan Klasifikasi Metrik Lainnya:

  1. Accuracy (0.783): Ini adalah proporsi prediksi yang benar dari total kasus. Dalam hal ini, model memprediksi dengan benar sebanyak 78.3% dari kasus.
  2. Precision (0.739): Merupakan proporsi prediksi positif yang benar dari total prediksi positif. Artinya, dari semua pasien yang model prediksi memiliki diabetes, 73.9% sebenarnya memiliki diabetes.
  3. Sensitivity (Recall) (0.582): Ini juga dikenal sebagai True Positive Rate. Dari semua pasien yang sebenarnya memiliki diabetes, model berhasil mengidentifikasi 58.2% dari mereka.
  4. F1-score (0.651): F1-score adalah rata-rata harmonik dari Precision dan Recall. Nilai ini mencoba mencari keseimbangan antara Precision dan Recall. Skor F1 yang lebih tinggi menunjukkan model yang lebih baik.
  5. Specificity (0.890): Ini adalah True Negative Rate. Dari semua pasien yang sebenarnya tidak memiliki diabetes, model berhasil mengidentifikasi 89% dari mereka.
  6. Prevalence (0.349): Ini menunjukkan proporsi kasus positif dalam dataset. Dalam hal ini, 34.9% dari sampel memiliki diabetes.
  7. NPV (0.799): Nilai Prediksi Negatif (NPV) menunjukkan proporsi prediksi negatif yang benar dari total prediksi negatif. Dari semua pasien yang model prediksi tidak memiliki diabetes, 79.9% sebenarnya tidak memiliki diabetes.
  8. FPR (0.110): False Positive Rate, adalah kebalikan dari Specificity. Dari semua pasien yang sebenarnya tidak memiliki diabetes, model salah mengidentifikasi 11% dari mereka sebagai memiliki diabetes.
  9. FNR (0.418): False Negative Rate, adalah kebalikan dari Sensitivity. Dari semua pasien yang sebenarnya memiliki diabetes, model salah mengidentifikasi 41.8% dari mereka sebagai tidak memiliki diabetes.
  10. LR+ (5.292): Likelihood Ratio Positif mengukur seberapa banyak kemungkinan seseorang dengan hasil tes positif sebenarnya memiliki kondisi dibandingkan dengan seseorang dengan hasil tes negatif.
  11. LR- (0.470): Likelihood Ratio Negatif mengukur seberapa banyak kemungkinan seseorang dengan hasil tes negatif sebenarnya tidak memiliki kondisi dibandingkan dengan seseorang dengan hasil tes positif.

Kesimpulan:

Berdasarkan metrik klasifikasi yang diberikan, model memiliki kinerja yang cukup baik dalam mengidentifikasi pasien yang tidak memiliki diabetes (seperti ditunjukkan oleh Specificity yang tinggi), tetapi kinerjanya kurang dalam mengidentifikasi pasien yang sebenarnya memiliki diabetes (seperti ditunjukkan oleh Sensitivity yang relatif lebih rendah).

Meskipun demikian, dengan mempertimbangkan metrik-metrik lain seperti Precision, F1-score, dan Likelihood Ratios, model ini menawarkan keseimbangan yang cukup baik antara memprediksi pasien yang memiliki diabetes dan yang tidak. Namun, selalu penting untuk mempertimbangkan konteks klinis dan konsekuensi dari kesalahan prediksi saat mengevaluasi kinerja model dalam praktik.

Kurva Receiver Operating Characteristic (ROC)

Chart, line chart Description automatically generated

Kurva ROC:

Kurva ROC (Receiver Operating Characteristic) digunakan untuk menilai kinerja model klasifikasi pada semua ambang klasifikasi yang mungkin.

Dalam plot ROC:

  • Sumbu X mengukur tingkat positif palsu (1-Specificity), sedangkan sumbu Y mengukur tingkat positif benar (Sensitivity). Sebagai referensi, garis diagonal dari titik (0,0) ke titik (1,1) mewakili kinerja model klasifikasi yang random. Jika model memiliki kinerja seperti garis ini, maka model tersebut tidak memiliki kemampuan diskriminatif.
  • Series untuk kurva ROC: Ini adalah plot dari Sensitivity terhadap 1-Specificity untuk berbagai ambang klasifikasi. Semakin tinggi dan ke kiri kurva ini berada dari garis diagonal, semakin baik kinerja model.

Area di Bawah Kurva ROC (AUC):

  • AUC (0.839): Nilai AUC berkisar antara 0 dan 1. Sebuah AUC sebesar 0.839 menunjukkan bahwa model memiliki kemampuan diskriminatif yang sangat baik. Dalam kata lain, ada 83.9% kemungkinan bahwa model akan membedakan dengan benar antara positif dan negatif.
  • Galat Baku (0.016): Ini menunjukkan seberapa stabil estimasi AUC. Semakin kecil galat bakunya, semakin akurat estimasi AUC.
  • z-stat (20.764): Ini adalah statistik uji untuk hipotesis null bahwa AUC sebenarnya adalah 0.5 (tidak ada kemampuan diskriminatif). Nilai z-statistik yang tinggi menunjukkan bahwa AUC model secara signifikan berbeda dari 0.5.
  • Tingkat signifikansi P (0.000): Nilai p menunjukkan probabilitas mendapatkan AUC yang diamati atau lebih ekstrem jika hipotesis null benar (yaitu, model tidak memiliki kemampuan diskriminatif). Nilai p yang sangat rendah (0.000) menegaskan bahwa model memiliki kemampuan diskriminatif yang signifikan.

Kesimpulan:

Dari grafik ROC dan nilai AUC, dapat disimpulkan bahwa model klasifikasi memiliki kemampuan diskriminatif yang sangat baik dalam membedakan antara individu yang memiliki diabetes dan yang tidak. AUC yang tinggi menunjukkan kualitas model yang baik, dan ini diperkuat dengan nilai z-statistik yang tinggi dan nilai p yang sangat rendah.

Metrik Performa pada Berbagai Nilai Probabilitas

Grafik Performa Model pada Berbagai Nilai Ambang Probabilitas: Perbandingan antara Sensitivitas, Spesifisitas, dan Akurasi

Chart, line chart, scatter chart Description automatically generated

Interpretasi dan Pembahasan Grafik "Metrik Performa pada Berbagai Nilai Probabilitas" dalam Konteks Diabetes:

  1. Axis X (Cut-off Prob.):
    • Ini menunjukkan berbagai nilai ambang probabilitas yang digunakan untuk klasifikasi. Dengan meningkatkan atau menurunkan nilai ambang ini, kita dapat mengubah seberapa sering model memprediksi hasil positif atau negatif.
    • Dalam konteks diabetes, grafik ini menampilkan berbagai nilai ambang probabilitas yang digunakan untuk memprediksi keberadaan diabetes pada individu. Dengan menyesuaikan nilai ambang ini, kita dapat mengubah seberapa sering pasien diprediksi menderita diabetes atau tidak.
  2. Axis Y (Performance Metric (%)):
    • Grafik menunjukkan bagaimana ketepatan diagnosa diabetes (Sensitivity, Specificity, dan Accuracy) berubah sesuai dengan nilai ambang probabilitas yang dipilih.
  3. Series - Sensitivity, Specificity, dan Accuracy:
    • Sensitivity: Terlihat ada kecenderungan menurun dalam Sensitivity saat nilai ambang probabilitas meningkat. Dalam konteks diabetes, hal ini berarti semakin tinggi ambang yang kita tentukan, semakin sedikit pasien yang benar-benar menderita diabetes yang kita deteksi. Ini bisa menjadi masalah jika kita ingin memastikan tidak ada pasien diabetes yang terlewat.
    • Specificity: Seiring dengan kenaikan ambang probabilitas, Specificity meningkat. Dalam praktik medis, ini berarti kita menjadi lebih percaya diri bahwa pasien yang kita diagnosa tidak menderita diabetes memang benar-benar tidak menderita penyakit tersebut. Namun, risikonya adalah meningkatkan kemungkinan melewatkan pasien yang sebenarnya menderita diabetes.
    • Accuracy: Dalam konteks diabetes, akurasi menunjukkan seberapa sering model kita benar dalam mendiagnosa keberadaan atau ketiadaan diabetes berdasarkan ambang probabilitas yang ditentukan.

Kesimpulan:

Grafik ini sangat penting dalam konteks medis, khususnya dalam mendiagnosa diabetes. Dengan menyesuaikan ambang probabilitas, dokter dan profesional medis dapat menentukan keseimbangan yang diinginkan antara Sensitivity dan Specificity.

Contohnya, dalam skenario di mana sangat penting untuk memastikan semua pasien dengan diabetes teridentifikasi (misalnya, dalam skrining awal di area dengan prevalensi diabetes yang tinggi), dokter mungkin memilih ambang yang lebih rendah untuk memaksimalkan Sensitivity. Namun, ini mungkin mengakibatkan beberapa pasien yang sebenarnya sehat mendapat diagnosa diabetes (False Positive).

Sebaliknya, dalam setting di mana konsekuensi dari False Positives sangat tinggi (misalnya, dalam keputusan pemberian pengobatan invasif berdasarkan hasil diagnosa), dokter mungkin memilih ambang yang lebih tinggi untuk memaksimalkan Specificity, meskipun risikonya adalah melewatkan beberapa pasien dengan diabetes (False Negative).

Dengan demikian, penting untuk memahami dampak dari setiap nilai ambang probabilitas dalam praktik medis dan menyesuaikannya dengan kebutuhan dan konteks klinis yang spesifik.

Sebaran Outcome vs Prediksi

Chart Description automatically generated

Interpretasi dan Pembahasan Grafik "Distribusi Outcome Versus Prediksi":

  1. Cut-Off Probabilitas (Axis X):
    • Ini merepresentasikan ambang batas probabilitas yang digunakan untuk mengklasifikasikan prediksi. Sebagai contoh, jika kita menggunakan ambang batas 0.3, maka semua prediksi dengan probabilitas di atas 0.3 akan diklasifikasikan sebagai "YES" dan yang di bawahnya sebagai "NO".
  2. Frekuensi (Axis Y):
    • Menunjukkan jumlah prediksi yang jatuh ke dalam kategori "YES" atau "NO" pada setiap ambang batas probabilitas.
  3. Series YES dan NO:
    • Pada ambang batas yang lebih rendah (mis. 0 hingga 0.2), kita melihat bahwa sebagian besar prediksi diklasifikasikan sebagai "NO".
    • Seiring dengan meningkatnya ambang batas, jumlah prediksi "NO" menurun, sementara prediksi "YES" meningkat.
    • Ada puncak untuk kategori "YES" di sekitar ambang batas 0.7, di mana prediksi "YES" mencapai frekuensi tertingginya.
    • Frekuensi prediksi "NO" mencapai nilai minimumnya di sekitar ambang batas yang sama (0.7).

Interpretasi dan Kaitannya dengan Database Diabetes Suku Pima:

Dataset ini berfokus pada diagnosis diabetes pada perempuan dari suku Pima dengan mempertimbangkan beberapa parameter kesehatan. Tujuannya adalah untuk memprediksi kemungkinan seorang pasien memiliki diabetes atau tidak berdasarkan variabel-variabel prediktornya.

Dari grafik "Distribusi Outcome Versus Prediksi", kita dapat melihat bagaimana distribusi prediksi diagnosis diabetes berubah berdasarkan berbagai ambang batas probabilitas:

  1. Ambang Batas Probabilitas dan Keputusan Klinis:
    • Menentukan ambang batas probabilitas sangat penting dalam konteks medis karena dapat mempengaruhi keputusan klinis. Ambang batas yang rendah berarti lebih banyak pasien akan diberi label sebagai memiliki diabetes (meningkatkan Sensitivity). Namun, ini juga meningkatkan risiko salah diagnosa (mengurangi Specificity).
    • Sebaliknya, ambang batas yang tinggi berarti lebih sedikit pasien yang diberi label sebagai memiliki diabetes, mengurangi risiko salah diagnosa tetapi juga meningkatkan risiko melewatkan diagnosis pada pasien yang sebenarnya memiliki diabetes.
  2. Relevansi dalam Praktik Klinis:
    • Mengingat konsekuensi serius dari diabetes, memilih ambang batas yang tepat sangat krusial. Jika konsekuensi dari melewatkan diagnosis diabetes (False Negative) dianggap lebih serius daripada salah mendiagnosis seseorang dengan diabetes (False Positive), maka ambang batas yang lebih rendah mungkin dipilih untuk meningkatkan sensitivitas.
    • Dengan memahami distribusi prediksi pada berbagai ambang batas, para klinisi dapat membuat keputusan yang lebih tepat dan berdasarkan bukti tentang bagaimana mendiagnosis pasien.
  3. Kesimpulan dari Grafik:
    • Grafik menunjukkan bagaimana distribusi prediksi berubah dengan berbagai ambang batas probabilitas untuk diagnosis diabetes.
    • Pada ambang batas yang lebih rendah, lebih banyak pasien yang diberi label sebagai tidak memiliki diabetes. Sebaliknya, pada ambang batas yang lebih tinggi, lebih banyak pasien yang diberi label sebagai memiliki diabetes.
    • Ini menunjukkan bagaimana kita dapat menyesuaikan sensitivitas dan spesifisitas model berdasarkan ambang batas yang dipilih, yang pada gilirannya dapat mempengaruhi keputusan klinis.

Dengan mempertimbangkan semua informasi ini, menjadi jelas bahwa pemilihan ambang batas yang tepat adalah krusial dalam diagnosis dan pengobatan diabetes pada perempuan dari suku Pima. Keputusan ini harus dibuat dengan mempertimbangkan konsekuensi klinis dari kesalahan prediksi dan kebutuhan pasien yang spesifik.

Tabel Residual dan Pemeriksaan Data Pencilan

Table Description automatically generated

Analisis residu adalah salah satu tahap penting dalam menilai kualitas model regresi logistik (atau model regresi lainnya). Dalam konteks model regresi logistik untuk memprediksi diabetes, residu mengukur sejauh mana prediksi model sesuai dengan data aktual. Ada beberapa jenis residu dan statistik lain yang digunakan untuk mengevaluasi kesesuaian model, termasuk:

  1. Residual: Ini adalah perbedaan antara hasil observasi aktual dan hasil yang diprediksi oleh model.
  2. Pearson Residual: Ini adalah jenis residu yang dinormalisasi dan sering digunakan dalam regresi logistik.
  3. Deviance Residual: Ini adalah ukuran seberapa baik model memprediksi suatu hasil tertentu.
  4. Leverage: Ini mengukur seberapa jauh suatu titik data dari rata-rata data. Titik data dengan leverage tinggi dapat memiliki pengaruh besar terhadap estimasi model.
  5. Studentized Pearson Residual: Ini adalah Pearson Residual yang dibagi dengan standar deviasinya.
  6. Studentized Deviance Residual: Mirip dengan residu deviasi, tetapi telah dinormalisasi.
  7. Likelihood Residual: Ini mengukur seberapa baik model memprediksi suatu hasil, serupa dengan deviance residual.
  8. Cooks Distance: Ukuran yang mengidentifikasi titik data yang mungkin memiliki pengaruh besar terhadap estimasi model.
  9. DFITS: Statistik lain yang mengukur pengaruh suatu titik data terhadap model.

Dari data di atas, kolom "Diagnostic" memberikan informasi tambahan tentang titik data tertentu:

  • Outlier: Titik data ini memiliki residu yang sangat tinggi atau sangat rendah, yang menunjukkan bahwa prediksi model untuk titik data ini jauh dari observasi aktual.
  • Extrem: Ini menunjukkan bahwa titik data memiliki pengaruh besar terhadap estimasi model. Hal ini bisa disebabkan oleh kombinasi dari fitur-fitur yang jarang ditemui atau nilai yang jauh dari rata-rata.

Dalam praktiknya, sangat penting untuk memeriksa dan memahami outlier dan titik data ekstrem, karena dapat memiliki pengaruh besar terhadap model dan interpretasi hasilnya.

Interpretasi Diagnostik:

  • Outlier: outlier mengacu pada nilai respons (dalam hal ini, kemungkinan memiliki diabetes atau 'Y') yang tidak sesuai dengan prediksi model. Ini berarti bahwa untuk titik data tersebut, model kita memprediksi dengan jauh berbeda dari apa yang sebenarnya terjadi. Dalam kata lain, outlier adalah kasus di mana perbedaan antara hasil observasi aktual dan hasil yang diprediksi oleh model sangat signifikan. Hal ini mungkin disebabkan oleh karakteristik khusus dari pasien tersebut yang tidak dicakup dengan baik oleh model atau kesalahan dalam data.
  • Ekstrim: Sementara outlier berkaitan dengan nilai respons, ekstrim lebih berfokus pada nilai prediktor (dalam hal ini, variabel seperti 'Pregnancies', 'Glucose', 'BloodPressure', dll.). Ekstrim mengacu pada titik data di mana salah satu atau lebih variabel prediktor memiliki nilai yang sangat tinggi atau rendah dibandingkan dengan sampel lainnya. Hal ini dapat menunjukkan bahwa pasien memiliki kondisi atau karakteristik yang jarang ditemui dalam dataset. Ekstrim dapat memiliki pengaruh besar terhadap model, terutama jika model sangat bergantung pada variabel prediktor tersebut untuk membuat prediksi. Dalam tabel, ekstrim ditandai dengan nilai leverage yang tinggi, yang menunjukkan seberapa jauh suatu titik data dari rata-rata data dalam hal variabel prediktor.

Kesimpulan:

Saat mengevaluasi model, penting untuk membedakan antara outlier dan ekstrim. Outlier menyoroti di mana model kita tidak melakukan prediksi dengan baik, sedangkan ekstrim mengingatkan kita pada titik data dengan karakteristik yang jarang ditemui yang dapat mempengaruhi performa model. Kedua jenis titik data ini perlu diperhatikan dengan cermat, karena dapat memberikan wawasan tentang kelemahan model dan area di mana model mungkin perlu ditingkatkan atau data mungkin perlu ditinjau kembali.

Regresi Probit

Interpetasi untuk hasil analisis regresi dengan tipe regresi probit, hampir sama dengan interpretasi regresi logit.

Informasi tipe regresi yang digunakan, metode regresi, respons dan prediktor, dan persamaan regresi probit

Nilai statistik ketepatan model regresi dan estimasi koefisien regresi
Table Description automatically generated

Analisis deviance/ragam dan Tabel klasifikasi (Confussion Matrix) dan metrik lainnya
Table Description automatically generated

Kurva Receiver Operating Characteristic (ROC) dan statistik area di bawah kurva ROC
Chart, line chart, scatter chart Description automatically generated

Metrik performa pada berbagai nilai probabilitas (Sensitivity, Specificity, Accuracy)
Chart, line chart Description automatically generated

Sebaran Outcome vs Prediksi
Chart Description automatically generated

Tabel residual dan pemeriksaan data pencilan

Kesimpulan

Berdasarkan analisis yang telah dilakukan pada data diabetes, beberapa poin penting dapat disimpulkan:

  1. Analisis Deskriptif: Kita menemukan bahwa variabel seperti Glukosa, Tekanan Darah, dan BMI memiliki variasi yang signifikan dalam distribusi mereka, yang menunjukkan pentingnya mereka dalam memahami risiko diabetes. Ini menegaskan literatur sebelumnya yang mengaitkan faktor-faktor ini dengan diabetes.
  2. Model Prediktif: Analisis metrik performa pada berbagai nilai probabilitas menunjukkan bahwa dengan mengubah ambang probabilitas, kita dapat mengubah sensitivitas dan spesifikitas model. Ini penting dalam konteks medis, di mana kita mungkin ingin memprioritaskan mengidentifikasi semua kasus positif (tingkat sensitivitas yang tinggi) dibandingkan menghindari false positives (tingkat spesifikitas yang tinggi).
  3. Analisis Residual: Ditemukan beberapa titik data yang dianggap sebagai outlier atau ekstrim. Outlier menyoroti di mana model tidak melakukan prediksi dengan baik, sedangkan ekstrim menandai titik data dengan karakteristik yang jarang ditemui yang dapat mempengaruhi performa model.
  4. Penulisan dalam Laporan Karya Ilmiah:

Penulisan Hasil dan Pembahasan dalam Karya Ilmiah

Analisis Deskriptif

Berdasarkan analisis deskriptif, variabel Glukosa, Tekanan Darah, dan BMI menunjukkan variasi signifikan. Ini menegaskan bahwa faktor-faktor tersebut memainkan peran penting dalam risiko diabetes, sesuai dengan literatur sebelumnya.

Model Prediktif

Dalam analisis metrik performa, ditemukan bahwa dengan mengubah ambang probabilitas, kita dapat mengubah sensitivitas dan spesifikitas model. Ini menunjukkan fleksibilitas model dalam memenuhi kebutuhan klinis yang berbeda. Misalnya, dalam konteks pencegahan diabetes, kita mungkin ingin memprioritaskan mengidentifikasi semua kasus positif daripada menghindari false positives.

Analisis Residual

Analisis residual mengungkapkan keberadaan outlier dan ekstrim. Outlier menunjukkan di mana model kita mungkin tidak memprediksi dengan baik, sementara ekstrim menandai pasien dengan karakteristik yang jarang ditemui. Kedua jenis titik data ini menunjukkan area di mana model mungkin perlu diperbaiki atau data mungkin perlu ditinjau kembali.

KESIMPULAN

Berdasarkan analisis yang dilakukan, ditemukan bahwa variabel seperti Glukosa, Tekanan Darah, dan BMI memainkan peran penting dalam risiko diabetes. Model prediktif yang dikembangkan menunjukkan fleksibilitas dalam memenuhi kebutuhan klinis yang berbeda, namun analisis residual menunjukkan bahwa ada beberapa area di mana model mungkin perlu ditingkatkan. Sebagai langkah berikutnya, peneliti mungkin ingin mempertimbangkan melakukan peninjauan kembali data atau mengembangkan model dengan pendekatan yang berbeda untuk meningkatkan akurasi dan keandalan prediksi.