Sidebar Menu

Analisis Reliabilitas

Analisis reliabilitas adalah proses untuk mengevaluasi sejauh mana suatu instrumen, seperti survei atau tes, menghasilkan hasil yang konsisten dan stabil sepanjang waktu. Ini adalah konsep penting dalam penelitian kuantitatif dan psikometri.

Ada beberapa jenis reliabilitas, termasuk:

  1. Reliabilitas Test-Retest: Mengukur konsistensi suatu instrumen jika diuji pada subjek yang sama di waktu yang berbeda. Misalnya, jika kita mengajukan serangkaian pertanyaan kepada sekelompok orang, lalu mengajukan pertanyaan yang sama beberapa minggu kemudian, reliabilitas test-retest akan mengukur sejauh mana jawaban mereka konsisten dari waktu ke waktu. Uji yang digunakan: Korelasi Pearson atau Spearman bisa digunakan untuk mengukur reliabilitas test-retest.
  2. Reliabilitas Paralel atau Ekivalen: Mengukur konsistensi antara dua versi yang berbeda dari instrumen yang sama yang diberikan kepada subjek yang sama. Misalnya, jika Anda memiliki dua versi tes yang berbeda yang dimaksudkan untuk mengukur kemampuan yang sama, reliabilitas paralel akan mengukur sejauh mana kedua tes tersebut memberikan hasil yang sama. Uji yang digunakan: Korelasi Pearson atau Spearman bisa digunakan untuk mengukur reliabilitas paralel.
  3. Reliabilitas Internal: Mengukur sejauh mana item atau pertanyaan dalam satu instrumen berhubungan satu sama lain. Misalnya, jika Anda memiliki kuesioner dengan sejumlah pertanyaan yang semuanya dimaksudkan untuk mengukur tingkat stres, reliabilitas internal akan mengukur sejauh mana jawaban pada pertanyaan-pertanyaan tersebut saling berhubungan. Uji yang digunakan: Alpha Cronbach atau Split-Half (korelasi antara dua set pertanyaan yang dipilih secara acak) adalah metode yang biasa digunakan untuk mengukur reliabilitas internal.
  4. Reliabilitas antar Penilaian (Inter-Rater Reliability: Mengukur sejauh mana konsistensi antara penilaian dua atau lebih penilai. Misalnya, jika dua guru menilai esai yang sama, reliabilitas antar penilaian akan mengukur sejauh mana penilaian mereka berhubungan. Uji yang digunakan: Cohen’s Kappa, Fleiss’ Kappa, dan Intraclass Correlation adalah metode yang biasa digunakan untuk mengukur reliabilitas antar penilaian.

Sebagai catatan, reliabilitas adalah suatu keharusan, tetapi bukanlah cukup untuk suatu instrumen penelitian. Instrumen tersebut juga harus valid (mengukur apa yang seharusnya diukur). Suatu instrumen bisa reliabel (menghasilkan hasil yang konsisten), tetapi tidak valid (tidak mengukur variabel yang dimaksud).

Contoh Kasus

Berikut ini adalah contoh kasus "Uji Reliabilitas Skala Kepuasan Pelanggan pada Industri E-Commerce". Dalam contoh kasus ini, jenis uji yang digunakan adalah Uji Reliabilitas Internal dengan dataset berisi respon dari 50 responden. Skala ini terdiri dari 8 item, mencakup berbagai aspek layanan e-commerce, dan dinilai menggunakan skala Likert 5 poin. Tujuan utamanya adalah untuk mengevaluasi konsistensi dan keandalan skala ini. Untuk tujuan ini, digunakan Uji Cronbach's Alpha, sebuah metode reliabilitas internal yang akan menilai sejauh mana item-item saling berhubungan. Melalui penerapan metode ini, diharapkan bisa mendapatkan gambaran yang lebih baik tentang konsistensi dan keandalan instrumen survei yang digunakan.

ID

Platform e-commerce

Kualitas Produk

Harga Produk

Variasi Produk

Kecepatan Pengiriman

Respon Layanan Pelanggan

Proses Pengembalian Barang

Kemudahan Transaksi

Kesesuaian Deskripsi

1

Tokopedia

4

3

5

4

4

3

4

4

2

Shopee

3

4

4

3

4

4

4

3

3

Lazada

4

5

4

3

4

4

4

5

4

Shopee

4

3

5

4

4

4

5

4

5

Bukalapak

5

4

3

4

5

3

4

5

6

Tokopedia

3

3

4

3

4

3

4

4

7

Shopee

4

4

5

4

4

5

5

4

8

Bukalapak

4

3

4

3

3

3

4

3

9

Lazada

3

4

4

3

4

4

4

4

10

Shopee

4

4

5

5

4

5

5

5

11

Tokopedia

5

4

4

4

5

4

4

5

12

Shopee

3

4

4

3

4

4

4

3

13

Lazada

5

5

5

5

5

5

5

5

14

Shopee

4

4

4

4

4

4

4

4

15

Bukalapak

5

5

5

5

5

5

5

5

16

Tokopedia

2

3

2

3

2

2

2

2

17

Shopee

4

4

4

4

4

4

4

4

18

Bukalapak

3

3

3

3

3

3

3

3

19

Lazada

4

4

4

4

4

4

4

4

20

Shopee

5

5

5

5

5

5

5

5

21

Tokopedia

4

4

4

4

4

4

4

4

22

Shopee

2

3

2

3

2

3

3

2

23

Lazada

5

5

5

5

5

5

5

5

24

Shopee

4

4

4

4

4

4

4

4

25

Bukalapak

5

5

5

5

5

5

5

5

26

Tokopedia

2

3

2

3

2

2

2

2

27

Shopee

4

4

4

4

4

4

4

4

28

Bukalapak

3

3

3

3

3

3

3

3

29

Lazada

4

4

4

4

4

4

4

4

30

Shopee

5

5

5

5

5

5

5

5

31

Tokopedia

4

4

4

4

4

4

4

4

32

Shopee

2

3

2

3

2

3

3

2

33

Lazada

5

5

5

5

5

5

5

5

34

Shopee

4

4

4

4

4

4

4

4

35

Bukalapak

5

5

5

5

5

5

5

5

36

Tokopedia

2

3

2

3

2

2

2

2

37

Shopee

4

4

4

4

4

4

4

4

38

Bukalapak

3

3

3

3

3

3

3

3

39

Lazada

4

4

4

4

4

4

4

4

40

Shopee

5

5

5

5

5

5

5

5

41

Tokopedia

4

4

4

4

4

4

4

4

42

Shopee

2

3

2

3

2

3

3

2

43

Lazada

5

5

5

5

5

5

5

5

44

Shopee

4

4

4

4

4

4

4

4

45

Bukalapak

5

5

5

5

5

5

5

5

46

Tokopedia

2

3

2

3

2

2

2

2

47

Shopee

4

4

4

4

4

4

4

4

48

Bukalapak

3

3

3

3

3

3

3

3

49

Lazada

4

4

4

4

4

4

4

4

50

Shopee

5

5

5

5

5

5

5

5

Keterangan: Data fiktif

Langkah-langkah Uji Reliabilitas:

  1. Aktifkan lembar kerja (Sheet) yang akan dianalisis.
  2. Tempatkan kursor pada Dataset (untuk membuat Dataset, lihat cara Persiapan Data).
  3. Apabila sel aktif (Active Cell) tidak berada pada Dataset, SmartstatXL otomatis akan mencoba menentukan Dataset secara otomatis.
  4. Aktifkan Tab SmartstatXL
  5. Klik Menu Multivariate > Analisis Reliabilitas.
  6. SmartstatXL akan menampilkan kotak dialog untuk memastikan apakah Dataset sudah benar atau belum (biasanya alamat sel Dataset sudah otomatis dipilih dengan benar).
  7. Apabila sudah benar, Klik Tombol Selanjutnya
  8. Selanjutnya akan tampil Kotak Dialog Analisis Reliabilitas:
    A screenshot of a computer Description automatically generated
  9. Pilih Variabel dari daftar variabel pertama. Pada contoh kasus ini kita tentukan:
    • Item: Kualitas Produk sd. Kesesuaian Deskripsi
    • Model: Cronbach's Alpha
    • Ouputs: Centang semua

    Selengkapnya bisa dilihat pada tampilan kotak dialog berikut:
    A screenshot of a computer Description automatically generated

    Model lain yang bisa dipilih: Guttman's Lambda 4 (L4) dan Split-Half.

    Guttman's Lambda 4 (L4)juga dikenal sebagai koefisien lambda maksimum, adalah metode yang digunakan untuk mengukur reliabilitas internal suatu skala atau instrumen, mirip dengan Cronbach's Alpha. Lambda 4 memperhitungkan varians yang disebabkan oleh variasi antar individu dan variasi antar item.
    Split-Half Reliability: melibatkan pemisahan tes menjadi dua bagian (misalnya, pertanyaan genap dan ganjil) dan kemudian mengorelasikan skor dari dua bagian tersebut.

  10. Tekan tombol OK untuk membuat outputnya pada Lembar Output

Hasil Analisis

Nilai Statistik Reliabilitas

Hasil analisis reliabilitas menunjukkan bahwa skala penilaian kepuasan pelanggan memiliki reliabilitas yang sangat baik. Nilai Cronbach's Alpha sebesar 0.981 menunjukkan bahwa item-item dalam skala sangat konsisten dalam mengukur konsep yang sama, yaitu kepuasan pelanggan. Nilai ini jauh di atas ambang batas umum untuk reliabilitas yang baik, yaitu 0.70. Dengan kata lain, jika responden memberikan penilaian tinggi untuk satu item, mereka cenderung memberikan penilaian tinggi untuk item lainnya, dan sebaliknya.

Nilai N sebesar 8 menunjukkan bahwa ada 8 item dalam skala, yaitu "Kualitas Produk", "Harga Produk", "Variasi Produk", "Kecepatan Pengiriman", "Respon Layanan Pelanggan", "Proses Pengembalian Barang", "Kemudahan Transaksi", dan "Kesesuaian Deskripsi".

Batas Bawah dan Batas Atas (0.972 dan 0.988) menunjukkan rentang di mana kita dapat yakin 95% bahwa nilai Cronbach's Alpha sebenarnya berada, jika kita melakukan pengukuran berulang kali pada populasi yang sama. Fakta bahwa rentang ini juga sangat tinggi menunjukkan bahwa kita bisa sangat yakin tentang reliabilitas skala kita.

Namun, perlu diingat bahwa meskipun skala ini reliabel, tidak secara otomatis berarti bahwa itu valid. Validitas, atau sejauh mana skala mengukur apa yang seharusnya diukur, harus ditentukan melalui metode lain seperti analisis faktor atau penelitian empiris lainnya.

Nilai Cronbach's Alpha jika item dihapus

A screenshot of a spreadsheet Description automatically generated with medium confidence

Bagian dari output analisis reliabilitas ini menunjukkan apa yang akan terjadi pada nilai Cronbach's Alpha jika masing-masing item dihapus satu per satu dari skala. Ini membantu Kita mengetahui apakah ada item yang, jika dihapus, akan meningkatkan reliabilitas skala.

Dalam kasus ini, tidak ada item yang, jika dihapus, akan meningkatkan nilai Cronbach's Alpha secara signifikan. Sebagai contoh, jika "Kualitas Produk" dihapus, Cronbach's Alpha akan turun sedikit menjadi 0.977, yang masih merupakan nilai yang sangat tinggi. Hal yang sama berlaku untuk item lainnya.

Oleh karena itu, berdasarkan hasil ini, tampaknya semua item berkontribusi dengan baik terhadap reliabilitas keseluruhan dan tidak ada item yang perlu dihapus.

Matriks Korelasi dan Kovarian

A screenshot of a spreadsheet Description automatically generated with medium confidence

A screenshot of a spreadsheet Description automatically generated with medium confidence

Matriks korelasi menunjukkan korelasi Pearson antara setiap pasangan item. Korelasi Pearson berkisar antara -1 dan 1, di mana 1 menunjukkan korelasi positif sempurna, -1 menunjukkan korelasi negatif sempurna, dan 0 menunjukkan tidak ada korelasi.

Dalam hal ini, semua item tampaknya memiliki korelasi yang kuat dan positif satu sama lain, yang merupakan indikasi bahwa semua item mengukur konsep yang sama (kepuasan pelanggan) dan berkontribusi terhadap reliabilitas skala secara keseluruhan.

Sebagai contoh, "Kualitas Produk" memiliki korelasi yang sangat kuat dengan "Respon Layanan Pelanggan" (r = 0.950) dan "Kesesuaian Deskripsi" (r = 0.952), menunjukkan bahwa responden yang menilai kualitas produk tinggi juga cenderung menilai respons layanan pelanggan dan kesesuaian deskripsi produk secara positif.

Namun, perlu diingat bahwa korelasi yang sangat tinggi antara item bisa menunjukkan adanya redundansi, di mana beberapa item mungkin mengukur aspek yang sama dari konsep yang lebih luas. Dalam hal ini, Anda mungkin ingin mempertimbangkan untuk menggabungkan atau menghilangkan beberapa item untuk membuat skala lebih efisien, selama itu tidak mengorbankan validitas dan reliabilitas skala. Anda juga harus memeriksa apakah ada asumsi lain yang dilanggar, seperti multikolinearitas, yang bisa menjadi masalah dalam beberapa jenis analisis statistik lanjutan.

Nilai Statistik Item dan Skala

A screenshot of a spreadsheet Description automatically generated with medium confidence

Output ini merupakan statistik deskriptif untuk setiap item dalam skala dan untuk skala secara keseluruhan.

Statistik deskriptif untuk setiap item mencakup total, rata-rata, standar deviasi, dan jumlah responden (N). Misalnya, total skor untuk "Kualitas Produk" adalah 192, dengan rata-rata skor 3.840 (yang didapat dari total dibagi dengan N), standar deviasi 0.997 (yang mengukur seberapa jauh skor individu dari rata-rata), dan 50 responden. Hal yang sama berlaku untuk item lainnya. Misalnya, "Kemudahan Transaksi" memiliki rata-rata skor tertinggi (4.000), yang menunjukkan bahwa ini adalah area di mana responden merasa paling puas.

Statistik skala memberikan informasi serupa untuk skala secara keseluruhan. Jumlah total skor untuk semua item adalah 1568, dengan rata-rata 31.360, standar deviasi 6.895, dan 8 item dalam skala. Rata-rata skor skala (31.360) adalah rata-rata dari total skor semua item, yang bisa Anda dapatkan dengan menjumlahkan total skor untuk setiap item dan membaginya dengan jumlah item. Standar deviasi skala (6.895) mengukur sejauh mana skor total individu dari rata-rata skala. Namun, perlu dicatat bahwa standar deviasi yang besar dapat menunjukkan bahwa ada banyak variasi dalam bagaimana responden menilai item-item dalam skala, yang mungkin menunjukkan bahwa ada beberapa area di mana responden merasa lebih puas daripada yang lain.

Hasil Analisis dengan menggunakan model Split-Half dan Guttman's Lambda 4

A screenshot of a computer Description automatically generated with medium confidence

Berdasarkan hasil uji reliabilitas dengan metode Split-Half, berikut interpretasinya:

  • Dalam analisis reliabilitas Split-Half, skala atau kuesioner dibagi menjadi dua bagian, yaitu First Half dan Last Half. First Half mencakup item "Kualitas Produk", "Harga Produk", "Variasi Produk", dan "Kecepatan Pengiriman". Sedangkan Last Half mencakup item "Respon Layanan Pelanggan", "Proses Pengembalian Barang", "Kemudahan Transaksi", dan "Kesesuaian Deskripsi".
  • Cronbach's Alpha untuk First Half adalah 0.945, menunjukkan bahwa bagian pertama skala memiliki reliabilitas yang sangat baik.
  • Cronbach's Alpha untuk Last Half adalah 0.973, menunjukkan bahwa bagian kedua skala juga memiliki reliabilitas yang sangat baik.
  • Korelasi antara skor pada First Half dan Last Half adalah 0.976, menunjukkan korelasi yang sangat tinggi. Ini berarti bahwa responden yang memberikan skor tinggi pada bagian pertama cenderung memberikan skor tinggi pada bagian kedua, dan sebaliknya.
  • Koefisien Spearman-Brown adalah 0.988, menunjukkan bahwa jika skala ini diperpanjang dengan item yang mirip, reliabilitasnya diharapkan mencapai 0.988. Koefisien Spearman-Brown digunakan untuk memprediksi reliabilitas skala jika jumlah itemnya diperdoublkan.
  • Koefisien Guttman Split-Half adalah 0.985, ini adalah penilaian lain dari reliabilitas skala berdasarkan metode split-half. Koefisien Guttman Split-Half yang tinggi menunjukkan bahwa skala tersebut memiliki reliabilitas yang sangat baik.

Secara keseluruhan, hasil uji reliabilitas Split-Half ini menunjukkan bahwa skala ini sangat reliabel.

Hasil Analisis dengan menggunakan Guttman's Lambda 4

A screenshot of a computer Description automatically generated with medium confidence

Berdasarkan hasil uji reliabilitas dengan Guttman's Lambda 4 (Max L4), dapat diinterpretasikan sebagai berikut:

  • Nilai maksimum untuk Guttman's Lambda 4 adalah 0.993, yang berarti ada konsistensi yang sangat tinggi antara responden dalam penilaiannya atas item "Kualitas Produk", "Harga Produk", "Variasi Produk", dan "Kemudahan Transaksi" dengan item "Kecepatan Pengiriman", "Respon Layanan Pelanggan", "Proses Pengembalian Barang", dan "Kesesuaian Deskripsi". Nilai ini menunjukkan bahwa skala ini sangat reliabel dalam mengukur konstruk yang dituju.
  • Sebaliknya, nilai minimum untuk Guttman's Lambda 4 adalah 0.957, yang berarti ada konsistensi yang cukup tinggi, tetapi sedikit lebih rendah, antara responden dalam penilaian mereka atas item "Kualitas Produk", "Variasi Produk", "Respon Layanan Pelanggan", dan "Kesesuaian Deskripsi" dengan item "Harga Produk", "Kecepatan Pengiriman", "Proses Pengembalian Barang", dan "Kemudahan Transaksi".
  • Rata-rata dan median nilai Guttman's Lambda 4 adalah 0.981 dan 0.984, secara berurutan, yang berarti bahwa, rata-rata, ada konsistensi yang sangat tinggi antara responden dalam penilaian mereka atas semua item dalam skala ini.

Secara keseluruhan, hasil ini menunjukkan bahwa skala kepuasan pelanggan ini memiliki reliabilitas yang sangat tinggi, yang berarti bahwa skala ini konsisten dalam mengukur apa yang dimaksud untuk diukur.