Sidebar Menu

Analisis Data Eksploratif

Kategori Analisis Data Eksploratif pada website Smartstat menyajikan berbagai artikel yang membahas teknik dan metode dalam melakukan eksplorasi data. Anda akan menemukan materi tentang analisis data eksploratif, stemplot, dan box-plot. Analisis data eksploratif (Exploratory Data Analysis – EDA) merupakan metode eksplorasi data dengan menggunakan teknik aritmatika sederhana dan teknik grafis dalam meringkas data pengamatan. Eksplorasi data merupakan bagian yang integral dari persepsi kita dan sangat menunjang dalam menelaah dan menemukan tentang sifat-sifat data yang nantinya dapat berguna dalam menyeleksi model statistik yang tepat.

Artikel-artikel ini mencakup berbagai topik, mulai dari pengertian dan tujuan analisis data eksploratif, hingga konsep-konsep seperti stemplot dan box-plot. Stemplot, juga dikenal sebagai stem-and-leaf plot, merupakan alat untuk menyajikan data kuantitatif dalam format grafis, mirip dengan histogram, yaitu untuk membantu dalam memvisualisasikan bentuk distribusi data. Sementara itu, box-plot atau box and whisker plots, adalah ringkasan distribusi sampel yang disajikan secara grafis yang bisa menggambarkan bentuk distribusi data (skewness), ukuran tendensi sentral dan ukuran penyebaran (keragaman) data pengamatan. Setiap artikel disajikan dengan penjelasan yang jelas dan mudah dipahami, menjadikan kategori Analisis Data Eksploratif ini sebagai sumber belajar yang berharga bagi siapa saja yang ingin memperdalam pengetahuan mereka tentang analisis data eksploratif.

Analisis data eksploratif (Exploratory Data Analysis – EDA) merupakan metode eksplorasi data dengan menggunakan teknik aritmatika sederhana dan teknik grafis dalam meringkas data pengamatan. Eksplorasi data merupakan bagian yang integral dari persepsi kita. Apabila tujuan akhir dari penelitian bukan untuk menghasilkan inferensi kausal, analisis data selanjutnya sudah tidak diperlukan lagi. Namun apabila diperlukan, analisis data eksploratori sangat menunjang dalam menelaah dan menemukan tentang sifat-sifat data yang nantinya dapat berguna dalam menyeleksi model statistik yang tepat. Dengan demikian, pada analisis data eksploratif, sifat dari data pengamatanlah yang akan menentukan model analisis statistik yang sesuai (atau perbaikan dari analisis yang sudah direncanakan).

Langkah pertama dalam menganalisis data adalah mempelajari karakteristik dari data tersebut. Terdapat beberapa alasan penting yang perlu kita pertimbangkan secara cermat sebelum analisis data sebenarnya kita lakukan. Alasan pertama pemeriksaan data adalah untuk memeriksa kesalahan-kesalahan yang mungkin terjadi pada berbagai tahap, mulai dari pencatatan data di lapangan sampai pada entry data pada komputer. Alasan berikutnya adalah untuk tujuan eksplorasi data sehingga kita bisa menentukan model analisis yang tepat.

Baik histogram dan stem-and-leaf plots berguna untuk memberikan gambaran ukuran tendensi sentral dan kesimetrisan data pengamatan. Penyajian grafis lainnya yang bisa merangkum informasi lebih detail mengenai distribusi nilai-nilai data pengamatan adalah Box and Whisker Plots atau lebih sering disebut dengan BoxPlot atau Box-Plot (kotak-plot) saja. Seperti namanya, Box and Whisker, bentuknya terdiri dari Box (kotak) dan whisker.

Box-Plot merupakan ringkasan distribusi sampel yang disajikan secara grafis yang bisa menggambarkan bentuk distribusi data (skewness), ukuran tendensi sentral dan ukuran penyebaran (keragaman) data pengamatan.
Pada artikel Mengenal Box-Plot (Box and Whisker Plots) ini akan diuraikan secara rinci mengenai manfaat Box-Plot dalam menjelaskan ukuran tendensi sentral serta rincian detail bagian-bagian dari Box-Plot.

Penyajian lain yang mirip dengan histogram adalah Stemplot. Stemplot juga dikenal sebagai stem-and-leaf plot atau apabila diterjemahkan ke dalam bahasa indonesia berarti plot batang dan daun. Di dalam statistik, stemplot merupakan alat untuk menyajikan data kuantitatif dalam format grafis, mirip dengan histogram, yaitu untuk membantu dalam memvisualisasikan bentuk distribusi data yang sering digunakan dalam analisis eksplorasi.

Stemplot diperkenalkan oleh Arthur Bowley di awal tahun 1900-an. Namun penggunaannya secara umum baru dimulai pada tahun 1980 setelah John Tukey's mempublikasikan Exploratory Data Analysis pada tahun 1977. Stem-and-leaf plot memberikan informasi lebih banyak tentang nilai yang sebenarnya dibanding histogram. Seperti dalam histogram, panjang setiap batang sesuai dengan jumlah kejadian yang jatuh ke dalam interval tertentu. Pada Histogram. kita hanya bisa melihat nilai frekuensi dari data namun kita tidak tahu berapa nilai angka sebenarnya. Berbeda dengan histogram, pada Stem-and-leaf plot selain kita bisa mengetahui nilai frekuensinya, kita pun bisa tau berapa nilai data sebenarnya. Hal ini dilakukan dengan membagi nilai-nilai yang diamati menjadi dua komponen, stem dan leaf.