Minggu, 28 Agustus 2011

Missing data analysis dalam multivariat

Missing data atau missing value adalah informasi yang tidak tersedia untuk sebuah subyek (kasus). Dalam alat statistik,missing data adalah adanya sel-sel kosong pada satu atau beberapa variabel. missing data terjadi karena informasi untuk sesuatu tentang objek tidak diberikan,sulit dicari atau memang informasi teresbut tidak ada.

Missing data pada dasarnya tidak bermasalah bagi keseluruhan data,apalagi jika jumlahnya hanya sedikit namun jika presentase data yang hilang tersebut ckup besar, maka perlu dilakukan pengujian apakah data yang mengandung missing tersebut masih layak diproses lebih lanjut ataukah tidak.

Jika pada sebuah data ditemukan adanya missing data (value) dan data yang hilang(missing) tersebut terbukti bersifat random perlu dilakuakn berbagai treatment.Random disini berarti missing value yang terjadi tidak disengaja dan tidak mengacu keadaan tertentu.
Treatment yang dapat dilakukan adalah
  • membuang baris (kasus) yang mengandung misssing value,menghapus variabel(kolom) yang mengandung missing value
  • mengisi sel(data) yang missing dengan nilai tertentu yang dianggap bisa mendekati kenyataan sebenarnya jika data terisi.Cara mengisi data yang missing bisa bermacam-macam, dan yang populer adalah mengisi dengan rata-rata keseluruhan data.