Senin, 22 Agustus 2011

Proses dasar dan jumlah sampel pada analisis diskriminan

Proses dasar dari analisis diskriminan:
• Memisah variabel-variabel menjadi Variabel Dependen dan Variabel Independen.
• Menentukan metode untuk membuat Fungsi Diskriminan. Pada prinsipnya ada dua metode dasar untuk itu, yakni:
     1. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan secara bersama-sama   kemudian dilakukan proses Diskriminan.
      2. STEP-WISE ESTIMATION, di mana variabel dimasukkan satu per satu ke dalam model diskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model, dan ada kemungkinan satu atau lebih
variabel independen yang 'dibuang' dari model.
• Menguji signifikansi dari Fungsi Diskriminan yang telah terbentuk, menggunakan Wilk's Lambda, Pilai, F test dan lainnya.
.• Menguji ketepatan klasifikasi dari fungsi diskriminan, termasuk mengetahuiketepatan klasifikasi secara individual dengan Casewise Diagnostics.
• Melakukan interpretasi terhadap Fungsi Diskriminan tersebut.
• Melakukan uji validasi Fungsi Diskriminan

Secara pasti tidak ada jumlah sampel yang ideal pada Analisis Diskriminan. Pedoman yang bersifat umum menyatakan untuk setiap variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam variabel independen, seharusnya minimal ada 6x5=30 sampel. Secara terminologi SPSS, jika ada enam kolom variabel independen, sebaiknya ada 30 baris data.

Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni analysis sample yang digunakan untuk membuat Fungsi Diskriminan, serta holdout sample (spilt sample) yang digunakan untuk menguji hasil diskriminan.

Sebagai contoh, jika ada 70 sampel, maka sampel tersebut bisa dibagi dua, 35 untuk analysis sample dan 35 untuk holdout sample. Kemudian hasil fungsi diskriminan yang terjadi pada analysis sample
dibandingkan dengan hasil fungsi diskriminan dari holdput sample, apakah terjadi perbedaan yang besar ataukah tidak. Jika ketepatan klasifikasi kedua sampel hampir sama besar, dikatakan fungis diskriminan dari analysis sample sudah valid. Inilah yang disebut proses validasi silang (Cross Validation) dari
fungsi diskriminan.