Efek Seleksi Aitem Berdasar Daya Diskriminasi Terhadap Reliabilitas Skor Tes

Dalam pengembangan tes sebagai instrumen pengukuran untuk riset psikologi dan pendidikan, seleksi aitem berdasarkan statistik daya diskriminasi aitem merupakan salah satu tehnik guna meningkatkan reliabilitas skor tes (Azwar, 1997). Hal tersebut adalah penting teruama dalam pendekatan teori skor-murni klasik (Allen & Yen, 1979; Crocker, & Algina, 1986). Salah-satu statistik daya diskriminasi aitem adalah koefisien korelasi antara skor aitem dan skor total tes yang dikenal dengan nama korelasi aitem-total (riX) dan koefisien r-point biserial (rpbis).

Sudah diketahui bahwa estimasi terhadap perubahan reliabilitas yang disebabkan oleh perubahan panjang tes dapat dilakukan dengan komputasi formula Spearman-Brown prophecy (Thompson, 2003) atau formula  stepped-up reliability (Allen & Yen, 1979), yaitu:

selengkapnya dapat diunduh di sini.

Comments

23 responses to “Efek Seleksi Aitem Berdasar Daya Diskriminasi Terhadap Reliabilitas Skor Tes”

  1. Jasmadi Avatar
    Jasmadi

    Assalamu’alaikum Pak…
    Saya sudah mendowload tulisan Bapak yg berjudulEfek Seleksi Item Berdasarkan Daya beda……
    Mohon Izinnya Pak.
    Terima kasih
    wassalam

  2. pak SA Avatar
    pak SA

    .. Wa alaikumussalaam;
    Silakan, semoga bermanfaat.
    SA

  3. pak SA Avatar
    pak SA

    Wa alaikumussalam;
    Tidak ada salahnya S1 mengevaluasi IST atau tes yang lain melalui penelitian.
    Yang penting penelitian dilakukan dengan metodologi yang benar.
    Proposoal sebaiknya dikirim ke dosen pembimbing.
    SA

  4. akmal Avatar
    akmal

    Assalamualaikum pak,saya akmal, pengen bertanya lagi,heheheh apakah aitem yang berdaya diskriminasi dibawah o,2 untuk alat tes psikologi dapat langsung dieliminasi, atau mungkin ada pertimbangan lain pak. makasih banyak sebelumnya pak

  5. pak SA Avatar
    pak SA

    Wa alaikumussalaam Akmal.
    Mengeliminasi aitem dengan daya beda yang tidak cukup tinggi tapi tidak buruk sekali perlu mempertimbangkan akibatnya terhadap keutuhan indikator perilaku pada aspek yang diwakilinya.
    Kalau bukan untuk high-stake test (tes yg beresiko tinggi) daya beda 0,2 boleh jadi masih bisa digunakan bila hanya pada satu-dua aitem saja, terutama bila aitem-aitem yang lain daya bedanya tinggi. Coba cek koefisien reliabilitasnya. Kalau koefisien reliabilitasnya tinggi, menyertakan aitem tersebut ok saja.
    Setahu saya, ETS (Educational Testing Service) menggunakan batasan 0,20 itu dalam seleksi aitemnya karena mereka selalu menggunakan sampel besar.
    SA

  6. akmal Avatar
    akmal

    maaf sebelumnya pak, jika batasan 0,2 biasanya digunakan untuk ETS, apakah patokan tersebut dapat pula digunakan untuk evaluasi tes psikologi, yang menjadi pertimbangan tentunya tes prestasi idealnya untuk membandingkan kemampuan tinggi dan rendah, sementara untuk tes psikologi terkadang aitem yang terlalu sulit dan terlalu mudah perlu dilibatkan karena dianggap konten vital, apakah ada acuan khusus menyangkut penyebaran (variasi) menyangkut daya beda pada tes psikologi. mohon pencerahannya pak..heheheh

  7. saifullah Avatar

    Assalamu’alaikum Wr. Wb.
    Maaf Prof AZ, artikel yang berjudul efek seleksi aitem berdasar daya diskriminasi terhadap reliabilitas skor tes tidak dapat diunduh?
    terima kasih

  8. pak SA Avatar
    pak SA

    Waalaikumussalam . .
    wups, . . insyaAllah segera saya cek knapa sampai tidak bisa diunduh . .

  9. indana Avatar
    indana

    assalam
    mf prof. AZ saya mau tanya, kalo untuk pengembangan instrumen tes, apakah penilaian dari ahli itu sudah cukup?
    apabila dari ahli soalnya sudah layak tetapi ketika validasi empiris, ternyata validitas butir soal dan daya beda rendah, apakah soal tersebut harus dibuang atau cukup direvisi?

  10. pak SA Avatar
    pak SA

    Indana,
    Tidak cukup tapi sangat perlu, karena itu baru langkah awal. Masih perlu uji daya beda dan uji validitas aitem secara empiris. Apakah aitem yang daya beda rendah harus dibuang atau direvisi tergantung apakah aitem yang baik sudah mencukupi atau belum sesuai blue-print dan spesifikasi tes. Aitem yang direvisi masih harus menjalani uji ulang.
    SA.

  11. indana Avatar
    indana

    maksud saya untuk spesifikasi tes diagnostik. untuk menentukan soal yang sesuai atau tidak dengan blue print dan spesifikasi tes itu bagaimana? apakah harus dikonsultasikan ke ahli lagi?

  12. tanti Avatar
    tanti

    ass. pak , dalam analisis kualitas butir pilihan ganda, apakah rpbis dapat digunakan untuk daya beda butir sekaligus untuk validitas butir?

  13. devy yurista Avatar

    Assalamualaikum
    Perkenalkan Prof. saya devy yurista mahasiswa fakultas kedokteran jurusan psikologi Unsyiah Banda Aceh sekarang saya sedang melakukan penelitian (skripsi).
    Saya ingin bertanya setelah try out ketika menyusun disribusi aitem skala apakah harus proposional ? artinya kita akan menggugurkan beberapa aitem yg reliabel utk menyeimbangkannya agar jumlahnya sama per aspek, kemudian berapa jumlah pernyataan yg ideal utk mengukur suatu aspek ?
    Terima kasih banyak sebelumnya Prof. telah meluangkan waktu untuk membaca pertnyaan saya..

  14. pak SA Avatar
    pak SA

    Tanti;
    rpbis menunjukkan daya beda aitem, tidak menunjukkan validitas.
    Validitas aitem secara konten dapat ditunjukkan antara lain oleh CVR yang diusulkan Lawshe, 1975 (A Quantitative Approach to Content Validity, Personnel Psychology, 28, 4, 563-575)

  15. pak SA Avatar
    pak SA

    Waalaikumussalam, Devy;
    Kalau konstrak teoretisnya menghendaki perbandingan tertentu bagi jumlah aitem di setiap aspek, maka itu harus dipenuhi. Artinya dipilih secara proporsional di antara aitem-aitem yang baik agar perbandingan tersebut sesuai teori.
    Kalau tidak ada tuntutan teoretiknya, maka tidak ada juga keharusan perbandingan tertentu bagi jumlah aitem setiap aspek dan biasanya dalam situasi ini jumlah aitem di masing-masing aspeknya cenderung disamakan saja. Perlu diingat bahwa ‘sama’ tidak berarti harus betul-betul persis sama. Jumlah yang sedikit berbeda di antara aspek tidak menjadi soal.

  16. Riko Wijaya Avatar

    ass

    Terima kasih prof atas informasinya

  17. Cahyo Avatar
    Cahyo

    Assalamualaikum pak, saya cahyo. Mohon maaf mengganggu sebelumnya. Saya mau bertanya, Apakah bapak pernah melakukan penelitian olahraga sepakbola tentang reabilitas dan validitas tentang jauh tendangan siswa? Terima kasih pak. Mohon maaf sebelumnya.

  18. hanum midya Avatar
    hanum midya

    Terima kasih prof atas informasinya..

  19. Vanny Avatar
    Vanny

    Selamat pgi pak..
    Ijin bertanya.. apakah dlm adaptasi alat ukur diagnostik perlu dilakukan uji daya beda item? Trimakasih pak ?

  20. pak SA Avatar
    pak SA

    Ya.
    Aitem hasil adaptasi tetap perlu diuji daya bedanya.

  21. pak SA Avatar
    pak SA

    Belum pernah.
    SA

  22. Sri Lestari Avatar
    Sri Lestari

    Assalamu’alaikum Prof Azwar,
    Mohon ijin ikut belajar dari tulisan-tulisan Bapak.
    Terima kasih

  23. pak SA Avatar
    pak SA

    Silakan Sri Lestari.
    SA

Leave a Reply

Your email address will not be published. Required fields are marked *