BAB
I
PENDAHULUAN
A. Latar
Belakang
Penilaian
pendidikan adalah proses untuk mendapatkan informasi tentang prestasi atau
kinerja peserta didik. Hasil penilaian
digunakan untuk melakukan evaluasi terhadap ketuntasan belajar peserta didik
dan efektivitas proses pembelajaran. Fokus penilaian pendidikan adalah
keberhasilan belajar peserta didik dalam mencapai standar kompetensi yang
ditentukan. Pada tingkat mata pelajaran, kompetensi yang harus dicapai berupa
Standar Kompetensi (SK) mata pelajaran yang selanjutnya dijabarkan dalam
Kompetensi Dasar (KD). Untuk tingkat satuan pendidikan, kompetensi yang harus
dicapai peserta didik adalah Standar Kompetensi Lulusan (SKL).
Prinsip penilaian mengacu pada standar penilaian
pendidikan jenjang pendidikan dasar dan menengah, salah satunya yang paling
utama adalah sahih dan reliabel. Sahih, berarti penilaian didasarkan pada data
yang mencerminkan kemampuan yang diukur. Oleh karena itu, instrumen yang
digunakan perlu disusun melalui prosedur sebagaimana dijelaskan dalam panduan
agar memiliki bukti kesahihan dan keandalan.
Ada beberapa alasan
penyusun tes sebagai alat ukur kompetensi siswa sering tidak mengikuti prosedur
yang baik. Pertama, kurun waktu
untuk menyusun tes relatif singkat, padahal tes itu harus segera digunakan.
Sebenarnya perlu waktu yang cukup lama untuk bisa menghasilkan tes yang baik.
Kedua, kompetensi guru untuk mampu menyusun tes yang baik masih dirasa
terbatas. Keterbatasan kompetensi ini mungkin lebih disebabkan kurangnya
referensi yang dapat digunakan oleh guru dalam mengembangkan tes yang baik.
Ketiga, kurangnya pengalaman untuk menyusun tes. Pengalaman merupakan ‘guru’
yang paling baik. Dengan pengalamannya, guru akan banyak belajar bagaimana
menyusun tes yang mempunyai validitas dan reliabilitas yang tinggi.
B. Rumusan
Masalah
Berdasarkan latar belakang yang ada, adapun rumusan
masalahnya adalah sebagai berikut:
1.
Apakah
validitas tes hasil belajar?
2.
Apakah
reliabilitas tes hasil belajar?
3.
Bagaimanakah pengujian
validitas tes hasil belajar?
4.
Bagaimanakah
pengujian reliabilitas tes hasil belajar?
C. Tujuan
Berdasarkan rumusan masalah yang ada, adapun tujuan penulisan makalah ini
adalah sebagai berikut:
1.
Mengetahui pengertian
dan maksud validitas tes hasil belajar.
2.
Mengetahui pengertian
dan maksud reliabilitas tes hasil belajar.
3.
Mengetahui prosedural
pengujian validitas tes hasil belajar.
4.
Mengetahui
prosedural pengujian reliabilitas tes hasil belajar.
D. Manfaat
Berdasarkan
tujuan penulisan, makalah ini diharapkan dapat memberikan manfaat antara lain:
a) Menambah
pengetahuan, pemahaman, dan wawasan secara umum yang berkaitan dengan pengujian
validitas tes hasil belajar.
b) Menambah
pengetahuan, pemahaman, dan wawasan secara umum yang berkaitan dengan pengujian
reliabilitas tes hasil belajar.
c) Memberikan
informasi tentang pentingnya pengujian validiatas tes dan reliabilitas hasil
belajar pada pembelajaran.
BAB
II
PEMBAHASAN
A. Pengujian Validitas Tes
dan Validitas Item Tes Hasil Belajar
Sebelum
mulai dengan penjelasan perlu kiranya dipahami terlebih dahulu perbedaan arti
istilah “validitas” dengan “valid”. Validitas merupakan sebuah kata benda,
sedangkan valid merupakan kata sifat. Dari pengalaman sehari-hari tidak sedikit
siswa atau guru mengatakan: “ Tes ini baik karena sudah validitas”, jelas
kalimat tersebut tidak tepat. Yang benar adalah: “ Tes ini sudah baik karena
sudah valid” atau “Tes ini baik karena memiliki validitas yang tinggi”. Dalam
pembicaraan evaluasi pada umumnya orang banyak mengenal istilah “valid” untuk
alat evaluasi atau instrument evaluasi. Hingga saat ini belum banyak buku yang
menerapkan istilah “valid” untuk data. Dalam buku ini dicoba menjelaskan asal
pengertian valid untuk instrument dimulai dari pengertian “Valid” untuk data.
Sebuah
data atau informasi dapat dikatakan valid apabila sesuai dengan data yang
sebenarnya. Sebagai contoh, informasi tentang seorang bernama A menyebutkan
bahwa si A pendek karena tingginya tidak lebih dari 140 sentimeter. Data
tentang A ini dikatakan valid apabila memang sesuai dengan kenyataan, yakni
bahwa tinggi A kurang dari 140 sentimeter. Contoh lain data B yang diperoleh
dari cerita orang lain menunjukkan bahwa ia pembohong. Bukti bahwa si B
pembohong diperoleh dari kenyataan bahwa si B sering berbicara tidak benar,
tidak sesuai dengan kenyataan.
Dengan
demikian maka data tentang B tersebut valid dan cerita orang tersebut benar.
Jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan
bahwa instrument tersebut valid, karena dapat memberikan gambaran tentang data
secara benar sesuai dengan kenyataan atau keadaan sesungguhnya. Dari sedikit
uraian dan contoh tersebut dapat disimpulkan bahwa: Jika data yang dihasilkan
oleh instrument benar dan valid, sesuai kenyataan, maka instrument yang
digunakan tersebut juga valid. Sebuah tes disebut valid apabilates itu dapat
tepat mengukur apa yang hendak diukur.
Istilah
“valid”, sangat sukar dicari gantinya. Ada istilah baru yang mulai
diperkenalkan, yaitu sahih sehingga validitas diganti menjadi kesahihan.
Walaupun istilah “tepat” belum dapat mencangkup semua arti yang tersirat dalam
kata “valid”, dan kata “tepat” kadang-kadang digunakan dalam konteks yang lain,
akan tetapi tambahan kata “tepat” dalam menerapkan kata “valid” dapat
memperjelas apa yang dimaksud.
A.
Teknik
Pengujian Validitas Tes Hasil Belajar
Teknik
pengujian validitas tes hasil belajar terdiri atas dua, yaitu pengujian secara
rasional dan pengujian secara empirik.
1) Pengujian
Validitas Tes Secara Rasional
Pengujian
validitas tes hasil belajar secara rasional merupakan sebuah tes dimana ketika
dilakukan penganalisisan secara rasional ternyata memiliki daya ketepatan dalam
pengukuran. Validitas rasional diperoleh atas dasar pemikiran yang kritis dan
berpikir secara logis. Validitas rasional adalah validitas yang diperoleh atas
dasar hasil pemikiran, validitas yang diperoleh dengan berfikir secara logis.
Dengan demikian maka suatu tes hasil belajar dapat dikatakan telah memiliki
validitas rasional, apabila setelah dilakukan penganalisisan secara rasional
ternyata bahwa tes hasil belajar memang (secara rasional) dengan tepat telah
dapat mengukur apa yang seharusnya diukur. Validitas rasional dapat ditelusuri
dari dua segi yaitu dari segi isinya (content) dan susunannya (construct).
a. Validitas
isi
Validitas
isi merupakan validitas yang diperoleh setelah penganalisisan terhadap isi yang
terkandung dalam tes hasil belajar. Validitas isi sering disebut validitas
kurikuler karena materi yang diajarkan pada umumnya tertuang pada GBPP.
Validitas isi dapat diketahui dengan membandingkan isi yang terkandung dalam
tes hasil belajar dengan tujuan instruksional khusus yang telah ditentukan.
Selain membandingkan, validitas isi juga dapat diketahui dengan cara
melaksanakan diskusi panel. Para pakar diminta untuk memberikan pendapat dan
rekomendasinya terhadap isi tes hasil belajar. Penganalisisan validitas isi
dapat dilakukan sebelum maupun sesudah tes dilaksanakan.
b. Validitas
Konstruksi
Sebuah
tes dikatakan memiliki validitas konstuksi apabila butir-butir soal yang
membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan
oleh Tujuan Intruksional Khusus. Dengan kata lain jika butir-butir soal
mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang
menjadi tujuan intruksional. Sebagai contoh jika rumusan Tujuan Intruksional
Khusus (TIK) “siswa dapat membandingkan antara efek biologis dan efek
psikologis”, maka butir soal pada tes merupakan perintah agar siswa membedakan
antara dua efek tersebut. Sekarang TIK dikenal dengan Indikator.
“Konstruksi”
dalam pengertian ini bukanlah “susunan” seperti yang sering dijumpai dalam
teknik, tetapi merupakan rekaan yang dibuat oleh para ahli Ilmu Jiwa yamg
dengan suatu cara tertentu “memperinci” isi jiwa atas beberapa aspek seperti:
Ingatan (pengetahuan), pemahaman, aplikasi, dan seterusnya. Dalam hal ini,
mereka menganggap seolah-olah jiwa dapat dibagi-bagi, tetapi sebenarnya tidak
demikian. Pembagian ini hanya merupakan tindakan sementara untuk mempermudah
mempelajari. Seperti halnya validitas isi, validitas konstruksi dapat diketahui
dengan ccara memperinci dan memasangkan setiap butir soal dengan setiap aspek
dalam indikator. Pengerjaannya dilakukannberdasarkan logika, bukan pengalaman.
Dalam
pembicaraan mengenai penyusunan tes hal ini akan disinggng lagi Validitas
konstruksi merupakan validitas yang diperoleh dengan cara melihat tes hasil
belajar dari segi susunan atau kerangkanya. Tes dikatakan valid apabila tes
tersebut sudah mencerminkan suatu konstruksi dalam teori psikologis. Konstruksi
dalam teori psikologis (penjelasan dari beberapa ahli psikologis) meliputi tiga
ranah yaitu kognitif, afektif, dan psikomotor. Tes akan dianggap valid apabila
butir-butir soal yang membangun tes tersebut telah minimal dapat mengukur
ketiga ranah tersebut. Validitas konstruksi juga dapat diketahui dengan
menyelenggarakan diskusi panel. Validitas isi dapat dilakukan sebelum atau
sesudah pelaksanaan tes.
2) Pengujian
Validitas Tes Secara Empiris
Istilah
“validitas empiris” memuat kata “empiris” yang artinya “pengalaman”. Sebuah
instrument dapat dikatakan memiliki validitas empiris apabila sudah diuji dari
pengalaman. Sebagai contoh sehari-hari seseorang dapat diakui jujur oleh
masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Pengujian validitas tes hasil belajar secara
empiris merupakan sebuah tes dimana validitas tes didapatkan atau bersumber
dari pengamatan langsung di lapangan. Tes hasil belajar dikatakan memiliki
validitas empiris apabila analisis terhadap data yang didapatkan dengan
pengamatan di lapangan dapat diukur tanpa adanya pelaksanaan tes kembali.
Validitas tes secara empiris dapat ditelusuri dari dua segi, yaitu dari segi
daya ketepatan ramalan dan daya ketepatan bandingan.
a. Validitas
Ramalan
Validitas
ramalan dari sebuah tes merupakan suatu kondisi yang menunjukkan sejau mana
sebuah tes dapat menunjukkan kemampuannya untuk memberikan ramalan terhadap
kondisi yang akan terjadi pada masa yang akan datang. Misalnya, tes masuk
Perguruan Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan
keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan dating. Calon
yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya
kemampuan mengikuti kuliah. Jika nilai tesnya tinggi, tentu menjamin
keberhasilannya kelak. Sebaliknya, seorang calon dikatakan tidak lulus tes
karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu
menikuti perkuliahan yang akan dating. Sebuah tes dikatakan memiliki validitas
ramalan apabila terdapat korelasi yang positif dan signifikan antara tes hasil
belajar yang sedang diuji dengan kriterium yang ada. Korelasi tersebut dapat
diketahui dengan menggunakan teknik analisis korelasi product moment dari Karl
Pearson.
b. Validitas
Bandingan
Validitas
bandingan merupakan suatu cara yang dilakukan untuk mendapatkan validitas tes
hasil belajar dengan cara membandingkan. Sebuah tes dapat dikatakan memiliki
validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dapat
menunjukkan hubungan searah antara tes pertama dengan tes berikutnya. Validitas
bandingan ditinjau dari pengukur lain yang dijadikan kriterium.
Untuk
mengetahui ada tidaknya hubungan yang searah antara tes pertma dengan tes
berikutnya dapat digunakan teknik analisis korelasi p r o d u c t m o m e n t
dari Karl Pearson. Yang dimaksud searah adalah jika tes tersebut bernilai
positif dan signifikan. Validitas hasil belajar tidak terlepas dari berbagai
pengaruh. Salah satu yang berpengaruh dalam kevaliditasan dari tes hasil
belajar adalah dari item tes hasil belajar itu sendiri. Validitas item adalah
ketepatan mengukur yang dimiliki oleh sebutir item dalam sebuah tes hasil
belajar. Setiam butir item merupakan bagian yang tak terpisahkan dari tes hasil
belajar (suatu totalitas). Semakin banyak item yang dapat dijawab, maka skor
tes hasil belajar semakin tinggi, begitu pula sebaliknya. Validitas tes akan sangat
dipengaruhi oleh validitas item. Validitas dari masing-masing butir item yang
membangun sebuah tes, akan dapat diketahui besar kecilnya dukungan yang
diberikan oleh masingmasing butir item terhadap tes hasil belajar.
B.
Cara Mengetahui Validitas Alat Ukur
Tes dikatakan memiliki validitas jika
hasilnya sesuai dengan kriterium, dalam artimemiliki kesejajaran antara hasil
tes tersebut dengan kriterium. Teknik yangdigunakan untuk mengetahui
kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh
Pearson. Rumus kolerasi p r o d u c t m o m e n t ada 2 (dua) macam,
yaitu: Kolerasi Product moment dengan
simpangan, dan Kolerasi Product moment dengan angka kasar.
Rumus korelasi product momet dengan
simpangan:
rxy =
Dimana:
rxy = koefisen korelasi antara variabel x dan variabel y, dua
variabel yang dikorelasikan (x = x-x dan y = y-y)
y² =
kuadrat dari x
x² =
kuadrat dari y
Rumus korelasi dengan product momet
angka kasar:
rxy =
r xy =
koefisien kolerasi antara variabel X dan Variabel Y, dua variabel yang
dikolerasikan .
Table
01. Skor Skala Sikap terhadap Mata Kuliah Statistik
TESTEE
|
NOMOR
BUTIR SOAL
|
TOTAL
SKOR
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
|
A
|
2
|
5
|
4
|
3
|
4
|
5
|
4
|
4
|
5
|
3
|
39
|
B
|
4
|
5
|
5
|
3
|
4
|
4
|
3
|
5
|
5
|
4
|
42
|
C
|
2
|
3
|
4
|
2
|
3
|
3
|
4
|
3
|
4
|
4
|
32
|
D
|
2
|
3
|
4
|
3
|
3
|
3
|
3
|
3
|
3
|
3
|
30
|
E
|
3
|
4
|
5
|
3
|
4
|
4
|
3
|
4
|
3
|
4
|
37
|
F
|
1
|
2
|
3
|
2
|
1
|
2
|
1
|
2
|
3
|
2
|
19
|
G
|
1
|
3
|
4
|
2
|
1
|
3
|
2
|
2
|
3
|
2
|
23
|
Tabel
02. Cara Menghitung Skor Butir 6 dengan Skor Total
RESPONDEN
|
X
|
Y
|
XY
|
X²
|
Y²
|
A
|
5
|
39
|
195
|
25
|
1521
|
B
|
4
|
42
|
168
|
16
|
1764
|
C
|
3
|
32
|
96
|
9
|
1024
|
D
|
3
|
30
|
90
|
9
|
900
|
E
|
4
|
37
|
148
|
16
|
1369
|
F
|
2
|
19
|
38
|
4
|
361
|
G
|
3
|
23
|
69
|
9
|
529
|
TOTAL
|
24
|
222
|
804
|
88
|
7468
|
rxy
=
rxy
=
rxy
=
rxy
=
rxy
=
rxy
=
rxy
= 0,867
Jadi
korelasi skor butir 6 dengan skor total adalah 0,867.
C.
Teknik
Pengujian Validitas Item Tes Hasil Belajar
Apa yang sudah dibicarakan di atas adalah
validitas soal secara keseluruhan tes. Disamping mencari validitas soal perlu
juga dicari validitas item. Jika seorang peneliti atau seorang guru mengetahui
bahwa validitas soal tes misalnya terlalu rendah dan rendah saja, maka
selanjutnya ingin mengetahui butir-butir tes manakah yang menyebabkan soal
secara keseluruhan tersebut jelek karena memiliki validitas rendah. Untuk
kepentingan inilah dicari validitas butir soal. Pengertian umum untuk validitas
item adalah demikian sebuah item dikatakan valid apabila mempunyai dukungan
yang besar terhadap skor total. Skor pada item menyebabkan skor total menjadi
tinggi atau rendah. Dengan kata lain
dapat dikemukakan di sini bahwa item memiliki validitas yang tinggi jika
skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini dapat
diartikan dengan kolerasi sehingga untuk mengetahui validitas item digunakan
rumus kiolerasi seperti sudah diterangkan di atas.
Sebutir item dapat dikatakan valid
apabila skor-skor pada butir item yang bersangkutan memiliki kesesuaian dengan
skor totalnya. Skor total merupakan variabel terikat dan skor item merupakan
variabel bebas. Teknik analisis yang digunakan untuk menguji sebuah item valid
atau tidak yaitu teknik korelasi. Sebuah item dapat dinyatakan valid apabila
memiliki korelasi positif dan signifikan dengan skor totalnya.
1. Pengertian
validitas item
Validitas
item dari sebuah tes adalah ketepatan mengukur yang dimiliki oleh sebutir item
(yang merupakan bagian yang tak terpisahkan dari tes bagian suatu totalitas),
dalam mengukur apa yang seharusnya diukur lewat butir item tersebut. Apabila
kita mau memperhatikan secara cermat, maka tes-tes hasil belajar yang dibuat
akan disusun oleh para pengajar, baik guru, dosen staf pengajar lainnya,
sebenarnya adalah merupakan kumpulan dari sekian banyak butir-butir item;
dengan item mana para penyusun tes ingin mengukur atau mengungkap hasil belajar
yang telah dicapai oleh masing-masing individu peserta didik, setelah mereka
mengikuti proses pembelajaran dalam jangka waktu tertentu.
Pernyataan
itu mengandung makna, bahwa sebenarnya setiap butir item yang ada dalam tes
hasil belajar itu adalah bagian tak terpisahkan dari tes hasil belajar tersebut
sebagai totalitas. Erat hubungannya antara butir item dengan tes hasil belajar
sebagai suatu totalitas itu kiranya dapat dipahami dari kenyataan, bahwa
semakin banyak butirbutir item yang dapat dijawab dengan betul oleh testee,
maka skor-skor total hasil tes tersebut akan semakin tinggi. Sebaliknya,
semakin sedikit butir-butir item yang dapat dijawab dengan betul oleh testee,
maka skor-skor total hasil tes itu akan semakin rendah atau semakin
menurun.
2. Teknik
Pengujian Validitas Item Tes Hasil Belajar
Berdasarkan
uraian diatas maka cukup jelas bahwa sebutir item dapat dikatakan telah
memiliki validitas tinggi atau dapat dinyatakan valid, jika skor-skor pada
butir item yang bersangkutan memiliki kesesuaian atau kesejajaran arah dengan
skor totalnya, skor total disini berkedudukan sebagai variable terikat
sedangkan variable item merupakan variable bebasnya. Kalau demikian, maka untuk
sampai pada kesimpulan bahwa item-item yang ingin diketahui validitasnya, yaitu
valid ataukah tidak, kita dapat menggunakan teknik kolerasi sebagai teknik
analisisnya.
Sebutir
item dapat dinyatakan valid apabila skor item yang bersangkutan terbuktimempunyai
kolerasi positif yang signifikan dengan skor totalnya. Permasalahannya adalah
bagaimana Memilih dan menentukan jenis tekhnik dalam rangka menguji validitas
item itu. Seperti yang diketahui pada tes objektif maka hanya ada dua
kemungkinan yaitu betul atau salah. Setiap butir soal yang dapat dijawab dengan
benar diberikan skor 1 ( satu ) sedangkan untuk setiap jawaban yang salah
diberikan skor 0 ( nol ) jenis data seperti ini biasanya merupakan tes benar –
salah, ya – tidak dan sejenisnya dalam ilmu statistic dikenal dengan disket
murni atau data dikotomik. Sedangkan, skor total yang dimiliki oleh
masing-masing testee adalah merupakan penjumlahan dari setiap skor itu
merupakan data kontinyu.
Berdasarkan
teori yang ada apabila variable 1 berupa data dikotomik sedangkan variable II
data kontinyu maka, teknik korelasi yang tepat untuk digunakan dalam mencari
korelasi dua variable adalah teknik korelasi point biserial, diman angka indeks
korelasi diberi lambang rpbi dapat diperoleh dengan rumus :
Rpbi
=
Dimana:
Rpbi
= koefisien korelasi point berserial yang melambangkan kekuatan korelasi antara variable I dan II yang dalam
hal ini sebagai koefisien validitas item.
Mp =
skor rata-rata hitung yang dimiliki oleh testee. Mt =
skor rata-rata dari skor total.
SDt =
standar deviasi dari skor total.
p =
proporsi testee yang menjawab denagn benar terhadap butir item yang
diuji validitasnya.
q = proporsi testee yang menjawab salah
terhadap butir item yang diuji validitasnya
Table
03. Cara menghitung Validitas Butir Instrumen dengan
Korelasi
Point Biserial
Testee
|
Nomor butir soal
|
Skor total
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
A
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
8
|
B
|
0
|
0
|
1
|
0
|
1
|
0
|
0
|
1
|
1
|
1
|
5
|
C
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
4
|
D
|
1
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
5
|
E
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
6
|
F
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
0
|
0
|
4
|
G
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
7
|
H
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
8
|
I
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
6
|
J
|
1
|
1
|
0
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
7
|
Misalnya
diuji Validitas Butir Soal no 6, maka perhitungannya sebagai berikut
1)
Mp = (8+4+5+6+7+8+6+7) : 8 = 51 : 8
= 6,375
2) Mt = (8+5+4+5+6+4+7+8+6+7) : 10 = 60 :10 =
6
3) Si
=
=
=
=
=
4) p = 8 :
10 = 0,8
5) q = 2 :10 = 0,2 atau (1 – 0,8) = 0,2
6) Masukan
ke dalam rumus:
Rpbi
=
=
=
= 0,252 x 2
= 0,504
B.
Pengujian Reliabilitas Tes Hasil
Belajar
Kata reliabilitas dalam bahasa Indonesia diambil
dari kata reliability dalam bahasa
Inggris yang berasal dari kata asal reliable
yang memiliki arti dapat dipercaya. Suatu tes dapat dikatakan memiliki taraf
reliabilitas yang tinggi jika tes tersebut diujikan dalam kurun waktu yang
berbeda dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes
berhubungan dengan masalah ketetapan hasil tes.
Konsep reliabilitas ini tidak akan sulit dimengerti
apabila telah memahami konsep validitas. Tuntutan bahwa instrumen evaluasi
harus valid menyangkut harapan diperolehnya data yang valid atau sesuai dengan
kenyataan. Sedangkan reliabilitas tuntutannya tidak jauh berbeda. Jika
validitas terkait dengan ketepatan objek yang tidak lain adalah tidak
menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar. Maka dari
itu konsep reliabilitas terkait dengan pemotretan berkali-kali. Instrumen yang
baik adalah instrumen yang dapat dengan tetap memberikan data yang sesuai
dengan kenyataan.
Lebih lanjut yang dimaksud reliabilitas adalah
sebagai berikut.
a)
Sejauh
mana hasil pengukuran dapat dipercaya,
b)
Sejauh
mana hasil pengukuran dapat dipercaya bila dilakukan pengukuran pada waktu yang
berbeda pada kelompok subjek yang sama diperoleh hasil yang relatif sama
asalkan aspek yang diukur dalam diri subjek memang belum berubah,
c)
Tinggi/rendahnya
reliabilitas secara empirik ditunjukkan oleh suatu angka yang disebut nilai
koefisien reliabilitas,
d)
Reliabilitas
yang tinggi ditunjukkan dengan nilai 1.00, reliabilitas yang dianggap sudah
cukup memuaskan atau tinggi adalah ≥ 0.70.
a. Teknik
Pengujian Reliabilitas Tes Hasil Belajar Bentuk Uraian
Dalam menentukan
apakah tes belajar bentuk uraian yang disusun sudah memiliki daya ketetapan
atau reriabilitas yang tinggi ataukah belum, digunakan sebuah rumus yang
dikenal dengan Rumus Alpha.
r11=
Dimana:
r11
= koefisien reliabilitas tes.
n
= Banyaknya butir item yang dikeluarkan dalam tes.
1
=
Bilangan Konstan.
Misalkan
tes uraian yang akan ditentukan reliabilitasnya berdiri atas 5 item.
Rumus
=
1 +
2 +
3 +
4 +
5
Contoh
Soal:
Langkah
pertama :Menjumlahkan skor masing-masing testee ΣXi1, ΣXi2, ΣXi3, ΣXi4, dan
ΣXi5, mencari skor total
yang dicapai ( Xt ) serta
mencari kuadrat dari skor total ( Xt²
).
Tabel 0.4
Tabel
analisis dalam rangka mencari skor total untuk masing-masing butir item, skor
total dan kuadrat skor total dari masing-masing testee.
Testee
|
Skor
Untuk Item Butir Nomor
|
Xt
|
Xt²
|
||||
1
|
2
|
3
|
4
|
5
|
|||
A
|
8
|
6
|
7
|
7
|
6
|
34
|
1156
|
B
|
7
|
6
|
7
|
5
|
6
|
30
|
900
|
C
|
4
|
4
|
3
|
5
|
4
|
20
|
400
|
D
|
6
|
5
|
5
|
5
|
6
|
27
|
729
|
E
|
5
|
5
|
4
|
5
|
4
|
23
|
529
|
5
= N
|
30
ΣXi1
|
26
ΣXi2
|
25
ΣXi3
|
27
ΣXi4
|
26
ΣXi5
|
134=
ΣXt
|
3714=
Xt²
|
Langkah
kedua: mencari jumlah kuadrat item
Jkitem1 : 8² + 7² + 4²
+ 6² + 5² = 190
Jkitem2 : 6² + 6² + 4²
+ 5² + 5² =
138
Jkitem3 : 7² + 7² + 3²
+ 5² + 4² =
135
Jkitem4 : 7² + 5² + 5²
+ 5² + 5² =
149
Jkitem5 : 6² + 6² + 4²
+ 6² + 4² =
140
Langkah
ketiga: mencari varian skor
St²1
=
=
St²2
=
=
St²3
=
=
St²4
=
=
St²5
=
=
Langkah
keempat: mencari jumlah varian skor item secara keseluruhan
∑ St² = St²1 + St²2 + St²3 + St²4 + St²5
∑ St² = 2,00 + 0,56
+ 2,00 + 0,64 + 0,96 = 6,16
Langkah
kelima: mencari varian total (St²)
St²
=
=
=
Langkah keenam: Mencari koefisien
reliabilitas tes
r11 =
r11
=
=
(1,25) (1 - 0,251) = 1,25 x
0,749 = 0,93625 = 0,94
Selanjutnya
dalam pemberian interpretasi terhadap koefisien reliabilitas tes (r11) pada umumnya digunakan patokan sebagai berikut:
1.
Apabila
r11 ≥ 0,70 maka tes hasil
belajar memiliki reliabilitas tinggi (riliable).
2.
Apabila
r11 ≤ 0,70 maka tes hasil
belajar belum memiliki reliabilitas tinggi (un-riliable).
3.
Jadi ≥ 0,70 maka tes hasil belajarn pada contoh di
atas memiliki relibilitas tinggi (reliable).
b. Teknik
Pengujian Reliabilitas Tes Hasil Belajar Bentuk Obyektif
1.
Pengujian
realibilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan single test – single trial.
Single
test – single trial merupakan
pendekatan “serba single” atau “serba
satu”, yaitu satu kelompok subyek, satu jenis alat pengukur atau satu kelompok
testee, dan satu kali testing. Ada 5 jenis formula untuk menentukan
reliabilitas dengan menggunakan single
test- single trial. Pertama, formula Brown, Flanagan, dan Rulon yang dilakukan
dengan “membelah 2” tes (split - half technique).
Namun Formula Kuder-Richardsen dan C. Hoyt tidak menggunakan teknik belah dua.
Formula Spearman Brown didasarkan
pada korelasi, yaitu korelasi antara separoh belahan pertama dengan separoh
belahan kedua dari tes. Sedangkan Formula Flanagan didasarkan pada deviasi (selisih skor dengan mean
totalnya, yaitu x = X - Mx.
Kedua, formula Rullon
didasarkan pada selisih skor yang dimiliki oleh belahan pertama dengan
belahan kedua dari tes yang dilambangkan: d =(X–Y), dimana d = difference. Ketiga, formula Kuder-Richardsen dilakukan dengan
menganalisis skor-skor item tes hasil belajar. Sedangkan formula C. Hyot,
sasarannya adalah interaksi antar testee dengan
item tes hasil belajar. Teknik analisis tesebut adalah Teknik Analisis Varian
(ANAVA).
a.
Pendekatan
Single Test-Single Trial dengan Formula Spearman
Brown.
Penentuan reliabilitas tes hasil belajar bentuk
obyektif dengan menggunakan formula spearman-brown
dikenal dengan istilah teknik belah dua (split
half technique). Hal itu dikarenakan dalam penentuan reliabilitas tes,
penganalisisannya dilakukan dengan jalan membelah dua butir-butir soal tes
menjadi dua bagian yang sama, sehingga masing-masing testee memiliki dua macam
skor. Untuk mengetahui reliabilitas tes secara keseluruhan spearman-brown menciptakan formula sebagai berikut.
rtt =
keterangan:
rtt =
koefisien reliabilitas tes secara total (tt = total tes)
rhh =
Koefisien kolerasi product moment antara separuh tes pertama dan separuh tes
kedua (hh = half-half).
1
& 2 = bilangan konstan
1)
Pendekatan
Single Test-Single Trial Dengan Menggunakan Formula Spearman-Brown Model Gasal
Genap.
Langkah-langkah
yang perlu ditempuh dalam penentuan reliabilitas tes dengan pendekatan single test-single trial dengan
menggunakan formula spearman brown
model gasal genap adalah sebagai berikut.
·
Menjumlahkan
skor-skor dari butir-butir item yang bernomor gasal yang dimiliki oleh
masing-masing individu testee.
·
Menjumlahkan
skor-skor dari butir-butir item yang benomor genap yang dimiliki oleh
masing-masing individu testee.
·
Mencari
(menghitung) koefisien kolerasi “r” product mement (rxy = rhh
= ).
·
Dalam
hal ini jumlah skor-skor dari butir-butir item yang bernomor gasal kita anggap
sebagai variabel X, sedangkan jumlah skor-skor dari butir-butir item yang
bernomor genap kita anggap variabel Y, dengan menggunakan rumus:
rtt = rhh =
=
·
Mencari
(menghitung) koefisien reliabilitas tes
r11
= rtt =
·
Memberikan
interprestasi terhadap r11 .
2)
Pendekatan
Single Test-Single Trial Dengan
Menggunakan Formula Spearman-Brown
Model Belahan Kiri dan Kanan.
Langkah-langkah yang perlu ditempuh dalam penentuan
reliabilitas tes dengan pendekatan single
test single trial dengan menggunakan formula spearman brown model belahan kiri dan kanan adalah sebagai berikut.
·
Menjumlahkan
skor-skor dari butir-butir item yang terletak diseparuh bagian kiri yang
dimiliki oleh masing-masing individu testee.
·
Menjumlahkan
skor-skor dari butir-butir item yang terletak diseparuh bagian kanan yang
dimiliki oleh masing-masing individu testee.
·
Mencari
(menghitung) koefisien kolerasi “r” product mement (rxy = rhh =
). Dalam hal ini jumlah skor-skor dari
butir-butir item yang terletak diseparuh bagian kiri kita anggap sebagai
variabel X, sedangkan jumlah skor-skor dari butir-butir item yang terletak
diseparuh bagian kanan kita anggap variabel Y, dengan menggunakan rumus:
rtt = rhh =
=
·
Mencari
(menghitung) koefisen reliabilitas tes (r11 = rtt) dengan
menggunakan rumus:
r11 = rtt =
·
Memberikan
interprestasi terhadap r11.
b.
Pendekatan
single test-single trial dengan menggunakan formula flanagan.
Formula : r11 = 2 (1 –
)
Dimana:
r11 =
koefisien reliabilitas secara total
2
& 1 = bilangan konstan
St² =
jumlah varian total dari skor hasil tes belahan I dan II
Rumus:
St² =
1) Pendekatan
dengan menggunakan formula Flanagan dengan enerapkan model gasal genap
Langkah 1. Menghitung
kuadrat dari devisi X (∑x²), Y (∑y²)
dan jumlah kuadrat dari devisi total X dan Y (∑(x + y)²).
Langkah-langkah
perhitungan dalam tabel:
· Menjumlahkan
skor variable X dan Y
· Mencari
mean X dan Y: Mx =
, My =
· Mencari
deviasi skor Xdan Y: x = X - Mx , y = Y- My
∑x
maupun ∑y = 0.
· Menguadratkan
deviasi x(x²) dan y(y²)
· Mencari
jumlah (x+y) dan dikuadratkan (x+y)²
Langkah
2. Menghitung varian skor item gasal dan genap dengan rumus:
r11 = 2(1 -
)
Terdapaat
cara yang lebih efisien menurut Flanagan tanpa menghitung mean dan deviasi:
Pertama,
mencari ∑y² = ∑Y² -
Kedua,
mencari ∑(x+y)² = ∑xt² -
lalu mencari S1².
2) Pendektan
dengan menggunakan formula flanagan dengan menerapkan model kiri-kanan
Langkah 1. Menghitung kuadrat dari
deviasi X (∑x²), Y (∑y²) dan jumlah kuadrat dari deviasi
total X dan Y (∑(x + y)².
Langkah-langkah perhitungan tabel:
·
Menjumlahkan skor
variable X dan Y
·
Mencari mean X dan Y:
Mx=
, My =
.
∑x
maupun ∑y = 0.
·
Mengkuadratkan deviasi
X(x²) dan Y(y²)
·
Mencari jumlah (x+y)
dan dikuadratkan (x+y)².
Langkah
2. Menghitung variann skor item kiri dan kanan
Rumus:
S1²
=
dan S2² =
Langkah
3. Mencari varian total : St² =
Langkah
4. Mencari koefisien reliabilitas (r11) lalu memberikan
interpretasi.
r11
= r11 = 2 (1 –
)
terdapat cara yang
lebih efisien menurut Flanagan tanpa menghitung mean dan deviasi:
pertama. Mencari ∑x²
dan ∑y² : ∑x² = ∑Y² -
dan
∑y² = ∑Y² -
Kedua.
Mencari ∑(x + y)² = ∑xt² -
lalu mencari S1², S2² dan r11
c. Pendekatan
single tes-single trial dengan
formula Rulon
Rumus r11 = 1 -
,
dimana S²d = varian perbedaan
testee belahan I dan II
Langkah-langkah :
Ø Menghitung
d = (X-Y), menjumlahkan d= ∑𝘥 lalu mengkuadratkan ∑𝘥²
Ø Menghitung jumlah kuadrat perbedaan (∑x2d
) dan mencari varian perbedaan (S²d ) skor belahan I
dan II ∑x²d = ∑d² -
lalu S²d =
Ø Mencari
skor total Xt = (X+Y) lalu dijumlahkan Xt = ∑Xt.
Ø Mengkuadratkan
X²t dan menjumlahkan menjadi ∑x2t
Ø Mencari
x2t = ∑x²t -
lalu mencari S²t =
Ø Lalu
mencari koefisien reliabilitas :
r11
= 1 -
pendekatan formula
rulon dengan menggunakan model gasal-genap dan berlahan kiri-kanan menggunakan
formula yang sama hanya membedakan skor item yang dipilih.
d. Pendekatan
single tes-single trial dengan formula Kuder-Richardsen
Formula Kuder-Richardsen
yaitu KR20 dan KR21
KR20 = (
) (
)
Dimana :
N = banyaknya butir item
Pi =
proporsi testee yang menjawab dengan betul butir item tersebut
Qi = proporsi
testee yang menjawab salah, qi = 1- pi
∑piqi
= Jumlah hasil perkalian pi
dan qi.
KR21
= (
) (1 - (
)
Dimana:
Mt
: mean total (rata-rata hitung dari skor total)
KR20 dalam
peritungannya lebih teliti namun perhitunannya lebih rumit. Sedangkan KR21
perhitungannya lebih sederhana namun kurang teliti.
1) Pendekatan
formula kuderRichardsen dengan rumus KR20.
Langkah-langkah
· Mencari
=
namun sebelumnya mancari
=
-
(
· Telah
mengetahui n,
, ∑p1q1.
Akhirnya
mencari r11 = (
) (
)
2) Pendekatan
formula kuder-Richardsen dengan Rumus KR21.
Langkah-langkah:
Pertama mencari Mt
=
setelah diketahui
Xt
dan N
Kedua substitusikan ke
dalam rumus KR21:
r11 = (
) (1 - (
).
e. Pendekatan
single tes-single trial dengan formula C.Hyot.
Keistimewaan dari
teknik ANAVA:
1) Bisa
digunakan selain single test single trial. Misalnya test retest atau alternate
form
2) Bisa
digunakan bila skor-skor hasil tesnya dikotomik tidak hanya dikotomi (betul
skor 1 sedangkan salah skor 0).
3) Rumus:
r11 = 1-
Dimana: MKӪ :
mean kuadrat interaksi antara testee dan item
MK2 : mean
kuadrat antar subyek
Langkah-langkah:
·
Menjumahkan skor-skor
jawaban yang betul lalu menjumlahkan Xt sehingga memperoleh ∑X.
·
Menghitung jumlah
kuadrat total (JKtot).
·
Menghitung ∑X²t. Caranya
mengkuadratkan semua skor hasil tes dari kiri kekanan tabel sampai habis.
·
Jumlah subyeknya adalah
banyaknya siswa x yang item
·
Mencari JKtot
= ∑X²t.-
dengan diketahui ∑X²t,
∑Xt dan N
·
Mengkuadrat jawaban
yang betul, misalkan item/soal nomor 1 yang dijawab betl adalah 15 testee.
Setelah itu membagi masing-masing dengan jumlah testee. Misalkan jumlah testee
adalah 20 orang. Setelah dibagi, jumlahnya lalu kurangi dengan
.
Hasilnya merupakan Jkant.item.
·
Mengkuadratkan skor
yang dicappai masing-masing siswa lalu dibagi dengan jumlah soal. Misalkan skor
yang dicapai adalah 16 dan jumlah soal adalah 20. Jumlahkan semuanya lalu
kurangi dengan
·
Hasilnya merupakan Jkant.subyek.
·
Mencari jumlah kuadrat
interaksi antar item dengan subyek
Rumus = JKant-s
atau JKe = JKtot = JKant.it – JKant.s
·
Mencari mean kuadrat
antar item dan antar subyek
MKant.item =
Dimana dbant.item =
N1 (jumlah soal/item)-1
MKant.subyek
atau MKs =
dimana dbant.subyek = N₂ (junlah
siswa/testee)-1.
·
Mencari mean kuadrat
interaksi antar item dengan subyek
MKant.i-s atau MKe =
dimana dbant.i-s = dbant.it
x dbant.s.
·
Mencari koefisien
reliabilitas tes: r11 = 1
-
lalu memberikan interpretasi.
2.
Pengujian
realibilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan
test-reetest (single test – double trial).
Dikenal dengan pendekatan bentuk ulangan dimana
tester hanya menggunakan satu seri tes tetapi percobaannya dilakukan dua kali.
Misalkan seorang guru memberikan satu seri tes dalam dua kesempatan. Setelah
tes selesai skor hasil tes pertama dikorelasikan dengan skor hasil tes kedua.
Jika terdapat korelasi positif maka tes hasil belajar dapat dinyatakan reliable
karena skor hasil tes belajar memperlihatkan kestabilan atau keajegan.
Untuk mencari korelasi tersebut terdapat teknik
korelasi rank-order (tata jenjang) dari Spearman:
ρ
= 1-
dimana
ρ = Koefisien korelasi antara variabel I (skor) dan II.
D
= Difference. D= RI - RII,
N = Banyaknya subyek
Langkah-langkah:
·
Merumuskan
hipotesis nihil: “Tidak terdapat korelasi positif yang signifikan antara hasil
tes I daengan hasil tes II
·
Mencari
koefisien korelasi rho: ρ = 1-
·
Memberikan
interpretasi terhadap ρ Melihat nilai
rho dengan menggunakan derajat kebebasan (db) Misalkan N =20 diperoleh ρtabel
pada taraf signifikansi 5% sebesar 0,450. Jika ρobservasi ≥ ρtabel baik pada
taraf 1% maupun 5% hipotesis nihil ditolak. Berarti tes pertama dan kedua
terdapat korelasi posiif yang signifikan.
·
Menarik
kesimpulan. Bahwa tes hasil belajar sudah memiliki reliabilitas yang tinggi
(reliabel). Pengujian ulang tidak hanya sebatas satu kali saja, boleh lebih
sampai penyusun tes sudah yakin dengan keajegan hasil pengukuranya.
3.
Pengujian
realibilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan
alternate form (double test – double
trial).
Mempergunakan dua tes yang diberikan tanpa adanya
tenggang waktu dengan ketentuan tes harus sejenis, mengukur hal yang sama
maupun tingkat kesukaran yang sama. Alasan bahwa pendekatan alternate form
(bentuk pararel) lebih baik daripada pendekatan yang sebelumnya:
a.
Terhindar
dari kemungkinan testee latihan atau menghafal karena butir item yang diberikan
tidak sama
b.
Terhindar
akan timbulnya perbedaan situasi dan kondisi baik yang bersifat sosial maupun
alami.
Apabila
terdapat korelasi positif signifikan maka dapat dikatakan tes tersebut
reliabel. Teknik korelasi yang digunakan antara teknik product moment dari
Pearson atau teknik rank order dari Spearman (khusus untuk N ≤ 30).
rxy =
Langkah-langkah:
·
Merumuskan
hipotesis nihil
·
Menghitung
rxy =
·
Memberikan
interpretasi terhadap rxy atau robservasi. Db = N-nr. Misalkan data 30 berarti
db = 30 – 2 = 28, mencari r tabel. Jika rtabel pada taraf 5% lebih besar
Robservasi maka
hipotesis nihil ditolak. Namun jika rtabel pada taraf 1% lebih kecil daripada
robservasi maka hipotesis nihil disetujui. Jika salah satu hipotesis nihil
disetujui berarti hasil tes belajar memiliki reliabilitas sedang.
BAB III
PENUTUP
A.
Kesimpulan
Validitas merupakan derajat
kemampuan suatu tes yang mengukur apa yang hendak diukur. Secara garis besar ada
dua macam validitas, yaitu validitas logis dan validitas empiris.
Validitas adalah suatu ukuran yang
menunjukan tingkat kevalidan atau kesahihan suatu instrumen. Prinsif validitas
adalah pengukuran atau pengamatan yang berarti prinsif keandalan instrumen
dalam mengumpulkan data. Instrumen harus dapat mengukur apa yang seharusnya
diukur. Jadi validitas lebih menekankan pada alat pengukuran atau pengamatan.
Uji validitas adalah suatu
langkah pengujian yang dilakukan terhadap isi (content) dari suatu
instrumen, dengan tujuan untuk mengukur ketepatan instrumen yang digunakan
dalam suatu penelitian. Untuk menguji validitas setiap butir
soal maka skor-skor yang ada pada butir yang dimaksud dikorelasikan dengan skor
totalnya. Skor tiap butir soal dinyatakan skor X dan skor total dinyatakan sebagai
skor Y, dengan diperolehnya indeks validitas setiap butir soal, dapat diketahui
butir-butir soal manakah yang memenuhi syarat dilihat dari indeks validitasnya
(Arikunto, 1999: 78)
Ada dua cara umum untuk mengukur
reliabilitas, yaitu:
a) Relibilitas
stabilitas.
b) Reliabilitas
ekivalen
B.
Saran
Demikianlah makalah ini kami buat,
semoga apa yang telah disajikan akan memberikan ilmu dan informasi serta manfaat bagi para pembaca.
Setiap Selanjutnya demi kesempurnaan
makalah ini kami mohon saran dan kritik dari
pembaca yang bersifat membangun, guna memperbaiki pembuatan makalah berikutnya.
No comments:
Post a Comment