Tuesday, June 6, 2017

Makalah tentang prosedural pelaksanaan Pengujian Validitas Tes dan Reliabilitas Tes Hasil Belajar.



BAB I
PENDAHULUAN

A.    Latar Belakang
Penilaian pendidikan adalah proses untuk mendapatkan informasi tentang prestasi atau kinerja peserta didik. Hasil penilaian digunakan untuk melakukan evaluasi terhadap ketuntasan belajar peserta didik dan efektivitas proses pembelajaran. Fokus penilaian pendidikan adalah keberhasilan belajar peserta didik dalam mencapai standar kompetensi yang ditentukan. Pada tingkat mata pelajaran, kompetensi yang harus dicapai berupa Standar Kompetensi (SK) mata pelajaran yang selanjutnya dijabarkan dalam Kompetensi Dasar (KD). Untuk tingkat satuan pendidikan, kompetensi yang harus dicapai peserta didik adalah Standar Kompetensi Lulusan (SKL).
Prinsip penilaian mengacu pada standar penilaian pendidikan jenjang pendidikan dasar dan menengah, salah satunya yang paling utama adalah sahih dan reliabel. Sahih, berarti penilaian didasarkan pada data yang mencerminkan kemampuan yang diukur. Oleh karena itu, instrumen yang digunakan perlu disusun melalui prosedur sebagaimana dijelaskan dalam panduan agar memiliki bukti kesahihan dan keandalan.
Ada beberapa alasan penyusun tes sebagai alat ukur kompetensi siswa sering tidak mengikuti prosedur yang baik. Pertama, kurun waktu untuk menyusun tes relatif singkat, padahal tes itu harus segera digunakan. Sebenarnya perlu waktu yang cukup lama untuk bisa menghasilkan tes yang baik. Kedua,  kompetensi guru untuk mampu menyusun tes yang baik masih dirasa terbatas. Keterbatasan kompetensi ini mungkin lebih disebabkan kurangnya referensi yang dapat digunakan oleh guru dalam mengembangkan tes yang baik. Ketiga, kurangnya pengalaman untuk menyusun tes. Pengalaman merupakan ‘guru’ yang paling baik. Dengan pengalamannya, guru akan banyak belajar bagaimana menyusun tes yang mempunyai validitas dan reliabilitas  yang tinggi.
B.     Rumusan Masalah
Berdasarkan latar belakang yang ada, adapun rumusan masalahnya adalah sebagai berikut:
1.      Apakah validitas tes hasil belajar?
2.      Apakah reliabilitas tes hasil belajar?
3.      Bagaimanakah pengujian validitas tes hasil belajar?
4.      Bagaimanakah pengujian reliabilitas tes hasil belajar?

C.    Tujuan
Berdasarkan rumusan masalah yang ada, adapun tujuan penulisan makalah ini adalah sebagai berikut:
1.      Mengetahui pengertian dan maksud validitas tes hasil belajar.
2.      Mengetahui pengertian dan maksud reliabilitas tes hasil belajar.
3.      Mengetahui prosedural pengujian validitas tes hasil belajar.
4.      Mengetahui prosedural pengujian reliabilitas tes hasil belajar. 

D.    Manfaat
Berdasarkan tujuan penulisan, makalah ini diharapkan dapat memberikan manfaat antara lain:
a)      Menambah pengetahuan, pemahaman, dan wawasan secara umum yang berkaitan dengan pengujian validitas tes hasil belajar.
b)      Menambah pengetahuan, pemahaman, dan wawasan secara umum yang berkaitan dengan pengujian reliabilitas tes hasil belajar.
c)      Memberikan informasi tentang pentingnya pengujian validiatas tes dan reliabilitas hasil belajar pada pembelajaran.





BAB II
PEMBAHASAN

A.  Pengujian Validitas Tes dan Validitas Item Tes Hasil Belajar  
Sebelum mulai dengan penjelasan perlu kiranya dipahami terlebih dahulu perbedaan arti istilah “validitas” dengan “valid”. Validitas merupakan sebuah kata benda, sedangkan valid merupakan kata sifat. Dari pengalaman sehari-hari tidak sedikit siswa atau guru mengatakan: “ Tes ini baik karena sudah validitas”, jelas kalimat tersebut tidak tepat. Yang benar adalah: “ Tes ini sudah baik karena sudah valid” atau “Tes ini baik karena memiliki validitas yang tinggi”. Dalam pembicaraan evaluasi pada umumnya orang banyak mengenal istilah “valid” untuk alat evaluasi atau instrument evaluasi. Hingga saat ini belum banyak buku yang menerapkan istilah “valid” untuk data. Dalam buku ini dicoba menjelaskan asal pengertian valid untuk instrument dimulai dari pengertian “Valid” untuk data.
Sebuah data atau informasi dapat dikatakan valid apabila sesuai dengan data yang sebenarnya. Sebagai contoh, informasi tentang seorang bernama A menyebutkan bahwa si A pendek karena tingginya tidak lebih dari 140 sentimeter. Data tentang A ini dikatakan valid apabila memang sesuai dengan kenyataan, yakni bahwa tinggi A kurang dari 140 sentimeter. Contoh lain data B yang diperoleh dari cerita orang lain menunjukkan bahwa ia pembohong. Bukti bahwa si B pembohong diperoleh dari kenyataan bahwa si B sering berbicara tidak benar, tidak sesuai dengan kenyataan.
Dengan demikian maka data tentang B tersebut valid dan cerita orang tersebut benar. Jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa instrument tersebut valid, karena dapat memberikan gambaran tentang data secara benar sesuai dengan kenyataan atau keadaan sesungguhnya. Dari sedikit uraian dan contoh tersebut dapat disimpulkan bahwa: Jika data yang dihasilkan oleh instrument benar dan valid, sesuai kenyataan, maka instrument yang digunakan tersebut juga valid. Sebuah tes disebut valid apabilates itu dapat tepat mengukur apa yang hendak diukur.
Istilah “valid”, sangat sukar dicari gantinya. Ada istilah baru yang mulai diperkenalkan, yaitu sahih sehingga validitas diganti menjadi kesahihan. Walaupun istilah “tepat” belum dapat mencangkup semua arti yang tersirat dalam kata “valid”, dan kata “tepat” kadang-kadang digunakan dalam konteks yang lain, akan tetapi tambahan kata “tepat” dalam menerapkan kata “valid” dapat memperjelas apa yang dimaksud.

A.    Teknik Pengujian Validitas Tes Hasil Belajar
Teknik pengujian validitas tes hasil belajar terdiri atas dua, yaitu pengujian secara rasional dan pengujian secara empirik.  
1)      Pengujian Validitas Tes Secara Rasional
Pengujian validitas tes hasil belajar secara rasional merupakan sebuah tes dimana ketika dilakukan penganalisisan secara rasional ternyata memiliki daya ketepatan dalam pengukuran. Validitas rasional diperoleh atas dasar pemikiran yang kritis dan berpikir secara logis. Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang diperoleh dengan berfikir secara logis. Dengan demikian maka suatu tes hasil belajar dapat dikatakan telah memiliki validitas rasional, apabila setelah dilakukan penganalisisan secara rasional ternyata bahwa tes hasil belajar memang (secara rasional) dengan tepat telah dapat mengukur apa yang seharusnya diukur. Validitas rasional dapat ditelusuri dari dua segi yaitu dari segi isinya (content) dan susunannya (construct). 
a.    Validitas isi
Validitas isi merupakan validitas yang diperoleh setelah penganalisisan terhadap isi yang terkandung dalam tes hasil belajar. Validitas isi sering disebut validitas kurikuler karena materi yang diajarkan pada umumnya tertuang pada GBPP. Validitas isi dapat diketahui dengan membandingkan isi yang terkandung dalam tes hasil belajar dengan tujuan instruksional khusus yang telah ditentukan. Selain membandingkan, validitas isi juga dapat diketahui dengan cara melaksanakan diskusi panel. Para pakar diminta untuk memberikan pendapat dan rekomendasinya terhadap isi tes hasil belajar. Penganalisisan validitas isi dapat dilakukan sebelum maupun sesudah tes dilaksanakan. 
b.    Validitas Konstruksi
Sebuah tes dikatakan memiliki validitas konstuksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan oleh Tujuan Intruksional Khusus. Dengan kata lain jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan intruksional. Sebagai contoh jika rumusan Tujuan Intruksional Khusus (TIK) “siswa dapat membandingkan antara efek biologis dan efek psikologis”, maka butir soal pada tes merupakan perintah agar siswa membedakan antara dua efek tersebut. Sekarang TIK dikenal dengan Indikator.
“Konstruksi” dalam pengertian ini bukanlah “susunan” seperti yang sering dijumpai dalam teknik, tetapi merupakan rekaan yang dibuat oleh para ahli Ilmu Jiwa yamg dengan suatu cara tertentu “memperinci” isi jiwa atas beberapa aspek seperti: Ingatan (pengetahuan), pemahaman, aplikasi, dan seterusnya. Dalam hal ini, mereka menganggap seolah-olah jiwa dapat dibagi-bagi, tetapi sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan sementara untuk mempermudah mempelajari. Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan ccara memperinci dan memasangkan setiap butir soal dengan setiap aspek dalam indikator. Pengerjaannya dilakukannberdasarkan logika, bukan pengalaman.
Dalam pembicaraan mengenai penyusunan tes hal ini akan disinggng lagi Validitas konstruksi merupakan validitas yang diperoleh dengan cara melihat tes hasil belajar dari segi susunan atau kerangkanya. Tes dikatakan valid apabila tes tersebut sudah mencerminkan suatu konstruksi dalam teori psikologis. Konstruksi dalam teori psikologis (penjelasan dari beberapa ahli psikologis) meliputi tiga ranah yaitu kognitif, afektif, dan psikomotor. Tes akan dianggap valid apabila butir-butir soal yang membangun tes tersebut telah minimal dapat mengukur ketiga ranah tersebut. Validitas konstruksi juga dapat diketahui dengan menyelenggarakan diskusi panel. Validitas isi dapat dilakukan sebelum atau sesudah pelaksanaan tes. 
2)      Pengujian Validitas Tes Secara Empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”. Sebuah instrument dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur.  Pengujian validitas tes hasil belajar secara empiris merupakan sebuah tes dimana validitas tes didapatkan atau bersumber dari pengamatan langsung di lapangan. Tes hasil belajar dikatakan memiliki validitas empiris apabila analisis terhadap data yang didapatkan dengan pengamatan di lapangan dapat diukur tanpa adanya pelaksanaan tes kembali. Validitas tes secara empiris dapat ditelusuri dari dua segi, yaitu dari segi daya ketepatan ramalan dan daya ketepatan bandingan. 
a.    Validitas Ramalan
Validitas ramalan dari sebuah tes merupakan suatu kondisi yang menunjukkan sejau mana sebuah tes dapat menunjukkan kemampuannya untuk memberikan ramalan terhadap kondisi yang akan terjadi pada masa yang akan datang. Misalnya, tes masuk Perguruan Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan dating. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi, tentu menjamin keberhasilannya kelak. Sebaliknya, seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu menikuti perkuliahan yang akan dating. Sebuah tes dikatakan memiliki validitas ramalan apabila terdapat korelasi yang positif dan signifikan antara tes hasil belajar yang sedang diuji dengan kriterium yang ada. Korelasi tersebut dapat diketahui dengan menggunakan teknik analisis korelasi product moment dari Karl Pearson. 
b.    Validitas Bandingan
Validitas bandingan merupakan suatu cara yang dilakukan untuk mendapatkan validitas tes hasil belajar dengan cara membandingkan. Sebuah tes dapat dikatakan memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dapat menunjukkan hubungan searah antara tes pertama dengan tes berikutnya. Validitas bandingan ditinjau dari pengukur lain yang dijadikan kriterium.
Untuk mengetahui ada tidaknya hubungan yang searah antara tes pertma dengan tes berikutnya dapat digunakan teknik analisis korelasi p r o d u c t m o m e n t dari Karl Pearson. Yang dimaksud searah adalah jika tes tersebut bernilai positif dan signifikan. Validitas hasil belajar tidak terlepas dari berbagai pengaruh. Salah satu yang berpengaruh dalam kevaliditasan dari tes hasil belajar adalah dari item tes hasil belajar itu sendiri. Validitas item adalah ketepatan mengukur yang dimiliki oleh sebutir item dalam sebuah tes hasil belajar. Setiam butir item merupakan bagian yang tak terpisahkan dari tes hasil belajar (suatu totalitas). Semakin banyak item yang dapat dijawab, maka skor tes hasil belajar semakin tinggi, begitu pula sebaliknya. Validitas tes akan sangat dipengaruhi oleh validitas item. Validitas dari masing-masing butir item yang membangun sebuah tes, akan dapat diketahui besar kecilnya dukungan yang diberikan oleh masingmasing butir item terhadap tes hasil belajar.  


B.      Cara Mengetahui Validitas Alat Ukur
Tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam artimemiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yangdigunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson. Rumus kolerasi p r o d u c t m o m e n t ada 2 (dua) macam, yaitu:  Kolerasi Product moment dengan simpangan, dan Kolerasi Product moment dengan angka kasar.  
Rumus korelasi product momet dengan simpangan:   
rxy     =  
Dimana:
rxy     = koefisen korelasi antara variabel x dan variabel y, dua variabel yang dikorelasikan (x = x-x dan y = y-y)
               = jumlah perkalian x dan y
y²    = kuadrat dari x
x²    = kuadrat dari y
Rumus korelasi dengan product momet angka kasar:
rxy =  
r xy   =    koefisien kolerasi antara variabel X dan Variabel Y, dua variabel yang dikolerasikan .





Table 01. Skor Skala Sikap terhadap Mata Kuliah Statistik
TESTEE
NOMOR BUTIR SOAL
TOTAL SKOR
1
2
3
4
5
6
7
8
9
10

A
2
5
4
3
4
5
4
4
5
3
39
B
4
5
5
3
4
4
3
5
5
4
42
C
2
3
4
2
3
3
4
3
4
4
32
D
2
3
4
3
3
3
3
3
3
3
30
E
3
4
5
3
4
4
3
4
3
4
37
F
1
2
3
2
1
2
1
2
3
2
19
G
1
3
4
2
1
3
2
2
3
2
23

Tabel 02. Cara Menghitung Skor Butir 6 dengan Skor Total
RESPONDEN
X
Y
XY
A
5
39
195
25
1521
B
4
42
168
16
1764
C
3
32
96
9
1024
D
3
30
90
9
900
E
4
37
148
16
1369
F
2
19
38
4
361
G
3
23
69
9
529
TOTAL
24
222
804
88
7468

rxy =  
rxy =
rxy =
rxy =
rxy =
rxy =
rxy = 0,867
Jadi korelasi skor butir 6 dengan skor total adalah 0,867.

C.    Teknik Pengujian Validitas Item Tes Hasil Belajar
Apa yang sudah dibicarakan di atas adalah validitas soal secara keseluruhan tes. Disamping mencari validitas soal perlu juga dicari validitas item. Jika seorang peneliti atau seorang guru mengetahui bahwa validitas soal tes misalnya terlalu rendah dan rendah saja, maka selanjutnya ingin mengetahui butir-butir tes manakah yang menyebabkan soal secara keseluruhan tersebut jelek karena memiliki validitas rendah. Untuk kepentingan inilah dicari validitas butir soal. Pengertian umum untuk validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total. Skor pada item menyebabkan skor total menjadi tinggi atau rendah. Dengan kata lain  dapat dikemukakan di sini bahwa item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini dapat diartikan dengan kolerasi sehingga untuk mengetahui validitas item digunakan rumus kiolerasi seperti sudah diterangkan di atas.
Sebutir item dapat dikatakan valid apabila skor-skor pada butir item yang bersangkutan memiliki kesesuaian dengan skor totalnya. Skor total merupakan variabel terikat dan skor item merupakan variabel bebas. Teknik analisis yang digunakan untuk menguji sebuah item valid atau tidak yaitu teknik korelasi. Sebuah item dapat dinyatakan valid apabila memiliki korelasi positif dan signifikan dengan skor totalnya. 
1.      Pengertian validitas item 
Validitas item dari sebuah tes adalah ketepatan mengukur yang dimiliki oleh sebutir item (yang merupakan bagian yang tak terpisahkan dari tes bagian suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut. Apabila kita mau memperhatikan secara cermat, maka tes-tes hasil belajar yang dibuat akan disusun oleh para pengajar, baik guru, dosen staf pengajar lainnya, sebenarnya adalah merupakan kumpulan dari sekian banyak butir-butir item; dengan item mana para penyusun tes ingin mengukur atau mengungkap hasil belajar yang telah dicapai oleh masing-masing individu peserta didik, setelah mereka mengikuti proses pembelajaran dalam jangka waktu tertentu.
Pernyataan itu mengandung makna, bahwa sebenarnya setiap butir item yang ada dalam tes hasil belajar itu adalah bagian tak terpisahkan dari tes hasil belajar tersebut sebagai totalitas. Erat hubungannya antara butir item dengan tes hasil belajar sebagai suatu totalitas itu kiranya dapat dipahami dari kenyataan, bahwa semakin banyak butirbutir item yang dapat dijawab dengan betul oleh testee, maka skor-skor total hasil tes tersebut akan semakin tinggi. Sebaliknya, semakin sedikit butir-butir item yang dapat dijawab dengan betul oleh testee, maka skor-skor total hasil tes itu akan semakin rendah atau semakin menurun. 
2.      Teknik Pengujian Validitas Item Tes Hasil Belajar
Berdasarkan uraian diatas maka cukup jelas bahwa sebutir item dapat dikatakan telah memiliki validitas tinggi atau dapat dinyatakan valid, jika skor-skor pada butir item yang bersangkutan memiliki kesesuaian atau kesejajaran arah dengan skor totalnya, skor total disini berkedudukan sebagai variable terikat sedangkan variable item merupakan variable bebasnya. Kalau demikian, maka untuk sampai pada kesimpulan bahwa item-item yang ingin diketahui validitasnya, yaitu valid ataukah tidak, kita dapat menggunakan teknik kolerasi sebagai teknik analisisnya.
Sebutir item dapat dinyatakan valid apabila skor item yang bersangkutan terbuktimempunyai kolerasi positif yang signifikan dengan skor totalnya. Permasalahannya adalah bagaimana Memilih dan menentukan jenis tekhnik dalam rangka menguji validitas item itu. Seperti yang diketahui pada tes objektif maka hanya ada dua kemungkinan yaitu betul atau salah. Setiap butir soal yang dapat dijawab dengan benar diberikan skor 1 ( satu ) sedangkan untuk setiap jawaban yang salah diberikan skor 0 ( nol ) jenis data seperti ini biasanya merupakan tes benar – salah, ya – tidak dan sejenisnya dalam ilmu statistic dikenal dengan disket murni atau data dikotomik. Sedangkan, skor total yang dimiliki oleh masing-masing testee adalah merupakan penjumlahan dari setiap skor itu merupakan data kontinyu.
Berdasarkan teori yang ada apabila variable 1 berupa data dikotomik sedangkan variable II data kontinyu maka, teknik korelasi yang tepat untuk digunakan dalam mencari korelasi dua variable adalah teknik korelasi point biserial, diman angka indeks korelasi diberi lambang rpbi dapat diperoleh dengan rumus : 
Rpbi =  
Dimana:
Rpbi = koefisien korelasi point berserial yang melambangkan kekuatan  korelasi antara variable I dan II yang dalam hal ini sebagai koefisien validitas item.
Mp    =  skor rata-rata hitung yang dimiliki oleh testee. Mt     =  skor rata-rata dari skor total.
SDt   =  standar deviasi dari skor total.
p      =  proporsi testee yang menjawab denagn benar terhadap butir item yang diuji validitasnya.
q    = proporsi testee yang menjawab salah terhadap butir item yang diuji validitasnya








Table 03. Cara menghitung Validitas Butir Instrumen dengan
Korelasi Point Biserial
Testee
Nomor butir soal
Skor total
1
2
3
4
5
6
7
8
9
10
A
1
0
1
0
1
1
1
1
1
1
8
B
0
0
1
0
1
0
0
1
1
1
5
C
0
1
0
0
0
1
0
1
0
1
4
D
1
1
0
0
1
1
0
0
1
0
5
E
1
1
1
1
1
1
0
0
0
0
6
F
1
0
1
0
1
0
1
0
0
0
4
G
1
1
1
1
1
1
1
0
0
0
7
H
0
1
0
1
1
1
1
1
1
1
8
I
0
0
0
1
1
1
0
1
1
1
6
J
1
1
0
1
1
1
0
1
1
0
7

Misalnya diuji Validitas Butir Soal no 6, maka perhitungannya sebagai berikut
1)      Mp          = (8+4+5+6+7+8+6+7) : 8 = 51 : 8 = 6,375
2)      Mt        = (8+5+4+5+6+4+7+8+6+7) : 10 = 60 :10 = 6
3)      Si =  =  =  =  =
4)      p  =  8 : 10 = 0,8
5)      q  = 2 :10 = 0,2 atau (1 – 0,8) = 0,2
6)      Masukan ke dalam rumus:
Rpbi =  
       =  
       =  
       = 0,252 x 2
       = 0,504
B.  Pengujian Reliabilitas Tes Hasil Belajar 
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam bahasa Inggris yang berasal dari kata asal reliable yang memiliki arti dapat dipercaya. Suatu tes dapat dikatakan memiliki taraf reliabilitas yang tinggi jika tes tersebut diujikan dalam kurun waktu yang berbeda dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes berhubungan dengan masalah ketetapan hasil tes.
Konsep reliabilitas ini tidak akan sulit dimengerti apabila telah memahami konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan diperolehnya data yang valid atau sesuai dengan kenyataan. Sedangkan reliabilitas tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar. Maka dari itu konsep reliabilitas terkait dengan pemotretan berkali-kali. Instrumen yang baik adalah instrumen yang dapat dengan tetap memberikan data yang sesuai dengan kenyataan.
Lebih lanjut yang dimaksud reliabilitas adalah sebagai berikut.
a)      Sejauh mana hasil pengukuran dapat dipercaya,
b)      Sejauh mana hasil pengukuran dapat dipercaya bila dilakukan pengukuran pada waktu yang berbeda pada kelompok subjek yang sama diperoleh hasil yang relatif sama asalkan aspek yang diukur dalam diri subjek memang belum berubah,
c)      Tinggi/rendahnya reliabilitas secara empirik ditunjukkan oleh suatu angka yang disebut nilai koefisien reliabilitas,
d)     Reliabilitas yang tinggi ditunjukkan dengan nilai 1.00, reliabilitas yang dianggap sudah cukup memuaskan atau tinggi adalah ≥ 0.70.

a.      Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Uraian
Dalam menentukan apakah tes belajar bentuk uraian yang disusun sudah memiliki daya ketetapan atau reriabilitas yang tinggi ataukah belum, digunakan sebuah rumus yang dikenal dengan Rumus Alpha.
r11=
            Dimana:
                        r11 = koefisien reliabilitas tes.
                        n   = Banyaknya butir item yang dikeluarkan dalam tes.
1        = Bilangan Konstan.
  = jumlah varian skor dari tiap-tiap butir item.
  = varian total.
  diperoleh dengan menggunakan rumus dibawah ini :
Misalkan tes uraian yang akan ditentukan reliabilitasnya berdiri atas 5 item.
Rumus  = 1 + 2 + + + 5
 1 =  dst...
Contoh Soal:
Langkah pertama :Menjumlahkan skor masing-masing testee ΣXi1, ΣXi2, ΣXi3, ΣXi4, dan ΣXi5, mencari skor total yang dicapai ( Xt ) serta mencari kuadrat dari skor total ( Xt² ).  

Tabel 0.4
Tabel analisis dalam rangka mencari skor total untuk masing-masing butir item, skor total dan kuadrat skor total dari masing-masing testee.
Testee
Skor Untuk Item Butir Nomor
Xt
Xt²
1
2
3
4
5
A
8
6
7
7
6
34
1156
B
7
6
7
5
6
30
900
C
4
4
3
5
4
20
400
D
6
5
5
5
6
27
729
E
5
5
4
5
4
23
529
5 = N
30
ΣXi1
26
ΣXi2
25
ΣXi3
27
ΣXi4
26
ΣXi5
134=
ΣXt
3714=
Xt²
Langkah kedua: mencari jumlah kuadrat item
Jkitem1    : 8² + 7² + 4² + 6² + 5²     = 190
Jkitem2    : 6² + 6² + 4² + 5² + 5²      = 138
Jkitem3    : 7² + 7² + 3² + 5² + 4²     = 135
Jkitem4    : 7² + 5² + 5² + 5² + 5²      = 149
Jkitem5    : 6² + 6² + 4² + 6² + 4²      = 140

Langkah ketiga: mencari varian skor
St²1 =    =
St²2 =  =
St²3 =  =
St²4 =  =
St²5 =  =
Langkah keempat: mencari jumlah varian skor item secara keseluruhan
St² = St²1 + St²2 + St²3 + St²4 + St²5
St² = 2,00 + 0,56 + 2,00 + 0,64 + 0,96 = 6,16

Langkah kelima: mencari varian total (St²)
St²  =

     =   =
Langkah keenam: Mencari koefisien reliabilitas tes
 r11 =  
r11 =  = (1,25) (1 - 0,251) = 1,25 x
0,749 = 0,93625 = 0,94

Selanjutnya dalam pemberian interpretasi terhadap koefisien reliabilitas tes (r11) pada umumnya digunakan patokan sebagai berikut:
1.      Apabila r11 0,70 maka tes hasil belajar memiliki reliabilitas tinggi (riliable).
2.      Apabila r11 0,70 maka tes hasil belajar belum memiliki reliabilitas tinggi (un-riliable).  
3.      Jadi  ≥ 0,70 maka tes hasil belajarn pada contoh di atas memiliki relibilitas tinggi (reliable).

b.      Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Obyektif 
1.      Pengujian realibilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan single test – single trial.
Single test – single trial merupakan pendekatan “serba single” atau “serba satu”, yaitu satu kelompok subyek, satu jenis alat pengukur atau satu kelompok testee, dan satu kali testing. Ada 5 jenis formula untuk menentukan reliabilitas dengan menggunakan single test- single trial. Pertama, formula Brown, Flanagan, dan Rulon yang dilakukan dengan “membelah 2” tes (split - half technique). Namun Formula Kuder-Richardsen dan C. Hoyt tidak menggunakan teknik belah dua. Formula Spearman Brown didasarkan pada korelasi, yaitu korelasi antara separoh belahan pertama dengan separoh belahan kedua dari tes. Sedangkan Formula Flanagan  didasarkan pada deviasi (selisih skor dengan mean totalnya, yaitu x = X - Mx.  
Kedua, formula Rullon didasarkan pada selisih skor yang dimiliki oleh belahan pertama dengan belahan kedua dari tes yang dilambangkan: d =(X–Y), dimana d = difference. Ketiga, formula Kuder-Richardsen dilakukan dengan menganalisis skor-skor item tes hasil belajar. Sedangkan formula C. Hyot, sasarannya adalah interaksi antar testee dengan item tes hasil belajar. Teknik analisis tesebut adalah Teknik Analisis Varian (ANAVA).

a.       Pendekatan Single Test-Single Trial dengan Formula Spearman Brown.
Penentuan reliabilitas tes hasil belajar bentuk obyektif dengan menggunakan formula spearman-brown dikenal dengan istilah teknik belah dua (split half technique). Hal itu dikarenakan dalam penentuan reliabilitas tes, penganalisisannya dilakukan dengan jalan membelah dua butir-butir soal tes menjadi dua bagian yang sama, sehingga masing-masing testee memiliki dua macam skor. Untuk mengetahui reliabilitas tes secara keseluruhan spearman-brown menciptakan formula sebagai berikut.
                                    rtt =
                                    keterangan:
                                    rtt            = koefisien reliabilitas tes secara total (tt = total tes)
rhh           = Koefisien kolerasi product moment antara separuh tes pertama dan separuh tes kedua (hh = half-half).
                                    1 & 2   = bilangan konstan
1)        Pendekatan Single Test-Single Trial Dengan Menggunakan Formula Spearman-Brown Model Gasal Genap.
Langkah-langkah yang perlu ditempuh dalam penentuan reliabilitas tes dengan pendekatan single test-single trial dengan menggunakan formula spearman brown model gasal genap adalah sebagai berikut.
·         Menjumlahkan skor-skor dari butir-butir item yang bernomor gasal yang dimiliki oleh masing-masing individu testee.
·         Menjumlahkan skor-skor dari butir-butir item yang benomor genap yang dimiliki oleh masing-masing individu testee.
·         Mencari (menghitung) koefisien kolerasi “r”  product mement (rxy = rhh =  ).
·         Dalam hal ini jumlah skor-skor dari butir-butir item yang bernomor gasal kita anggap sebagai variabel X, sedangkan jumlah skor-skor dari butir-butir item yang bernomor genap kita anggap variabel Y, dengan menggunakan rumus:
rtt            = rhh =
                        =
·           Mencari (menghitung) koefisien reliabilitas tes
(r11 = rtt) dengan menggunakan rumus:
r11 = rtt  =
·           Memberikan interprestasi terhadap r11 .

2)   Pendekatan Single Test-Single Trial Dengan Menggunakan Formula Spearman-Brown Model Belahan Kiri dan Kanan.
Langkah-langkah yang perlu ditempuh dalam penentuan reliabilitas tes dengan pendekatan single test single trial dengan menggunakan formula spearman brown model belahan kiri dan kanan adalah sebagai berikut.
·      Menjumlahkan skor-skor dari butir-butir item yang terletak diseparuh bagian kiri yang dimiliki oleh masing-masing individu testee.
·      Menjumlahkan skor-skor dari butir-butir item yang terletak diseparuh bagian kanan yang dimiliki oleh masing-masing individu testee.
·      Mencari (menghitung) koefisien kolerasi “r” product mement (rxy = rhh  =  ). Dalam hal ini jumlah skor-skor dari butir-butir item yang terletak diseparuh bagian kiri kita anggap sebagai variabel X, sedangkan jumlah skor-skor dari butir-butir item yang terletak diseparuh bagian kanan kita anggap variabel Y, dengan menggunakan rumus:
rtt = rhh =
    =
·      Mencari (menghitung) koefisen reliabilitas tes (r11 = rtt) dengan menggunakan rumus:
r11 = rtt =  
·      Memberikan interprestasi terhadap r11.

b.   Pendekatan single test-single trial dengan menggunakan formula flanagan.
Formula       :  r11 = 2 (1 – )
Dimana:
r11           = koefisien reliabilitas secara total
2 & 1      = bilangan konstan
St²           = jumlah varian total dari skor hasil tes belahan I dan II
         = jumlah varian dari skor-skor hasil tes yang  termasuk belahan I.
        = jumlah varian dari skor-skor hasil tes yang  termasuk belahan II.

Rumus:
         = , deviasi x = X-Mx
         = , deviasi x = Y-My
St²           =  


1)   Pendekatan dengan menggunakan formula Flanagan dengan enerapkan model gasal genap
Langkah 1. Menghitung kuadrat dari devisi X (∑x²), Y (∑y²) dan jumlah kuadrat dari devisi total X dan Y (∑(x + y)²).
Langkah-langkah perhitungan dalam tabel:
·      Menjumlahkan skor variable X dan Y
·      Mencari mean X dan Y: Mx = , My =  
·      Mencari deviasi skor Xdan Y: x = X - Mx , y = Y- My
∑x maupun ∑y = 0.
·      Menguadratkan deviasi x(x²) dan y(y²)
·      Mencari jumlah (x+y) dan dikuadratkan (x+y)²
Langkah 2. Menghitung varian skor item gasal dan genap dengan rumus:
 r11 = 2(1 -    )
Terdapaat cara yang lebih efisien menurut Flanagan tanpa menghitung mean dan deviasi:
Pertama, mencari ∑y² = ∑Y² -
Kedua, mencari ∑(x+y)² = ∑xt² -  lalu mencari S1².

2)   Pendektan dengan menggunakan formula flanagan dengan menerapkan model kiri-kanan
Langkah 1. Menghitung kuadrat dari deviasi X (∑x²), Y (∑y²) dan jumlah kuadrat dari deviasi total X dan Y (∑(x + y)².
Langkah-langkah perhitungan tabel:
·         Menjumlahkan skor variable X dan Y
·         Mencari mean X dan Y: Mx= , My = .
x maupun ∑y = 0.
·         Mengkuadratkan deviasi X(x²) dan Y(y²)
·         Mencari jumlah (x+y) dan dikuadratkan (x+y)².
Langkah 2. Menghitung variann skor item kiri dan kanan
Rumus: S1² =  dan S2² =  
Langkah 3. Mencari varian total : St² =
Langkah 4. Mencari koefisien reliabilitas (r11) lalu memberikan interpretasi.
r11 = r11 = 2 (1 – )
terdapat cara yang lebih efisien menurut Flanagan tanpa menghitung mean dan deviasi:
pertama. Mencari ∑x² dan ∑y² : ∑x² = ∑Y² -  dan
∑y² = ∑Y² -  
Kedua.
Mencari ∑(x + y)² = ∑xt² -  lalu mencari S1², S2² dan r11
c.       Pendekatan single tes-single trial dengan formula Rulon
Rumus r11 = 1 -  , dimana S²= varian perbedaan testee belahan I dan II
Langkah-langkah :
Ø  Menghitung d = (X-Y), menjumlahkan d= ∑𝘥 lalu mengkuadratkan ∑𝘥²
Ø  Menghitung jumlah kuadrat perbedaan (∑x2d ) dan mencari varian perbedaan (S²d ) skor belahan I dan II ∑x²d = ∑d² -  lalu S²d =
Ø  Mencari skor total Xt = (X+Y) lalu dijumlahkan Xt = ∑Xt.
Ø  Mengkuadratkan X²t dan menjumlahkan menjadi ∑x2t
Ø  Mencari x2t = ∑x²t -  lalu mencari S²t =  
Ø  Lalu mencari koefisien reliabilitas :
r11 = 1 -  
pendekatan formula rulon dengan menggunakan model gasal-genap dan berlahan kiri-kanan menggunakan formula yang sama hanya membedakan skor item yang dipilih.
d.      Pendekatan single tes-single trial dengan formula Kuder-Richardsen
Formula Kuder-Richardsen yaitu KR20 dan KR21
KR20 =  ( ) (  )
Dimana :
N           = banyaknya butir item
        = varian total
Pi              = proporsi testee yang menjawab dengan betul butir item tersebut
Qi             = proporsi testee yang menjawab salah, qi = 1- pi
∑piqi      = Jumlah hasil perkalian pi dan qi.
KR21     = ( ) (1 - ( )
Dimana:
Mt : mean total (rata-rata hitung dari skor total)
KR20 dalam peritungannya lebih teliti namun perhitunannya lebih rumit. Sedangkan KR21 perhitungannya lebih sederhana namun kurang teliti.
1)      Pendekatan formula kuderRichardsen dengan rumus KR20.
Langkah-langkah
·      Mencari  =  namun sebelumnya mancari   =  - (  
·      Telah mengetahui n, , ∑p1q1.
Akhirnya mencari r11 = ( ) ( )
2)      Pendekatan formula kuder-Richardsen dengan Rumus KR21.
Langkah-langkah:
Pertama mencari Mt =  setelah diketahui Xdan N
Kedua substitusikan ke dalam rumus KR21:
r11 = ( ) (1 - ( ).

e.       Pendekatan single tes-single trial dengan formula C.Hyot.
Keistimewaan dari teknik ANAVA:
1)      Bisa digunakan selain single test single trial. Misalnya test retest atau alternate form
2)      Bisa digunakan bila skor-skor hasil tesnya dikotomik tidak hanya dikotomi (betul skor 1 sedangkan salah skor 0).
3)      Rumus: r11 = 1-
Dimana: MKӪ : mean kuadrat interaksi antara testee dan item
MK2 : mean kuadrat antar subyek
Langkah-langkah: 
·         Menjumahkan skor-skor jawaban yang betul lalu menjumlahkan Xt sehingga memperoleh ∑X.
·         Menghitung jumlah kuadrat total (JKtot).
·         Menghitung ∑X²t. Caranya mengkuadratkan semua skor hasil tes dari kiri kekanan tabel sampai habis.
·         Jumlah subyeknya adalah banyaknya siswa x yang item
·         Mencari JKtot = ∑X²t.-  dengan diketahui ∑X²t,
∑Xt dan N
·         Mengkuadrat jawaban yang betul, misalkan item/soal nomor 1 yang dijawab betl adalah 15 testee. Setelah itu membagi masing-masing dengan jumlah testee. Misalkan jumlah testee adalah 20 orang. Setelah dibagi, jumlahnya lalu kurangi dengan .
Hasilnya merupakan Jkant.item.
·         Mengkuadratkan skor yang dicappai masing-masing siswa lalu dibagi dengan jumlah soal. Misalkan skor yang dicapai adalah 16 dan jumlah soal adalah 20. Jumlahkan semuanya lalu kurangi dengan  
·         Hasilnya merupakan Jkant.subyek.
·         Mencari jumlah kuadrat interaksi antar item dengan subyek
Rumus = JKant-s atau JKe = JKtot = JKant.it – JKant.s
·         Mencari mean kuadrat antar item dan antar subyek
MKant.item =
Dimana dbant.item = N1 (jumlah soal/item)-1
MKant.subyek atau MKs =  dimana dbant.subyek = N (junlah siswa/testee)-1.
·         Mencari mean kuadrat interaksi antar item dengan subyek
MKant.i-s atau MKe =  dimana dbant.i-s = dbant.it x dbant.s.
·         Mencari koefisien reliabilitas tes: r11 = 1 -  lalu memberikan interpretasi.

2.      Pengujian realibilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan test-reetest (single test – double trial).
Dikenal dengan pendekatan bentuk ulangan dimana tester hanya menggunakan satu seri tes tetapi percobaannya dilakukan dua kali. Misalkan seorang guru memberikan satu seri tes dalam dua kesempatan. Setelah tes selesai skor hasil tes pertama dikorelasikan dengan skor hasil tes kedua. Jika terdapat korelasi positif maka tes hasil belajar dapat dinyatakan reliable karena skor hasil tes belajar memperlihatkan kestabilan atau keajegan.
Untuk mencari korelasi tersebut terdapat teknik korelasi rank-order (tata jenjang) dari Spearman:
ρ = 1-  dimana ρ = Koefisien korelasi antara variabel I (skor) dan II.
D = Difference. D= RI - RII, N = Banyaknya subyek 
Langkah-langkah:
·         Merumuskan hipotesis nihil: “Tidak terdapat korelasi positif yang signifikan antara hasil tes I daengan hasil tes II
·         Mencari koefisien korelasi rho: ρ = 1-
·         Memberikan interpretasi terhadap ρ  Melihat nilai rho dengan menggunakan derajat kebebasan (db) Misalkan N =20 diperoleh ρtabel pada taraf signifikansi 5% sebesar 0,450. Jika ρobservasi ≥ ρtabel baik pada taraf 1% maupun 5% hipotesis nihil ditolak. Berarti tes pertama dan kedua terdapat korelasi posiif yang signifikan.
·         Menarik kesimpulan. Bahwa tes hasil belajar sudah memiliki reliabilitas yang tinggi (reliabel). Pengujian ulang tidak hanya sebatas satu kali saja, boleh lebih sampai penyusun tes sudah yakin dengan keajegan hasil pengukuranya. 


3.      Pengujian realibilitas tes hasil belajar bentuk obyektif dengan menggunakan pendekatan alternate form (double test – double trial).
Mempergunakan dua tes yang diberikan tanpa adanya tenggang waktu dengan ketentuan tes harus sejenis, mengukur hal yang sama maupun tingkat kesukaran yang sama. Alasan bahwa pendekatan alternate form (bentuk pararel) lebih baik daripada pendekatan yang sebelumnya:
a.       Terhindar dari kemungkinan testee latihan atau menghafal karena butir item yang diberikan tidak sama
b.      Terhindar akan timbulnya perbedaan situasi dan kondisi baik yang bersifat sosial maupun alami.
Apabila terdapat korelasi positif signifikan maka dapat dikatakan tes tersebut reliabel. Teknik korelasi yang digunakan antara teknik product moment dari Pearson atau teknik rank order dari Spearman (khusus untuk N ≤ 30).
rxy = 
Langkah-langkah:
·           Merumuskan hipotesis nihil
·           Menghitung rxy = 
·           Memberikan interpretasi terhadap rxy atau robservasi. Db = N-nr. Misalkan data 30 berarti db = 30 – 2 = 28, mencari r tabel. Jika rtabel pada taraf 5% lebih besar  
Robservasi maka hipotesis nihil ditolak. Namun jika rtabel pada taraf 1% lebih kecil daripada robservasi maka hipotesis nihil disetujui. Jika salah satu hipotesis nihil disetujui berarti hasil tes belajar memiliki reliabilitas sedang.
                  



BAB III
PENUTUP
A.    Kesimpulan
Validitas merupakan derajat kemampuan suatu tes yang mengukur apa yang hendak diukur. Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
Validitas adalah suatu ukuran yang menunjukan tingkat kevalidan atau kesahihan suatu instrumen. Prinsif validitas adalah pengukuran atau pengamatan yang berarti prinsif keandalan instrumen dalam mengumpulkan data. Instrumen harus dapat mengukur apa yang seharusnya diukur. Jadi validitas lebih menekankan pada alat pengukuran atau pengamatan.
 Uji validitas adalah suatu langkah pengujian yang dilakukan terhadap isi (content) dari suatu instrumen, dengan tujuan untuk mengukur ketepatan instrumen yang digunakan dalam suatu penelitian. Untuk menguji validitas setiap butir soal maka skor-skor yang ada pada butir yang dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal dinyatakan skor X dan skor total dinyatakan sebagai skor Y, dengan diperolehnya indeks validitas setiap butir soal, dapat diketahui butir-butir soal manakah yang memenuhi syarat dilihat dari indeks validitasnya (Arikunto, 1999: 78)
Ada dua cara umum untuk mengukur reliabilitas, yaitu:
a)             Relibilitas stabilitas.
b)             Reliabilitas ekivalen




B.     Saran

Demikianlah makalah ini kami buat, semoga apa yang telah disajikan akan memberikan ilmu dan informasi serta manfaat bagi para pembaca. Setiap Selanjutnya demi kesempurnaan makalah ini kami mohon saran dan kritik dari pembaca yang bersifat membangun, guna memperbaiki pembuatan makalah berikutnya.

No comments:

Post a Comment