Selasa, 31 Desember 2013

MACAM-MACAM SKALA PENGUKURAN



MACAM-MACAM SKALA PENGUKURAN

Disusun untuk memenuhi salah satu tugas mata kuliah “Evaluasi Proses dan Hasil Belajar Biologi” yang diampu oleh Ibu Diah Ika Putri, S.Pd.

Disusun Oleh :
GINA FAUZIAH
11541090


 


PROGRAM STUDI PENDIDIKAN BIOLOGI S-1
SEKOLAH TINGGI KEGURUAN DAN ILMU PENDIDIKAN
STKIP-GARUT
2013




I.         MACAM-MACAM SKALA PENGUKURAN
Skala pengukuran merupakan kesepakatan yang digunakan sebagai acuan untuk menentukan panjang pendeknya interval yang ada dalam alat ukur, sehingga alat ukur tersebut bila digunakan dalam penelitian akan menghasilkan data kuantitatif. Dengan skala pengukuran ini, maka variabel yang akan diukur dengan instrumen tertentu dapat dinyatakan dalam bentuk angka, sehingga akan lebih akurat, efisien dan komunikatif.
  • Pengukuran adalah penetapan atau pemberian angka terhadap objek atau fenomena menurut aturan tertentu (Stevens, 1951). Angka merupakan arti kuantitatif dari pengukuran, dapat memberikan indikator tertentu kepada sifat objek yang diteliti.Contohnya adalah jika indikator nilai mata kuliah B diberikan untuk mahasiswa yang mendapat nilai 60 – 75, dan A untuk mahasiswa yang berhasil mendapatkan nilai > 75.
  • Pengukuran terkait dengan aturan yang dapat didefinisikan, misalnya kita katakan aturan yang terdapat dalam skala likert yang memberikan nilai 1 hingga 4 dengan kategori tidak setuju – kurang setuju – ragu-ragu – setuju. Aturan ini dapat diterjemahkan menjadi; jika objek setuju, berikan angka 4, dan jika tidak setuju berikan angka 1, serta jika ragu-ragu berikan angka 3.
*        Secara umum ada empat jenis ukuran atau yang biasa disebut skala dalam statistik antara lain:
1.      Skala Nominal : Skala pengukuran nominal digunakan untuk mengklasifikasikan obyek, individual atau kelompok. Sebagai contoh pengklasifikasi jenis kelamin, agama, pekerjaan, dan area geografis. Dalam mengidentifikasi hal-hal diatas digunakan angka-angka sebagai symbol. Contohnya : jenis kelamin rsponden, laki-laki = 1, dan wanita = 2.
2.      Skala Ordinal : Skala pengukuran ordinal memberikan informasi tentang jumlah relatif  karakteristik yang berbeda yang dimiliki oleh obyek atau indvidu tertentu. Tingkat pengukuran ini mempunyai informasi skala nominal ditambah dengan sarana peringkat relative tertentu yang memberikan informasi apakah suatu obyek memiliki karakteristik yang lebih atau kurang tetapi bukan berapa banyak kekurangannya atau kelebihannya.
Skala pengukuran yang meyatakan kategori sekaligus melakukan rangking terhadap kategori. Contoh : kita ingin mengukur preferensi responden terhadap empat merek produk air mineral. 
Merek  Air Mineral                  Ranking                  
Aquana                                           1
Aquaria                                          2
Aquasan                                         3
Aquasi                                            4
3.      Skala Interval : Skala interval mempunyai karakteristik seperti yang dimiliki oleh skala nominal dan skala ordinal dengan ditambah karakteristik lain, yaitu berupa adanya interval yang tetap. Dengan demikian peneliti dapat melihat besarnya perbedaan karakteristik antara satu individu atau obyek dengan lainnya.
4.      Skala Rasio : Skala pengukuran ratio mempunyai semua karakteristik yang dipunyai oleh skala nominal, ordinal, dan interval dengan kelebihan skala ini mempunyai nilai 0 (nol) empiris absolut. Nilai absolut nol tersebut terjadi pada saat ketidak hadirannya suatu karakteristik yang sedang diukur. Pengukuran ratio biasanya dalam bentuk perbandingan antara satu individu atau obyek tertentu dengan lainnya.

Selain skala yang diatas ada juga berbagai skala yang dapat digunakan untuk mengukur gejala/fenomena sosial atau sering disebut skala sikap. Ada empat jenis skala pengukuran sikap menurut Daniel J Mueller (1992), yaitu:
1.        Skala Likert
Skala Likert digunakan untuk mengukur sikap, pendapat dan persepsi seseorang atau sekelompok orang tentang fenomena sosial. Dengan skala Likert, maka variabel yang akan diukur dijabarkan menjadi indikator variabel. Kemudian indikator tersebut dijadikan sebagai titik tolak untuk menyusun item-item instrument yang dapat berupa pernyataan atau pertanyaan. Jawaban setiap item instrumen yang menggunakan skala
Likert mempunyai gradasi dari sangat positif sampai sangat negatif, yang dapat berupa kata-kata antara lain:
1.      Sangat setuju
1.      Sering
1.      Sangat positif
2.      Setuju
2.      Kadang-kadang
2.      Positif
3.      Ragu-ragu
3.      Tidak pernah
3.      Negatif
4.      Tidak setuju

4.      Sangat negatif
5.      Sangat tidak setuju

5.      Sangat baik


6.      Baik


7.      Tidak baik


8.      Sangat tidak baik
Untuk keperluan analisis kuantitatif, maka jawaban itu dapat diberi skor, misalnya:
1.         Setuju/ selalu/ sangat positif diberi skor                           5
2.         Setuju/ sering/ positif diberi skor                                     4
3.         Ragu-ragu/ kadang-kadang/ netral diberi skor                 3
4.         Tidak setuju/ hampir tidak pernah/ negatif diberi skor    2
5.         Sangat tidak stuju/ tidak pernah/ diberi skor                   1
Instrumen penelitian yang menggunakan skala Likert dapat dibuat dalam bentuk checklist ataupun pilihan ganda.
  1. Contoh Bentuk Checklist
Berilah jawaban pernyataan berikut sesuai dengan pendapat anda, dengan cara memeberi tanda (√) pada kolom yang tersedia.
No.
Pertanyaan
Jawaban
SS
ST
RG
TS
STS
1



2
Sekolah ini akan menggunakn teknologi informasi dalam pelayanaan administrasi dan akademik
…………………………………





            SS        = Sangat Setuju                       diberi skor       5
ST        = Setuju                                   diberi skor       4
RG       = Ragu-Ragu                           diberi skor       3
TS        = Tidak setuju                         diberi skor       2
STS      = Sangat Tidak Setuju             diberi skor       1

2.         Contoh bentuk plihan ganda
Berilah salah satu jawaban terhadap pertanyaan berikut sesua dengan pendapat anda, dengan cara member tanda lingkaran nomor jawaban yang tersedia.
Kurikulum baru tu akan segera diterapkan di lembagaan pendidikan anda?
a.         Sangat tidak setuju
b.         Tidak setuju
c.         Ragu-ragu/ netral
d.        Setuju
e.         Sangat setuju
Dengan bentuk pilihan ganda itu, maka jawaban dapat diletakkan pada tempat yang berbeda-beda.
Dalam penyusunan instrument untuk variabel tertentu sebaiknya butir-butir pertanyaan dibuat dalam bentuk kalimat positif netral atau negatif, sehungga responden dapat mejawa dengan serius dan konsisten. Dengan cara demikian maka kecenderungan responden untuk menjawab pada kolom tertent dari bentuk checklist dapat dikurangi. Dengan model ini juga responden akan selalu membaca pertanyaan setiap instrument dan juga jawabannya. Pada bentuk checklist sering jawaban tidak dibaca, karena letak jawabanna sudah menentu. Tetapi dengan bentuk checklis, maka akan didapat keuntungan dalam  hal ini sangat singkat dalam pembuatannya, hemat kertas, mudah mentabulasikan data, dan secara visual lebih menarik. Data yang diperoleh dari skala  tersebut adalah berupa data internal.
Skala Likert digunakan untuk mengukur sikap, pendapat, dan persepsi seseorang atau sekelompok orang tentang fenomena sosial. Sedangkan pada evaluasi, skala likert digunakan untuk:
·            Menilai keberhasilan suatu kebijakan atau program
·            Menilai manfaat pelaksanaan suatu kebijakan atau program
·            Mengetahui kepuasan stakeholder terhadap pelaksanaan suatu kebijakan atau program
·            dll
*           Kelebihan:
·       Mudah dibuat dan di terapkan.
·       Terdapat kebebasan dalam memasukan pertanyaan- pertanyaan, asalkan sesuai dengan konteks permasalahan.
·       Jawaban suatu item dapt berupa alternative, sehingga informasi mengenai item tersebut diperjelas.
·       Reliabilitas pengukuran bisa diperoleh dengan jumlah item tersebut diperjelas
*           Kekurangan:
·       Karena ukuran yang digunakan adalah ukuran ordinal, skala Likert hanya dapat mengurutkan individu dalam skala, tetapi tidak dapat membandingkan berapa kali satu individu lebih baik dari individu yang lain.
·       Kadangkala total skor dari individu tidak memberikan arti yang jelas, karena banyak pola respons terhadap beberapa item akan memberikan skor yang sama. Adanya kelemahan di atas sebenarnya dapat dipikirkan sebagai error dari respons yang terjadi
*           Prosedur dalam membuat skala Likert adalah sebagai berikut:
1.      Peneliti mengumpulkan bahan-bahan yang relevant dengan masalah yang sedang diteliti
2.      Menyusun Blue Print untuk memandu penyusunan alat ukur
3.      Membuat item-item yang akan diuji sesuai dengan panduanUji coba item kepada sekelompok responden yang cukup representatif dari populasi yang ingin diteliti. Responden di atas diminta untuk mengecek tiap item, apakah ia menyenangi (+) atau tidak menyukainya (-). Respons tersebut dikumpulkan dan jawaban yang memberikan indikasi menyenangi diberi skor tertinggi. Tidak ada masalah untuk memberikan angka 5 untuk yang tertinggi dan skor 1 untuk yang terendah atau sebaliknya. Yang penting adalah konsistensi dari arah sikap yang diperlihatkan. Demikian juga apakah jawaban “setuju” atau “tidak setuju” disebut yang disenangi, tergantung dari isi pertanyaan dan isi dari item-item yang disusun.
4.      Setelah item di uji coba kepada responden, lalu diuji tingkat validitas dan reabilitas dari item-item tersebut. Validitas adalah suatu ukuran yang menunjukkan tingkatan kevalidan atau kesa hihan suatu instrumen sedangkan reliabilitas merupakan penilaian tingkat konsistensi terhadap hasil pengukuran bila dilakukan multiple measurement pada sebuah variabel suatu alat ukur dikatakan reliabel jika alat ukur tidak berubah.
*          Uji Validitas
Uji validitas dilakukan dengan metode Pearson yaitu dengan mengkorelasikan skor item kuesioner dengan skor totalnya. Langkah-langkah pelaksanaannya adalah sebagai berikut:
·           Menghitung dan menjumlahkan skor tiap subyek
·           Mengkorelasikan skor tiap-tiap item dengan skor total yang diperoleh setiap subyek
·           Nilai r hitung dibandingkan dengan r tabel. Pilihlah item yang r hitungnya positif dan lebih besar dari r tabel
·           Biasanya dapat juga menggunakan patokan r minimal 0,3
·           Buang item yang r hitungnya kurang dari r tabel atau kurang dari 0,3 dan hitung kembali korelasinya hingga r hitung semua item lebih dari r tabel atau lebih dari 0,3
·           Item yang memiliki nilai r hitung >0,3 maka item tersebut dinyatakan valid
*          Uji Reabilitas
Metode yang dapat digunakan pada uji reabilitas adalah metode Croncbach’s Alpha. Penghitungan Cronbach’s Alpha dilakukan dengan menghitung rata-rata interkorelasi diantara butir-butir pernyataan dalam kuesioner. Variabel dinyatakan reliabel jika alphanya lebih dari 0,3.
5.      Setelah item terpilih didapatkan, maka langkah selanjutnya adalah penskalaan respon. Penskalaan respon merupakan prosedur penempatan sejumlah alternatif respon tiap item pada suatu kontinum kuantitatif sehingga didapatkan angka sebagai skor masing-masing alternatif respon
6.      Teknik Skoring
Setelah nilai tiap faktor diketahui maka dilakukan teknik skoring. Teknik skoring dilakukan untuk memperoleh data kuantitatif. Tahapan dalam terbagi menjadi 4 tahap yaitu :
1.        Pentabulasian hasil kuesioner yang telah diuji validitas dan reliabilitasnya.
2.        Penyesuaian nilai dari tiap-tiap faktor dengan skala pengukuran likert yang digunakan.
3.        Menghitung nilai indeks dari tiap-tiap faktor, dengan cara masing-masing jawaban dikalikan dengan bobot/skoring jawabannya.
4.        Hasil skoring dikembalikan lagi pada nilai skala respon untuk menghasilkan interpretasi
Skala likert hanya salah satu teknik dalam evaluasi perencanaan dan masih banyak lagi teknik analisa yang dapat dipergunakan.

3.        Skala Guttman
Skala pengkuran dengan tipe ini, akan didapat jawaban yang tegas, yaitu “ya-tidak”, “benar-salah”, “penah-tidak pernah”, positif-negatif” dan lain-lain. Data yang diperboleh dapat berupa data interval atau rasio dikhotomi (dua alteratif). Jadi kalau pada skala Likert terdapat 3, 4, 5, 6, 7 interval dri kata “sangat setuju” sampai “sangat tidak setuju”maka pada dalam skala Guttman hanya ada dua interval yaitu “setuju”atau “tidak setuju”.
Contoh:
1)      Bagaimana pendapat anda, bila orang itu menjabat Kepala sekolah disini?
1.         Setuju
2.         Tidak setuju
2)      Pernakah Penilik Sekolah melakukan pemeriksaan di ruang kelas anda?
1.         Tidak pernah
2.         Pernah
Skala Guttman selai dapat dibuat dalam bentuk pilihan ganda, juga dapat dibuat dalam bentuk checklist. Jawaban yang dapat diskor tertinggi satu dan terendah nol.

3.        Semantic Defferensial
Skala pegukuran yang berbenuk semantic defferensial di kembangkan oleh Osgood. Skala ini juga digunakan untuk mengukur sikap, hanya bentuknya tidak pilihan ganda maupun checklist, tetapi tersusun dalam satu garis kontinum yang jawaban “sangat positifnya”, terletak dibagian kanan garis, dan jawaban yang “sangat negatif” terletak di bagian kiri garis atau sebaliknya. Data yang diperoleh adalah data interval, dan biasanya skala ini digunakan  untuk mengukur sikap/ karakteristik tertentu yang dipunyai oleh seseorang. Contoh:

Mohon diberi nilai gaya kepemimpinan Kepala Sekolah
Bersahabat           5          4          3          2          1          Tidak bersahabat
Tepat janji            5          4          3          2          1          Lupa janji
Bersaudara           5          4          3          2          1          Memusuhi
Memberi pujian    5          4          3          2          1          Mencela
Mempercayai        5          4          3          2          1          Mendominasi
Responden dapat memberi jawaban, pada rentang jawaban yang positif sampai negatif. Responden yang member penilaian pada angka 5 berarti menilai Kepala Sekolah sangat negatif dan sebaliknya.

4.        Rating Scale
Dari ketiga skala pengukuran seperti yang telah dikemukaan data yang diperoleh semuanya adalah data kualitatif yang kemudian dikuantitatifkan. Tetapi dengan rating-scale data mentah yang diperoleh berupa angka kemudan ditafsirkan dalam pengertian kualitatif.
Responden menjawab, senang atau tidak senang, setuju atau tidak setuju, penah-tidak pernah adalah merupakan data kualitatif. Dalam skala model rating scale, responden tidak akan menjawab salah satu jawaban kuantitatif yang telah disedikan.Oleh karena itu rating scale ini lebih fleksibel, tidak terbatas untuk pengukuran sikap saja tetapi untuk mengukur status sosial ekonomi, kelembagaan, pengetahuan, kemampuan, proses kegiatan, dan lain-lain.
Yang penting bagi penyusunan instrument dengan rating scale adalah harus dapat mengartikan setiap angka yang diberikan pada alternative jawaban setiap item instrument.
Data dari pengukuran skilap dengan skala sikap adalah bentuk dari tada interval, demikian juga dalam pengukuran tata ruang. Tetapi data hasil dari pengukuran penambahan pengetahuan seperti tersebut diatas akan menghasilkan ratio.
*     

*       * Jenis Rating Scale
Ada beberapa jenis skala rating yang dapat digunakan, yaitu :
a.         Skala grafis
Menggunakan garis lurus horizontal ataupun kadang vertikal dalam penyajiannya. Misalnya : 





b.      Skala Numeris
     Angka dalam kebanyakan skala rating digunakan sebagai anchor, tetapi penggunaan angka ini harus didefinisikan secara jelas. Di depan ataupun di belakang setiap deskripsi disediakan ruang untuk membubuhkan tanda (biasanya tanda ) yang menunjukkan kesesuaiannya dengan subjek yang diamati. Bentuk numeris ini kadang disertai bentuk grafis, sehingga observer atau rater hanya menandai angka yang menjadi pilihannya. Misalnya skala enam jenjang utk mengukur orientasi pelayanan pelanggan :


Atau :
1. Bagaimanakah partisipasi peserta didik dalam diskusi kelas?   1 2 3 4 5
2. Bagaimanakah hubungan peserta didik dengan kelompoknya? 1 2 3 4 5

Catatan:
1 = tidak memuaskan             
2 = di bawah rata-rata.
3 = rata-rata
4 = di atas rata-rata
5 = sempurna
c.     Standard Rating
Bentuk rating ini sering juga disebut sebagai skala presentase. Anchor presentase meminta observer merating subjek ke dalam suatu kontinum yang bergerak dari 0 s/d 100, dalam perbandingan dengan subjek amatan lain atau kelompok khusus. Misalnya mengukur interpersonal persuasiveness ability : 
 






d.      Cumulated Points Rating
Aitem yang disusun merupakan indikator suatu trait yang akan diukur. Skor akhir skala merupakan penjumlahan kelseluruhan aitem. Misalnya, bagaimana seorang pemilik toko mengobservasi kemampuan pegawainya dalam memberikan pelayanan pada konsumen :



e.      Force Choice Rating
Bentuk ini biasanya digunakan dalam bidang militer atau bisnis. Observer diminta memilih kalimat yang menggambarkan kondisi subjek amatan. Misalnya:



f.       Semantic Differential
Skala ini menggunakan pasangan kata sifat yang berlawanan dalam memberikan rating. Secara ringkas penyusunan skala sbb :
º    Pilih suatu konsep yang akan diamati
º    Tentukan pasangan kata sifat yang akan digunakan
º    Susun kutub pasangan kata tersebut secara random
Misalnya : 



*      

*        Kelebihan Rating Scale
-       Mudah penggunaannya.
-       Dapat mengetahui intensitas dan gambaran keadaan suatu perilaku/kejadian.
-       Dapat digunakan untuk mengkonfirmasikan antara realitas dengan persepsi subjektif rater. 

*        Kekurangan Rating Scale
Observer dapat melakukan kesalahan dalam membuat kesimpulan, antara lain :
º    Error of leniency : terlalu longgar
º    Error of central tendency : cenderung ke pusat skala
º    Hallo effect : terkesan hal umum
º    Error of logic : cenderung sama karena dianggap berhubungan
º    Error of contast : memiliki dua arah
º    Ketidakjelasan dalam penggunaan istilah
º    Social desirability effect : secara sosial lebih diterima
º    Skala rating tidak memberi informasi sebab terjadinya perilaku
º    The generosity effect : terjadi ketika ragu-ragu
º    Carry over effect : tidak memisahkan gejala




5.        Skala Thurstone
Skala Thurstone adalah skala yang disusun dengan memilih butir yangberbentuk skala interval. Setiap butir memiliki kunci skor dan jika diurut, kunciskor menghasilkan nilai yang berjarak sama. Skala Thurstone dibuat dalambentuk sejumlah (40-50) pernyataan yang relevan dengan variabel yang hendak diukur kemudian sejumlah ahli (20-40) orang menilai relevansi pernyataan itudengan konten atau konstruk yang hendak diukur. Adapun contoh skalapenilaian model Thurstone adalah seperti gambar di bawah ini.Nilai 1 pada skala di atas menyatakan sangat tidak relevan, sedangkan nilai 11menyatakan sangat relevan.

II.      VALIDITAS DAN REABILITAS
A.           Validitas
1.         Pengertian Validitas
*      Menurut Azwar (1986) Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
*      Pengertian validitas menurut Walizer (1987) adalah tingkaat kesesuaian antara suatu batasan konseptual yang diberikan dengan bantuan operasional yang telah dikembangkan.
*      Menurut Aritonang R. (2007) validitas suatu instrumen berkaitan dengan kemampuan instrument itu untuk mengukur atu mengungkap karakteristik dari variabel yang dimaksudkan untuk diukur. Instrumen yang dimaksudkan untuk mengukur sikap konsumen terhadap suatu iklan, misalnya, harus dapat menghasilkan skor sikap yang memang menunjukkan sikap konsumen terhadap iklan tersebut. Jadi, jangan sampai hasil yang diperoleh adalah skor yang menunjukkan minat konsumen terhadap iklan itu.
Validitas suatu instrumen banyak dijelaskan dalam konteks penelitian sosial yang variabelnya tidak dapat diamati secara langsung, seperti sikap, minat, persepsi, motivasi, dan lain sebagainya. Untuk mengukur variabel yang demikian sulit, untuk mengembangkan instrumen yang memiliki validitas yang tinggi karena karakteristik yang akan diukur dari variabel yang demikian tidak dapat diobservasi secara langsung, tetapi hanya melalui indikator (petunjuk tak langsung) tertentu. (Aritonang R. 2007)
*      Menurut Masri Singarimbun, validitas menunjukkan sejauh mana suatu alat pengukur itu mengukur apa yang ingin diukur. Bila seseorang ingin mengukur berat suatu benda, maka dia harus menggunakan timbangan. Timbangan adalah alat pengukur yang valid bila dipakai untuk mengukur berat, karena timbangan memang mengukur berat. Bila panjang sesuatu benda yang ingin diukur, maka dia harus menggunakan meteran. Meteran adalah alat pengukur yang valid bila digunakan untuk mengukur panjang, karena memang meteran mengukur panjang. Tetapi timbangan bukanlah alat pengukur yang valid bilamana digunakan untuk mengukur panjang.
Sekiranya penelliti menggunakan kuesioner di dalam pengumpulan data penelitian, maka kuesioner yang disusunnya harus mengukur apa yang ingin diukurnya. Setelah kuesioner tersebut tersusun dan teruji validitasnya, dalam praktek belum tentu data yang dikumpulkan adalah data yang valid. Banyak hal-hal lain yang akan mengurangi validitas data; misalnya apakah si pewawancara yang mengumpulkan data betul-betul mengikuti petunjuk yang telah ditetapkan dalam kuesioner. (Masri Singarimbun)
*      Menurut Suharsimi Arikunto, validitas adalah keadaan yang menggambarkan tingkat instrumen bersangkutan yang mampu mengukur apa yang akan diukur.
*      Menurut Soetarlinah Sukadji, validitas adalah derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur. Validitas suatu tes tidak begitu saja melekat pada tes itu sendiri, tapi tergantung penggunaan dan subyeknya.

2.         Jenis-jenis Validitas
Ebel (dalam Nazirz 1988) membagi validitas menjadi :
·           Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja.
·           Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat menyebabkan kinerja yang baik dalam pengukuran.
·           Face Validity adalah validitas yang berhuubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya hendak diukur.
·           Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, di mana validitas ini diperoleh dengan menggunakan teknik analisis faktor.
·           Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
·           Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bhwa suatu alat ukur benar-benar mengukur apa yang seharusny diukur.
·           Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerj seorang di msa mendatang.
·           Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi.
·           Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa jauh pungukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.
Kerlinger (1990) membagi validitas menjadi tiga yaitu:
·           Content validity (Validitas isi) adalah validitas yang diperhitungkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validitas ini adalah “sejauh mana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?” atau berhubungan dengan representasi dari keseluruhan kawasan.
Validitas isi suatu instrumen berkaitan dengan kesesuaian antara karakteristik dari variaabel yang dirumuskan pada definisi konseptual dan operasionalnya. Apabila semua karakteristik variabel yang dirumuskan pada definisi konseptualnya dapat diungkap melalui butir-butir suatu instrument, maka instrument itu dinyatakan memiliki validitas isi yang baik.
Validitas isi dapat dianalisis dengan cara memperhatikan penampakan luar dari instrument dan dengan menganalisis kesesuaian butir-butirnya dengan karakteristik yang dirumuskan pada definisi konseptual variabel yang diukur. Validitas yang dianalisis dengan memperhatikan penampilan luar instrument itu disebut validitas tampang (face validity). Validitas tampang dievaluasi dengan membaca dan menyelidiki butir-butir instrument serta sekaligus membandingkannya dengan definisi konseptual mengenai variabel yang akan diukur. Validitas yang dianalisis dengan memperhatikan kerepresentativan butir-butir instrument disebut validitas penyampelan (sampling validity) atau kuikulum (curriculum validity).
Validitas tampang maupun penyampelan disebut juga sebagai validitas teoritis karena penganalisisannya lazim dilakukan tanpa didasarkan pada data empiris. Alat yang digunakan untuk menganalisis validitas itu adalah logika dari orang yang menganalisisnya.
·           Construct validity (Validitas konstruk) adalah tipe validitas yang menunjukkan sejauh mana alat ukur mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya. (Allen & Yen, dalam Azwar 1986).
Pengujian validitas konstruk merupakan prosesyang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur.
Menurut Saifuddin Azwar, validitas konstruk adalah seberapa besar derajat tes mengukur hipotesis yang dikehendaki untuk diukur. Konstruk adalah perangai yang tidak dapat diamati, yang menjelaskan perilaku. Menguji validitas konstruk mencakup uji hipotesis yang dideduksi dari suatu teori yang mengajukan konstruk tersebut.
·           Criterion-related validity (Validitas berdasar kriteria). Validitas ini menghendaki tersedianya criteria eksternal yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel perilaku yang akan diprediksi oleh skor alat ukur.

Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar kriteria menghasilkan dua macam validitas (Saifuddinn Azwar), yaitu:
1.      Validitas Prediktif.
Validitas Prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi sebagai predictor bagi kinerja di masa yang akan datang. Contoh situasi yang menghendaki adanya prediksi kinerja ini antara lain adalah dalam bimbingan karir; seleksi mahasiswa baru, penempatan karyawan, dan semacamnya.
Menurut Saifuddin Azwar, validitas prediktif adalah seberapa besar derajat tes berhasil memprediksi kesuksesan seseorang pada situasi yang akan datang. Validitas prediktif ditentukan dengan mengungkapkan hubungan antara skor tes dengan hasil tes atau ukuran lain kesuksesan dalam satu situasi sasaran.
2.      Validitas Konkuren.
Apabila skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren.
Menurut Saifuddin Azwar, validitas ini menunjukkan seberapa besar derajat skor tes berkorelasi dengan skor yang diperoleh dari tes lain yang sudah mantap, bila disajikan pada saat yang sama, atau dibandingkan dengan criteria lain yang valid yang diperoleh pada saat yang sama.

B.            Reliabilitas
1.    Pengertian Reliabilitas
·           Walizer (1987) menyebutkan pengertian Reliability (Reliabilitas) adalah keajegan pengukuran.
·           Menurut John M. Echols dan Hasan Shadily (2003: 475) reliabilitas adalah hal yang dapat dipercaya. Popham (1995: 21) menyatakan bahwa reliabilitas adalah "...the degree of which test score are free from error measurement".
·           Menurut Masri Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan. Bila suatu alat pengukur dipakai dua kali – untuk mengukur gejala yang sama dan hasil pengukuran yang diperoleh relative konsisten, maka alat pengukur tersebut reliable. Dengan kata lain, realibitas menunjukkan konsistensi suatu alat pengukur di dalam pengukur gejala yang sama.
·           Menurut Brennan (2001: 295) reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes.
·           Menurut Sumadi Suryabrata (2004: 28) reliabilitas menunjukkan sejauhmana hasil pengukuran dengan alat tersebut dapat dipercaya. Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi dan kemantapan.
·           Dalam pandangan Aiken (1987: 42) sebuah tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama meskipun dilakukan pengukuran berulang-ulang.
Reliabilitas, atau keandalan, adalah konsistensi dari serangkaian pengukuran atau serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes dengan tes ulang) akan memberikan hasil yang sama, atau untuk pengukuran yang lebih subjektif, apakah dua orang penilai memberikan skor yang mirip (reliabilitas antar penilai). Reliabilitas tidak sama dengan validitas. Artinya pengukuran yang dapat diandalkan akan mengukur secara konsisten, tapi belum tentu mengukur apa yang seharusnya diukur.
Dalam penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi yang sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran yang berulang itu memberikan hasil yang berbeda-beda.
Reliabilitas alat ukur tidak dapat diketahui dengan pasti tetapi dapat diperkirakan. Dalam mengestimasi reliabilitas alat ukur, ada tiga cara yang sering digunakan yaitu :
(1) pendekatan tes ulang,
(2) pendekatan dengan tes pararel, dan
(3) pendekatan satu kali pengukuran.
Pendekatan tes ulang merupakan pemberian perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan selang waktu yang berbeda. Asumsinya adalah bahwa skor yang dihasilkan oleh tes yang sama akan menghasilkan skor tampak yang relatif sama. Estimasi dengan pendekatan tes ulang akan menghasilkan koefisien stabilitas. Untuk memperoleh koefisien reliabilitas melalui pendekatan tes ulang dapat dilakukan dengan menghitung koefisien korelasi linear antara distribusi skor subyek pada pemberian tes pertama dengan skor subyek pada pemberian tes kedua. Pendekatan tes ulang sangat sesuai untuk mengukur ketrampilan terutama ketrampilan fisik.

2.    Jenis-jenis Reliabilitas
Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:
1.        Relibilitas stabilitas. Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang sama, definisi operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.
2.        Reliabilitas ekivalen. Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional, paeralatan pengumpulan data, dan / atau pengamat-pengamat.
Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah.
Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.

3.    Metode pengujian reliabilitas
Tiga teknik pengujian realibilitas instrument antara lain :
a.         Teknik Paralel (Paralel Form atau Alternate Form)
Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).
b.        Teknik Ulang (Test Re-test)
Disebut juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson.
Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.
Metode pengujian reliabilitas stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau wawancara. Misalnya the Minnesota Multiphasic Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang.
Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau putusdan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.
c.         Teknik Belah Dua (Split Halve Method)
Disebut juga tenik “single test single trial”. Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan dengan cara undian.
Menurut Saifuddin Azwar, realibilitas ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.
Ada beberapa sumber ketidakandalan (unreliability), beberapa di antaranya telah dituangkan. Satu sumber ketidakandalan yang terbesar adalah ketidaksahihan (invalidity). Berikut ini adalah daftar periksa (check list) sumber-sumber yang menyebabkannya (Walizer ,1987) :
1.        Orang atau unit yang diukur mungkin telah berubah sejak pengukuran pertama dan kedua. (Tentu saja perubahan dalam skor, haruslah ditafsirkan bukan sebagai ketidakandalan.)
2.        Selama wawancara unit yang sedang diukur berubah, karena:
a. Pewawancara memperoleh pengalaman
b. Kelelahan pewawancara
c. Subyek mengalami hal-hal yang menyebabkan penafsiran mereka terhadap pertanyaan-pertanyaan berubah (sebagai kebalikan dari perubahan seharusnya dari apa yang sedang diukur).
d. Kesalahan-kesalahan diperbuat.
3.        Aspek situasi tempat pengukuran berlangsung mungkin berubah sejak pengukuran pertama dan yang kedua. Hal-hal seperti waktu (pagi, siang, sore), tempat berlangsungnya pengukuran, orang-orang yang berada dekat di sekitar yang mungkin mempengaruhi respon mereka dan sebagainya mungkin berbeda.
4.        Pertanyaan-pertanyaan mungkin mendua artinya, sehingga ditafsirkan secara berbeda pada saat pengisian kuesioner yang berbeda.
5.        Pengkode dan/atau pengamat mungkin membuat penafsiran sendiri-sendiri.
6.        Apa yang nampak sebagai satu teknik ekivalen sebenarnya tidaklah demikian karena pemilihan pembandingan yang kurang baik.
7.        Terjadi kekeliruan dalam mencatat hasil pengamatan atau memberi kode-kodenya.
8.        Atau mungkin kombinasi penyebab-penyebab terdahulu.

III.   PENYUSUNAN KUESIONER
*      Kuesioner (Questionnaire) : merupakan alat/teknik untuk pengumpulan data yang dilakukan dengan cara mengajukan seperangkat pertanyaan atau pernyataan tertulis kepada responden untuk dijawabnya.
*      Manfaat/Kegunaan Kuesioner :
1.         Membantu petugas lapangan (interviewer) dalam pengumpulan data tentang hal-hal yang perlu ditanyakan kepada responden;
2.         Petugas lapangan bisa secara sistematis dan berurutan dalam mengajukan pertanyaan;
3.         Pertanyaan yang diajukan kepada responden oleh masing-masing petugas lapangan dapat diseragamkan, sehingga data yang diperoleh bisa diperbandingkan satu sama lainnya.
*      Prinsip Penyusunan Kuesioner :
1.         Prinsip Penulisan Kuesioner. :
a.         Isi dan tujuan pertanyaan harus relevan;
b.                  Bahasa yang digunakan mudah dipahami;
c.         Tipe / bentuk pertanyaan : terbuka/tertutup , positif/negatif ;
d.        Pertanyaan tidak boleh mendua (double barreled questions);
e.         Pertanyaan tidak menggiring responden;
f.         Tidak menanyakan hal-hal yang sudah lupa;
g.        Pertanyaan tidak panjang dan berbelit;
h.        Urutan pertanyaan dari hal yang umum menuju hal yang spesifik atau dari hal yang mudah menuju hal yang sulit;
i.          Gunakan teknik skala yang relevan , seperti : rating scale (graphic rating scales, itemized rating scale, comparative rating scale); attitude scale (likert, sistemtik differential).
2.         Prinsip Pengukuran :
Sebagai instrumen penelitian, maka sebelum kuesioner diberikan kepada responden harus diuji validitas dan reliabilitasnya terlebih dulu.
3.         Prinsip Penampilan Fisik :
Kuesioner perlu dirancang dan didesain lebih menarik agar responden senang dan serius dalam menjawab/mengisinya.
*        Langkah-langkah Penyusunan Kuesioner
1.         Menentukan Tujuan penelitian
Mendefinisikan permasalahan  penelitian dan tujuan khusus yang akan dicapai atau hipotesis yang akan diuji dengan kuesioner merupakan hal penting  untuk dipertimbangkan oleh seorang peneliti sebelum mengembangkan kuesioner, agar memperoleh hasil sesuai dengan yang diharapkan.
2.         Menentukan kelompok sampel
Setelah tujuan atau hipotesis telah dinyatakan secara jelas, target populasi dari mana sampel akan dipilih harus diidentifikasi. Jika peneliti tidak tidak memiliki pengetahuan mendalam tentang suatu situasi , maka akan terjadi kesalahan pengiriman kuesioner pada kelompok yang tidak memiliki informasi yang diminta. Contoh : seorang mahasiswa pasca sarjana ingin mencari data tentang kebijakan keuangan sekolah, kuesioner dikirim kepada kepala sekolah dari sekolah dasar sampai sekolah menengah. Banyak kuesioner yang dikembalikan tidak lengkap. Kuesioner ini gagal karena kepala sekolah yang menerima kuesioner tersebut memiliki sedikit pengetahuan tentang topik ini, sehingga mereka tidak mampu memberikan informasi yang diminta.
Arti-penting dari isi kuesioner kepada responden yaitu mempengaruhi baik ketepatan dari informasi yang diterima dan tingkat respon.
3.         Merancang kuesioner
Beberapa kuesioner penelitian dilemparkan bersama-sama dalam satu atau dua jam. Pengalaman mengembangkan beberapa kuesioner  serampangan sebagai pendekatan penelitian telah menyebabkan penerima kuesioner tersebut banyak bersikap negatif, kemudian memasukkan  dalam kotak sampah dengan sedikit lebih cepat. Anda akan perlu untuk mengatasi sikap negatif dengan konstruksi hati-hati dan administrasi dari kuesioner Anda.
*        Panduan untuk Merancang Kuesioner
1.        Menghindari kuesioner yang singkat.
2.        Jangan menggunakan istilah teknis, istilah khusus, atau istilah kompleks yang tidak dapat dipahami responden.
3.        Hindari menggunakan kata-kata pertanyaan atau daftar pada formulir Anda. Banyak orang yang bias terhadap istilah-istilah ini.
4.        Membuat kuesioner yang menarik dengan teknik seperti menggunakan tinta berwarna cerah atau kertas dan pencetakan laser.
5.        Mengatur item sehingga mudah dibaca dan lengkap.
6.        Nomor pada halaman kuesioner dan item.
7.        Masukkan nama dan alamat individu kepada siapa kuesioner harus dikembalikan baik pada awal dan akhir dari kuesioner, bahkan jika amplop ditujukan diri disertakan.
8.        Kalimat yang singkat, instruksi yang jelas, dicetak dalam huruf tebal dan huruf besar dan kecil (Kata-kata yang huruf kapital semua sulit untuk dibaca.)
9.        Mengatur kuesioner dalam urutan yang logis. Sebagai contoh, Anda mungkin kelompok item dengan konten yang sama atau item bersama-sama memiliki pilihan respon sama.
10.    Ketika pindah ke topik baru, termasuk sebuah kalimat transisi untuk membantu responden beralih melatih pemikiran mereka.
11.    Mulailah dengan item yang menarik dan tidak terlalu memojokkan.
12.    Kalimat yang sulit ditempatkan dibagian akhir kuesioner.
13.    Jangan menaruh item penting di akhir kuesioner panjang.
14.    Memberikan dasar pemikiran untuk item sehingga responden memahami relevansi mereka untuk penelitian.
15.    Sertakan contoh bagaimana merespon item yang mungkin membingungkan atau sulit dipahami.
16.    Hindari beberapa istilah seperti, kebanyakan, dan biasanya, yang tidak memiliki makna yang tepat.
17.    Setiap item dinyatakan sesingkat mungkin.
18.    Menghindari setiap pernyataan item negatif karena memungkinkan responden salah mengartikan. Kalimat negatif cenderung diabaikan, dan responden mungkin memberikan jawaban yang berlawanan dengan pendapat mereka yang sesungguhnya.
19.    Hindari "makna ganda" item seperti itu memerlukan subjek untuk merespon dua gagasan yang terpisah dengan jawaban tunggal. Sebagai contoh: Meskipun serikat buruh yang diinginkan dalam bidang lapangan, mereka tidak memiliki tempat dalam profesi mengajar.
20.    Ketika menggunakan pertanyaan umum bersamaan dengan pertanyaan khusus yang terkait, maka pertanyaan umum diajukan terlebih dahulu. Jika pertanyaan tertentu ditanyakan pertama, cenderung untuk mempersempit fokus responden saat menjawab pertanyaan umum yang berikut.
21.    Hindari bias atau pertanyaan terkemuka. Jika diberikan petunjuk pada responden untuk jenis jawaban yang lebih disukai, ada kecenderungan untuk memberikan respon.

Menurut Hamid Darmadi (2011), untuk memperoleh item kuesioner yang baik, peneliti hendaknya memperhatikan beberapa persyaratan lain dalam membuat kuesioner.
a.         Relevansi kuesioner: Relevansi pertanyaan dengan tujuan studi,  relevan pertanyaan dengan responden secara perorangan.
b.         Relevansi pertanyaan dengan studi: betul
c.         Relevansi pertanyaan dengan responden: betul.
4.         Anonimitas
Dalam kebanyakan studi pendidikan, responden diminta untuk mengidentifikasi diri, namun dapat terjadi anonimitas untuk itu diperlukan informasi personal yang sangat pribadi sesuai dengan yang diminta. Sebuah kuesioner berkaitan dengan perilaku seksual akan mendapatkan tanggapan lebih jujur ​​jika responden tetap anonim.
Masalah utama dengan kuesioner anonim yang dapat meningkatkan perbaikan tingkat pengembaliannya tidak mungkin. Ada beberapa solusi untuk masalah ini. Salah satunya adalah dengan membuat lembar pengkodean  yang berisi kode untuk setiap individu dalam sampel. Kode ini ditempatkan dalam kuesioner Ketika seorang individu mengembalikan kuesioner, peneliti dapat memeriksa dari nama orang itu pada lembar kode . Setelah periode waktu yang ditentukan, peneliti dapat menentukan individu yang belum mengembalikan kuesioner mereka dan mengirim mereka kuesioner baru.
Metode ini tidak sepenuhnya anonim, karena peneliti dapat menghubungkan kuesioner untuk nama individu dengan nama individu pada lembar kode master. Peneliti dapat mengirim kartu pos prabayar individu secara terpisah.
Individu yang telah menyelesaikan kuesionernya , ia mengembalikan kuesioner dan kartu posnya secara terpisah. Kartu pos memberi tahu peneliti bahwa individual tersebut telah menyelesaikan kuesionernya,  tetapi ia tidak tahu yang mana dari kuesioner yang dikembalikan milik individu tersebut.
5.         Bentuk Item
Menulis item untuk kuesioner mungkin tampak mudah, tetapi sebenarnya suatu bentuk seni. Anda harus mampu menulis secara ringkas dan jelas. Ini bukanlah hal yang mudah. Lebih penting lagi, diperlukan pemahaman yang baik tentang responden sehingga kita dapat menggunakan bahasa yang mereka mengerti, dan dapat memperoleh semua informasi yang dibutuhkan tanpa membuang waktu, dan agar item mendapatkan  respont secara  jujur.
Kesulitan utama dalam membangun item kuesioner adalah bahwa istilah pendidikan sering memiliki makna ganda. Untuk itu dianjurkan agar menyertakan definisi yang sesuai dengan tujuan penelitian.
Sebuah item kuesioner dapat berupa bentuk tertutup, yang berarti bahwa pertanyaan hanya memungkinkan respon yang pasti (mirip dengan pertanyaan pilihan ganda), atau bentuk terbuka, yang berarti bahwa responden dapat membuat respon mereka inginkan (mirip dengan pertanyaan esai).dengan bentuk yang digunakan ditentukan oleh obyektif dari sebuah pertanyaan.
Keuntungan dari merancang pertanyaan dalam bentuk tertutup adalah membuat kuantifikasi dan analisis hasil lebih mudah.
Untuk menentukan beberapa kategori yang digunakan dalam pertanyaan tertutup, dapat diberikan tes pertanyaan dalam bentuk terbuka dari sejumlah kecil responden. Jawaban mereka dapat digunakan untuk mengembangkan kategori untuk item bentuk tertutup. Jika Anda mendapatkan respon yang tidak biasa, "yang lain" bisa menyediakan pilihan yang lain.
6.         Mengukur Sikap/ Perilaku
Kuesioner biasanya berisi item yang masing-masing dapat memberi sedikit informasi yang berbeda. Akibatnya, setiap item adalah suatu uji yang cukup untuk memuaskan ketika Anda sedang mencari fakta spesifik, seperti jumlah tahun untuk pengalaman mengajar, jumlah kemenangan dan kerugian selama masa melatih bagi seorang pelatih sepak bola, atau proporsi siswa gagal aljabar menengah. Ketika pertanyaan menilai sikap, bagaimanapun, pendekatan uji untuk satu item dipertanyakan sehubungan dengan validitas dan reabilitas. Sebuah kuesioner yang mengukur sikap umumnya harus dibangun sebagai skala sikap dan harus menggunakan sejumlah besar item (biasanya minimal 10) untuk mendapatkan penilaian yang dapat diandalkan sikap individu.
Jika Anda ingin mengumpulkan informasi tentang sikap, Anda harus terlebih dahulu melakukan pencarian literatur penelitian untuk menentukan  skala yang cocok untuk tujuan Anda sudah telah dibangun. Jika skala yang sesuai tidak tersedia, Anda akan perlu mengembangkan satu Skala Likert, yang biasanya meminta tingkat perjanjian dengan sikap item (misalnya, skala lima poin mulai dari "sangat tidak setuju") adalah jenis umum dari skala sikap.
7.         Menguji cobakan kuesioner
Sebelum kuesioner disebarkan kepada responden, ujicobakanlah lebih dahulu kepada sejumlah kecil responden. Ini gunanya untuk mengetahui validitas dan reliabilitas alat ukur dimaksud. Selain itu, ini juga bisa digunakan untuk mengetahui kemungkinan diterima atau ditolaknya hipotesis yang telah dirumuskan. Selain itu, jika ternyata dalam uji coba ini terdapat banyak kesalahan, maka peneliti bisa mengubah atau menyempurkannya.
Untuk memperoleh kuesioner dengan hasil yang mantap adalah dengan ujicoba. Sampel yang diambil untuk keperluan ujicoba haruslah sampel dari populasi di mana sampel penelitian akan diambil. Dalam ujicoba, responden diberikan kesempatan untuk memberikan saran-saran perbaikan bagi kuesioner yang diujicobakan itu. Situasi ujicoba dilaksanakan harus sama dengan situasi kapan penelitian sesungguhnya akan dilaksnakan.
8.         Komunikasi  awal dengan sampel
Para peneliti menemukan bahwa menghubungi responden sebelum mengirim kuesioner akan meningkatkan tingkat respon. Kontak awal  yang dilakukan  peneliti mengidentifikasi diri, mendiskusikan tujuan penelitian, dan meminta kerjasama. Kontak awal dapat dilakukan melalui surat, kartu pos, atau panggilan telepon, tetapi beberapa bukti menunjukkan bahwa kontak telepon adalah yang paling efektif. 
9.         Menganalisis data kuesioner
Peneliti yang mempelajari penelitian kualitatif pembelajaran pada lembaga pendidikan tinggi di Amerika mengikuti pendekatan khusus untuk menganalisis data kuesioner.
Semua jawaban (pilihan) diberi kode dan dimasukkan ke dalam program analisis ecstatic untuk data kualitatif. Prosedur ini memudahkan penentuan prosentase, mean (rata-rata), range dan tabulasi silang. Semua komentar dan jawaban tertutup dimasukkan seluruhnya ke dalam analisis teks ethnograf yang memudahkan pengkodean dan pemilihan kata-kata responden sehingga polanya dapat dipastikan.
Data kuantitatif dianalisa untuk menghasilkan frekuensi dan prosentase dari pengecekan setiap kategori jawaban pada pertanyaan tertutup tertentu.
Pada umumnya diasumsikan bahwa kuesioner dan interview yang sesuai atau paling sesuai untuk riset deskriptif , kenyataanya kuesioner dan interview dapat digunakan untuk berbagai disain riset.
Glesne dan web menyertakan beberapa komentar dari responden dalam merespon pertanyaan. Dengan cara ini pembaca mendapatkan gambaran  perspektif emic yaitu perspektif para responden terhadap fenomena yang sedang dipelajari. Contohnya disertakan komentar dari responden tentang pertanyaan terbuka mengenai ketertarikan mereka terhadap pengajaran kursus metode riset kualitatif.
Data kuantitatif yang dikumpulkan melalui kuesioner dapat dianalisa dengan metoda statistik  (menggunakan bantuan komputer dengan software program SPSS for window s versi 10) untuk data kuantitatif, sedang data kualitatif  menggunakan  tiga jalur analisis  yaitu reduksi data, penyajian data dan penarikan kesimpulan


REFERENSI :
Arifin zainal. 2011. Evaluasi Pembelajaran. Bandung: PT Remaja Rosdakarya.
Suprananto, Kusaeri. 2012. Pengukuran dan Penilaian Pendidikan. Yogyakarta: Graha Ilmu.
Widoyoko Putro,Eko. 2012. Evaluai Program Pembelajaran. Yogyakarta: Pustaka Pelajar.
Hayati, Mimin. 2007. Teknik dan Penilaian pada tingkat satuan pendidikan. Jakarta: Gaung  persada press.
Arikuto,S & Jabar. 2004. Evaluasi Pendidikan. Jakarta: Bumi Aksara

3 komentar: