MACAM-MACAM
SKALA PENGUKURAN
Disusun
untuk memenuhi salah satu tugas mata kuliah “Evaluasi Proses dan Hasil Belajar
Biologi” yang diampu oleh Ibu Diah Ika Putri, S.Pd.
Disusun
Oleh :
GINA FAUZIAH
11541090
PROGRAM
STUDI PENDIDIKAN BIOLOGI S-1
SEKOLAH
TINGGI KEGURUAN DAN ILMU PENDIDIKAN
STKIP-GARUT
2013
I.
MACAM-MACAM SKALA PENGUKURAN
Skala
pengukuran merupakan kesepakatan yang digunakan sebagai acuan untuk menentukan
panjang pendeknya interval yang ada dalam alat ukur, sehingga alat ukur
tersebut bila digunakan dalam penelitian akan menghasilkan data kuantitatif.
Dengan skala pengukuran ini, maka variabel yang akan diukur dengan instrumen
tertentu dapat dinyatakan dalam bentuk angka, sehingga akan lebih akurat,
efisien dan komunikatif.
- Pengukuran adalah penetapan atau pemberian angka terhadap objek atau fenomena menurut aturan tertentu (Stevens, 1951). Angka merupakan arti kuantitatif dari pengukuran, dapat memberikan indikator tertentu kepada sifat objek yang diteliti.Contohnya adalah jika indikator nilai mata kuliah B diberikan untuk mahasiswa yang mendapat nilai 60 – 75, dan A untuk mahasiswa yang berhasil mendapatkan nilai > 75.
- Pengukuran terkait dengan aturan yang dapat didefinisikan, misalnya kita katakan aturan yang terdapat dalam skala likert yang memberikan nilai 1 hingga 4 dengan kategori tidak setuju – kurang setuju – ragu-ragu – setuju. Aturan ini dapat diterjemahkan menjadi; jika objek setuju, berikan angka 4, dan jika tidak setuju berikan angka 1, serta jika ragu-ragu berikan angka 3.
*
Secara
umum ada empat jenis
ukuran atau yang biasa disebut skala dalam statistik antara lain:
1.
Skala
Nominal : Skala
pengukuran nominal digunakan untuk mengklasifikasikan obyek, individual atau
kelompok. Sebagai contoh pengklasifikasi jenis kelamin, agama, pekerjaan, dan
area geografis. Dalam mengidentifikasi hal-hal diatas digunakan angka-angka
sebagai symbol. Contohnya : jenis kelamin rsponden, laki-laki = 1, dan wanita =
2.
2.
Skala Ordinal : Skala pengukuran ordinal memberikan
informasi tentang jumlah relatif karakteristik yang berbeda yang dimiliki
oleh obyek atau indvidu tertentu. Tingkat pengukuran ini mempunyai informasi
skala nominal ditambah dengan sarana peringkat relative tertentu yang
memberikan informasi apakah suatu obyek memiliki karakteristik yang lebih atau
kurang tetapi bukan berapa banyak kekurangannya atau kelebihannya.
Skala pengukuran yang meyatakan kategori sekaligus
melakukan rangking terhadap kategori. Contoh : kita ingin mengukur preferensi
responden terhadap empat merek produk air mineral.
Merek
Air
Mineral
Ranking
Aquana 1
Aquaria 2
Aquasan 3
Aquasi 4
Aquana 1
Aquaria 2
Aquasan 3
Aquasi 4
3.
Skala Interval : Skala interval mempunyai
karakteristik seperti yang dimiliki oleh skala nominal dan skala ordinal dengan
ditambah karakteristik lain, yaitu berupa adanya interval yang tetap. Dengan
demikian peneliti dapat melihat besarnya perbedaan karakteristik antara satu
individu atau obyek dengan lainnya.
4.
Skala Rasio : Skala pengukuran ratio mempunyai
semua karakteristik yang dipunyai oleh skala nominal, ordinal, dan interval
dengan kelebihan skala ini mempunyai nilai 0 (nol) empiris absolut. Nilai
absolut nol tersebut terjadi pada saat ketidak hadirannya suatu karakteristik
yang sedang diukur. Pengukuran ratio biasanya dalam bentuk perbandingan antara
satu individu atau obyek tertentu dengan lainnya.
Selain
skala yang diatas ada juga berbagai skala yang dapat digunakan untuk mengukur
gejala/fenomena sosial atau sering disebut skala sikap. Ada empat jenis skala
pengukuran sikap menurut Daniel J Mueller (1992), yaitu:
1.
Skala Likert
Skala Likert
digunakan untuk mengukur sikap, pendapat dan persepsi seseorang atau sekelompok
orang tentang fenomena sosial. Dengan skala Likert, maka variabel yang akan
diukur dijabarkan menjadi indikator variabel. Kemudian indikator tersebut
dijadikan sebagai titik tolak untuk menyusun item-item instrument yang dapat
berupa pernyataan atau pertanyaan. Jawaban setiap item instrumen yang
menggunakan skala
Likert
mempunyai gradasi dari sangat positif sampai sangat negatif, yang dapat berupa
kata-kata antara lain:
1. Sangat
setuju
|
1. Sering
|
1. Sangat
positif
|
2. Setuju
|
2. Kadang-kadang
|
2. Positif
|
3. Ragu-ragu
|
3. Tidak
pernah
|
3. Negatif
|
4.
Tidak setuju
|
|
4.
Sangat negatif
|
5.
Sangat tidak setuju
|
|
5.
Sangat baik
|
|
|
6.
Baik
|
|
|
7.
Tidak baik
|
|
|
8.
Sangat tidak baik
|
Untuk keperluan analisis kuantitatif, maka jawaban itu
dapat diberi skor, misalnya:
1.
Setuju/ selalu/ sangat positif diberi skor
5
2.
Setuju/ sering/ positif diberi
skor
4
3.
Ragu-ragu/ kadang-kadang/ netral diberi
skor
3
4.
Tidak setuju/ hampir tidak pernah/ negatif diberi
skor 2
5.
Sangat tidak stuju/ tidak pernah/ diberi
skor
1
Instrumen penelitian yang menggunakan skala Likert
dapat dibuat dalam bentuk checklist ataupun pilihan ganda.
- Contoh Bentuk Checklist
Berilah
jawaban pernyataan berikut sesuai dengan pendapat anda, dengan cara memeberi tanda
(√) pada kolom yang tersedia.
No.
|
Pertanyaan
|
Jawaban
|
||||
SS
|
ST
|
RG
|
TS
|
STS
|
||
1
2
|
Sekolah ini akan menggunakn teknologi informasi
dalam pelayanaan administrasi dan akademik
…………………………………
|
|
√
|
|
|
|
SS = Sangat
Setuju
diberi skor 5
ST =
Setuju
diberi skor 4
RG =
Ragu-Ragu
diberi skor 3
TS = Tidak
setuju
diberi skor 2
STS = Sangat Tidak
Setuju diberi
skor 1
2.
Contoh
bentuk plihan ganda
Berilah
salah satu jawaban terhadap pertanyaan berikut sesua dengan pendapat anda,
dengan cara member tanda lingkaran nomor jawaban yang tersedia.
Kurikulum baru tu akan segera diterapkan
di lembagaan pendidikan anda?
a.
Sangat tidak setuju
b.
Tidak setuju
c.
Ragu-ragu/ netral
d.
Setuju
e.
Sangat setuju
Dengan
bentuk pilihan ganda itu, maka jawaban dapat diletakkan pada tempat yang
berbeda-beda.
Dalam
penyusunan instrument untuk variabel tertentu sebaiknya butir-butir pertanyaan
dibuat dalam bentuk kalimat positif netral atau negatif, sehungga responden
dapat mejawa dengan serius dan konsisten. Dengan cara demikian maka
kecenderungan responden untuk menjawab pada kolom tertent dari bentuk checklist
dapat dikurangi. Dengan model ini juga responden akan selalu membaca pertanyaan
setiap instrument dan juga jawabannya. Pada bentuk checklist sering jawaban
tidak dibaca, karena letak jawabanna sudah menentu. Tetapi dengan bentuk
checklis, maka akan didapat keuntungan dalam hal ini sangat singkat dalam
pembuatannya, hemat kertas, mudah mentabulasikan data, dan secara visual lebih
menarik. Data yang diperoleh dari skala tersebut adalah berupa data
internal.
Skala Likert
digunakan untuk mengukur sikap, pendapat, dan persepsi seseorang atau
sekelompok orang tentang fenomena sosial. Sedangkan pada evaluasi, skala likert
digunakan untuk:
·
Menilai keberhasilan suatu kebijakan atau program
·
Menilai manfaat pelaksanaan suatu kebijakan atau
program
·
Mengetahui kepuasan stakeholder terhadap pelaksanaan
suatu kebijakan atau program
·
dll
*
Kelebihan:
·
Mudah dibuat dan di terapkan.
·
Terdapat kebebasan dalam memasukan pertanyaan-
pertanyaan, asalkan sesuai dengan konteks permasalahan.
·
Jawaban suatu item dapt berupa alternative, sehingga
informasi mengenai item tersebut diperjelas.
·
Reliabilitas pengukuran bisa diperoleh dengan jumlah
item tersebut diperjelas
*
Kekurangan:
·
Karena ukuran yang digunakan adalah ukuran ordinal,
skala Likert hanya dapat mengurutkan individu dalam skala, tetapi tidak dapat
membandingkan berapa kali satu individu lebih baik dari individu yang lain.
·
Kadangkala total skor dari individu tidak memberikan
arti yang jelas, karena banyak pola respons terhadap beberapa item akan
memberikan skor yang sama. Adanya kelemahan di atas sebenarnya dapat dipikirkan
sebagai error dari respons yang terjadi
*
Prosedur dalam membuat skala Likert adalah sebagai
berikut:
1. Peneliti mengumpulkan bahan-bahan yang relevant
dengan masalah yang sedang diteliti
2. Menyusun Blue Print untuk memandu penyusunan alat ukur
3. Membuat item-item yang akan diuji sesuai dengan panduanUji coba item kepada sekelompok
responden yang cukup representatif dari populasi yang ingin diteliti. Responden
di atas diminta untuk mengecek tiap item, apakah ia menyenangi (+) atau tidak
menyukainya (-). Respons tersebut dikumpulkan dan jawaban yang memberikan
indikasi menyenangi diberi skor tertinggi. Tidak ada masalah untuk memberikan
angka 5 untuk yang tertinggi dan skor 1 untuk yang terendah atau sebaliknya.
Yang penting adalah konsistensi dari arah sikap yang diperlihatkan. Demikian
juga apakah jawaban “setuju” atau “tidak setuju” disebut yang disenangi,
tergantung dari isi pertanyaan dan isi dari item-item yang disusun.
4. Setelah item
di uji coba kepada responden, lalu diuji tingkat validitas dan reabilitas dari item-item tersebut.
Validitas adalah suatu ukuran yang menunjukkan tingkatan kevalidan atau kesa
hihan suatu instrumen sedangkan reliabilitas merupakan penilaian tingkat
konsistensi terhadap hasil pengukuran bila dilakukan multiple measurement pada
sebuah variabel suatu alat ukur dikatakan reliabel jika alat ukur tidak
berubah.
*
Uji Validitas
Uji
validitas dilakukan dengan metode Pearson yaitu dengan mengkorelasikan skor
item kuesioner dengan skor totalnya. Langkah-langkah pelaksanaannya adalah
sebagai berikut:
·
Menghitung dan menjumlahkan skor tiap subyek
·
Mengkorelasikan skor tiap-tiap item dengan skor total
yang diperoleh setiap subyek
·
Nilai r hitung dibandingkan dengan r tabel. Pilihlah
item yang r hitungnya positif dan lebih besar dari r tabel
·
Biasanya dapat juga menggunakan patokan r minimal 0,3
·
Buang item yang r hitungnya kurang dari r tabel atau
kurang dari 0,3 dan hitung kembali korelasinya hingga r hitung semua item lebih
dari r tabel atau lebih dari 0,3
·
Item yang memiliki nilai r hitung >0,3 maka item
tersebut dinyatakan valid
*
Uji Reabilitas
Metode yang
dapat digunakan pada uji reabilitas adalah metode Croncbach’s Alpha. Penghitungan
Cronbach’s Alpha dilakukan dengan menghitung rata-rata interkorelasi
diantara butir-butir pernyataan dalam kuesioner. Variabel dinyatakan reliabel
jika alphanya lebih dari 0,3.
5.
Setelah item terpilih didapatkan, maka langkah
selanjutnya adalah penskalaan respon.
Penskalaan respon merupakan prosedur penempatan sejumlah alternatif respon tiap
item pada suatu kontinum kuantitatif sehingga didapatkan angka sebagai skor
masing-masing alternatif respon
6.
Teknik Skoring
Setelah
nilai tiap faktor diketahui maka dilakukan teknik skoring. Teknik skoring
dilakukan untuk memperoleh data kuantitatif. Tahapan dalam terbagi menjadi 4
tahap yaitu :
1.
Pentabulasian hasil kuesioner yang telah diuji
validitas dan reliabilitasnya.
2.
Penyesuaian nilai dari tiap-tiap faktor dengan skala
pengukuran likert yang digunakan.
3.
Menghitung nilai indeks dari tiap-tiap faktor, dengan
cara masing-masing jawaban dikalikan dengan bobot/skoring jawabannya.
4.
Hasil skoring dikembalikan lagi pada nilai skala
respon untuk menghasilkan interpretasi
Skala likert hanya salah satu teknik
dalam evaluasi perencanaan dan masih banyak lagi teknik analisa yang dapat
dipergunakan.
3.
Skala
Guttman
Skala
pengkuran dengan tipe ini, akan didapat jawaban yang tegas, yaitu “ya-tidak”,
“benar-salah”, “penah-tidak pernah”, positif-negatif” dan lain-lain. Data yang
diperboleh dapat berupa data interval atau rasio dikhotomi (dua alteratif).
Jadi kalau pada skala Likert terdapat 3, 4, 5, 6, 7 interval dri kata “sangat
setuju” sampai “sangat tidak setuju”maka pada dalam skala Guttman hanya ada dua
interval yaitu “setuju”atau “tidak setuju”.
Contoh:
1) Bagaimana pendapat
anda, bila orang itu menjabat Kepala sekolah disini?
1.
Setuju
2.
Tidak setuju
2) Pernakah Penilik
Sekolah melakukan pemeriksaan di ruang kelas anda?
1.
Tidak pernah
2.
Pernah
Skala Guttman selai dapat dibuat
dalam bentuk pilihan ganda, juga dapat dibuat dalam bentuk checklist. Jawaban
yang dapat diskor tertinggi satu dan terendah nol.
3.
Semantic
Defferensial
Skala
pegukuran yang berbenuk semantic defferensial di kembangkan oleh Osgood. Skala
ini juga digunakan untuk mengukur sikap, hanya bentuknya tidak pilihan ganda
maupun checklist, tetapi tersusun dalam satu garis kontinum yang jawaban
“sangat positifnya”, terletak dibagian kanan garis, dan jawaban yang “sangat
negatif” terletak di bagian kiri garis atau sebaliknya. Data yang diperoleh
adalah data interval, dan biasanya skala ini digunakan untuk mengukur
sikap/ karakteristik tertentu yang dipunyai oleh seseorang. Contoh:
Mohon diberi nilai gaya
kepemimpinan Kepala Sekolah
|
Bersahabat
5
4
3 2
1 Tidak bersahabat
Tepat
janji
5
4
3 2
1 Lupa janji
Bersaudara
5
4
3 2
1 Memusuhi
Memberi pujian
5
4
3
2
1 Mencela
Mempercayai
5
4
3
2
1 Mendominasi
Responden dapat memberi jawaban,
pada rentang jawaban yang positif sampai negatif. Responden yang member
penilaian pada angka 5 berarti menilai Kepala Sekolah sangat negatif dan
sebaliknya.
4.
Rating Scale
Dari ketiga
skala pengukuran seperti yang telah dikemukaan data yang diperoleh semuanya
adalah data kualitatif yang kemudian dikuantitatifkan. Tetapi dengan
rating-scale data mentah yang diperoleh berupa angka kemudan ditafsirkan dalam
pengertian kualitatif.
Responden
menjawab, senang atau tidak senang, setuju atau tidak setuju, penah-tidak
pernah adalah merupakan data kualitatif. Dalam skala model rating scale,
responden tidak akan menjawab salah satu jawaban kuantitatif yang telah
disedikan.Oleh karena itu rating scale ini lebih fleksibel, tidak terbatas
untuk pengukuran sikap saja tetapi untuk mengukur status sosial ekonomi,
kelembagaan, pengetahuan, kemampuan, proses kegiatan, dan lain-lain.
Yang penting
bagi penyusunan instrument dengan rating scale adalah harus dapat mengartikan
setiap angka yang diberikan pada alternative jawaban setiap item instrument.
Data dari
pengukuran skilap dengan skala sikap adalah bentuk dari tada interval, demikian
juga dalam pengukuran tata ruang. Tetapi data hasil dari pengukuran penambahan
pengetahuan seperti tersebut diatas akan menghasilkan ratio.
*
* *
Jenis Rating Scale
Ada beberapa
jenis skala rating yang dapat digunakan, yaitu :
a.
Skala grafis
Menggunakan garis lurus horizontal ataupun kadang
vertikal dalam penyajiannya. Misalnya :
b. Skala Numeris
Angka dalam kebanyakan skala rating digunakan sebagai
anchor, tetapi penggunaan angka ini harus didefinisikan secara jelas. Di depan
ataupun di belakang setiap deskripsi disediakan ruang untuk membubuhkan tanda
(biasanya tanda √) yang
menunjukkan kesesuaiannya dengan subjek yang diamati. Bentuk numeris ini kadang
disertai bentuk grafis, sehingga observer atau rater hanya menandai angka yang
menjadi pilihannya. Misalnya
skala enam jenjang utk mengukur orientasi pelayanan pelanggan :
Atau :
1.
Bagaimanakah partisipasi peserta didik dalam diskusi kelas? 1
2 3 4 5
2.
Bagaimanakah hubungan peserta didik dengan kelompoknya? 1 2 3 4 5
Catatan:
1 = tidak
memuaskan
2 = di bawah
rata-rata.
3 =
rata-rata
4 = di atas
rata-rata
5 = sempurna
c. Standard Rating
Bentuk rating ini sering juga
disebut sebagai skala presentase. Anchor presentase meminta observer merating
subjek ke dalam suatu kontinum yang bergerak dari 0 s/d 100, dalam perbandingan
dengan subjek amatan lain atau kelompok khusus. Misalnya mengukur interpersonal
persuasiveness ability :
d. Cumulated Points Rating
Aitem yang disusun merupakan
indikator suatu trait yang akan diukur. Skor akhir skala merupakan penjumlahan
kelseluruhan aitem. Misalnya, bagaimana seorang pemilik toko mengobservasi
kemampuan pegawainya dalam memberikan pelayanan pada konsumen :
e. Force Choice Rating
Bentuk ini biasanya digunakan dalam
bidang militer atau bisnis. Observer diminta memilih kalimat yang menggambarkan
kondisi subjek amatan. Misalnya:
f. Semantic Differential
Skala ini menggunakan pasangan kata
sifat yang berlawanan dalam memberikan rating. Secara ringkas penyusunan skala
sbb :
º Pilih suatu
konsep yang akan diamati
º Tentukan
pasangan kata sifat yang akan digunakan
º Susun kutub
pasangan kata tersebut secara random
Misalnya :
*
*
Kelebihan Rating Scale
-
Mudah penggunaannya.
-
Dapat mengetahui intensitas dan gambaran keadaan suatu
perilaku/kejadian.
-
Dapat digunakan untuk mengkonfirmasikan antara
realitas dengan persepsi subjektif rater.
*
Kekurangan Rating Scale
Observer
dapat melakukan kesalahan dalam membuat kesimpulan, antara lain :
º Error of
leniency : terlalu longgar
º Error of
central tendency : cenderung ke pusat skala
º Hallo effect
: terkesan hal umum
º Error of
logic : cenderung sama karena dianggap berhubungan
º Error of
contast : memiliki dua arah
º Ketidakjelasan
dalam penggunaan istilah
º Social
desirability effect : secara sosial lebih diterima
º Skala rating
tidak memberi informasi sebab terjadinya perilaku
º The
generosity effect : terjadi ketika ragu-ragu
º Carry over
effect : tidak memisahkan gejala
5.
Skala
Thurstone
Skala Thurstone adalah skala yang disusun dengan
memilih butir yangberbentuk skala interval. Setiap butir memiliki kunci skor
dan jika diurut, kunciskor menghasilkan nilai yang berjarak sama. Skala
Thurstone dibuat dalambentuk sejumlah (40-50) pernyataan yang relevan dengan
variabel yang hendak diukur kemudian sejumlah ahli (20-40) orang menilai
relevansi pernyataan itudengan konten atau
konstruk yang hendak diukur. Adapun contoh skalapenilaian model
Thurstone adalah seperti gambar di bawah ini.Nilai 1 pada skala di atas
menyatakan sangat tidak relevan, sedangkan nilai 11menyatakan sangat relevan.
II. VALIDITAS DAN REABILITAS
A.
Validitas
1.
Pengertian
Validitas
*
Menurut Azwar (1986) Validitas berasal
dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan
suatu alat ukur dalam melakukan fungsi ukurnya.
Suatu skala atau instrumen pengukur
dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut
menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan
maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas
rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
* Pengertian
validitas menurut Walizer (1987) adalah tingkaat kesesuaian antara suatu
batasan konseptual yang diberikan dengan bantuan operasional yang telah
dikembangkan.
* Menurut
Aritonang R. (2007) validitas suatu instrumen berkaitan dengan kemampuan
instrument itu untuk mengukur atu mengungkap karakteristik dari variabel yang
dimaksudkan untuk diukur. Instrumen yang dimaksudkan untuk mengukur sikap
konsumen terhadap suatu iklan, misalnya, harus dapat menghasilkan skor sikap
yang memang menunjukkan sikap konsumen terhadap iklan tersebut. Jadi, jangan
sampai hasil yang diperoleh adalah skor yang menunjukkan minat konsumen
terhadap iklan itu.
Validitas suatu instrumen banyak
dijelaskan dalam konteks penelitian sosial yang variabelnya tidak dapat diamati
secara langsung, seperti sikap, minat, persepsi, motivasi, dan lain sebagainya.
Untuk mengukur variabel yang demikian sulit, untuk mengembangkan instrumen yang
memiliki validitas yang tinggi karena karakteristik yang akan diukur dari
variabel yang demikian tidak dapat diobservasi secara langsung, tetapi hanya
melalui indikator (petunjuk tak langsung) tertentu. (Aritonang R. 2007)
* Menurut
Masri Singarimbun, validitas menunjukkan sejauh mana suatu alat pengukur itu
mengukur apa yang ingin diukur. Bila seseorang ingin mengukur berat suatu
benda, maka dia harus menggunakan timbangan. Timbangan adalah alat pengukur
yang valid bila dipakai untuk mengukur berat, karena timbangan memang mengukur
berat. Bila panjang sesuatu benda yang ingin diukur, maka dia harus menggunakan
meteran. Meteran adalah alat pengukur yang valid bila digunakan untuk mengukur
panjang, karena memang meteran mengukur panjang. Tetapi timbangan bukanlah alat
pengukur yang valid bilamana digunakan untuk mengukur panjang.
Sekiranya penelliti menggunakan
kuesioner di dalam pengumpulan data penelitian, maka kuesioner yang disusunnya
harus mengukur apa yang ingin diukurnya. Setelah kuesioner tersebut tersusun
dan teruji validitasnya, dalam praktek belum tentu data yang dikumpulkan adalah
data yang valid. Banyak hal-hal lain yang akan mengurangi validitas data;
misalnya apakah si pewawancara yang mengumpulkan data betul-betul mengikuti
petunjuk yang telah ditetapkan dalam kuesioner. (Masri Singarimbun)
* Menurut
Suharsimi Arikunto, validitas adalah keadaan yang menggambarkan tingkat
instrumen bersangkutan yang mampu mengukur apa yang akan diukur.
* Menurut
Soetarlinah Sukadji, validitas adalah derajat yang menyatakan suatu tes
mengukur apa yang seharusnya diukur. Validitas suatu tes tidak begitu saja
melekat pada tes itu sendiri, tapi tergantung penggunaan dan subyeknya.
2.
Jenis-jenis
Validitas
Ebel (dalam Nazirz 1988) membagi validitas menjadi :
·
Concurrent Validity adalah validitas
yang berkenaan dengan hubungan antara skor dengan kinerja.
·
Construct Validity adalah validitas yang
berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu
pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat
menyebabkan kinerja yang baik dalam pengukuran.
·
Face Validity adalah validitas yang
berhuubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang
seharusnya hendak diukur.
·
Factorial Validity dari sebuah alat ukur
adalah korelasi antara alat ukur dengan faktor-faktor yang bersamaan dalam
suatu kelompok atau ukuran-ukuran perilaku lainnya, di mana validitas ini
diperoleh dengan menggunakan teknik analisis faktor.
·
Empirical Validity adalah validitas yang
berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut
adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
·
Intrinsic Validity adalah validitas yang
berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif
dan objektif untuk mendukung bhwa suatu alat ukur benar-benar mengukur apa yang
seharusny diukur.
·
Predictive Validity adalah validitas
yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerj
seorang di msa mendatang.
·
Content Validity adalah validitas yang
berkenaan dengan baik buruknya sampling dari suatu populasi.
·
Curricular Validity adalah validitas
yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa
jauh pungukuran tersebut merupakan alat ukur yang benar-benar mengukur
aspek-aspek sesuai dengan tujuan instruksional.
Kerlinger
(1990) membagi validitas menjadi tiga yaitu:
·
Content validity (Validitas isi) adalah
validitas yang diperhitungkan melalui pengujian terhadap isi alat ukur dengan
analisis rasional. Pertanyaan yang dicari jawabannya dalam validitas ini adalah
“sejauh mana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi
objek yang hendak diukur oleh alat ukur yang bersangkutan?” atau berhubungan
dengan representasi dari keseluruhan kawasan.
Validitas isi suatu instrumen
berkaitan dengan kesesuaian antara karakteristik dari variaabel yang dirumuskan
pada definisi konseptual dan operasionalnya. Apabila semua karakteristik
variabel yang dirumuskan pada definisi konseptualnya dapat diungkap melalui
butir-butir suatu instrument, maka instrument itu dinyatakan memiliki validitas
isi yang baik.
Validitas isi dapat dianalisis
dengan cara memperhatikan penampakan luar dari instrument dan dengan
menganalisis kesesuaian butir-butirnya dengan karakteristik yang dirumuskan
pada definisi konseptual variabel yang diukur. Validitas yang dianalisis dengan
memperhatikan penampilan luar instrument itu disebut validitas tampang (face
validity). Validitas tampang dievaluasi dengan membaca dan menyelidiki
butir-butir instrument serta sekaligus membandingkannya dengan definisi
konseptual mengenai variabel yang akan diukur. Validitas yang dianalisis dengan
memperhatikan kerepresentativan butir-butir instrument disebut validitas
penyampelan (sampling validity) atau kuikulum (curriculum validity).
Validitas tampang maupun
penyampelan disebut juga sebagai validitas teoritis karena penganalisisannya
lazim dilakukan tanpa didasarkan pada data empiris. Alat yang digunakan untuk
menganalisis validitas itu adalah logika dari orang yang menganalisisnya.
·
Construct validity (Validitas konstruk)
adalah tipe validitas yang menunjukkan sejauh mana alat ukur mengungkap suatu
trait atau konstruk teoritis yang hendak diukurnya. (Allen & Yen, dalam
Azwar 1986).
Pengujian validitas konstruk merupakan prosesyang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur.
Pengujian validitas konstruk merupakan prosesyang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur.
Menurut Saifuddin Azwar, validitas
konstruk adalah seberapa besar derajat tes mengukur hipotesis yang dikehendaki
untuk diukur. Konstruk adalah perangai yang tidak dapat diamati, yang
menjelaskan perilaku. Menguji validitas konstruk mencakup uji hipotesis yang
dideduksi dari suatu teori yang mengajukan konstruk tersebut.
·
Criterion-related validity (Validitas
berdasar kriteria). Validitas ini menghendaki tersedianya criteria eksternal
yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah
variabel perilaku yang akan diprediksi oleh skor alat ukur.
Dilihat dari segi waktu untuk
memperoleh skor kriterianya, prosedur validasi berdasar kriteria menghasilkan
dua macam validitas (Saifuddinn Azwar), yaitu:
1. Validitas
Prediktif.
Validitas Prediktif sangat penting
artinya bila alat ukur dimaksudkan untuk berfungsi sebagai predictor bagi
kinerja di masa yang akan datang. Contoh situasi yang menghendaki adanya
prediksi kinerja ini antara lain adalah dalam bimbingan karir; seleksi
mahasiswa baru, penempatan karyawan, dan semacamnya.
Menurut Saifuddin Azwar, validitas
prediktif adalah seberapa besar derajat tes berhasil memprediksi kesuksesan
seseorang pada situasi yang akan datang. Validitas prediktif ditentukan dengan
mengungkapkan hubungan antara skor tes dengan hasil tes atau ukuran lain
kesuksesan dalam satu situasi sasaran.
2. Validitas
Konkuren.
Apabila skor alat ukur dan skor
kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua
skor termaksud merupakan koefisien validitas konkuren.
Menurut Saifuddin Azwar, validitas
ini menunjukkan seberapa besar derajat skor tes berkorelasi dengan skor yang
diperoleh dari tes lain yang sudah mantap, bila disajikan pada saat yang sama,
atau dibandingkan dengan criteria lain yang valid yang diperoleh pada saat yang
sama.
B.
Reliabilitas
1.
Pengertian
Reliabilitas
·
Walizer (1987) menyebutkan pengertian
Reliability (Reliabilitas) adalah keajegan pengukuran.
·
Menurut John M. Echols dan Hasan Shadily
(2003: 475) reliabilitas adalah hal yang dapat dipercaya. Popham (1995: 21)
menyatakan bahwa reliabilitas adalah "...the degree of which test score are
free from error measurement".
·
Menurut Masri Singarimbun, realibilitas
adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau
dapat diandalkan. Bila suatu alat pengukur dipakai dua kali – untuk mengukur
gejala yang sama dan hasil pengukuran yang diperoleh relative konsisten, maka
alat pengukur tersebut reliable. Dengan kata lain, realibitas menunjukkan
konsistensi suatu alat pengukur di dalam pengukur gejala yang sama.
·
Menurut Brennan (2001: 295) reliabilitas
merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes.
·
Menurut Sumadi Suryabrata (2004: 28)
reliabilitas menunjukkan sejauhmana hasil pengukuran dengan alat tersebut dapat
dipercaya. Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat
konsistensi dan kemantapan.
·
Dalam pandangan Aiken (1987: 42) sebuah
tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama
meskipun dilakukan pengukuran berulang-ulang.
Reliabilitas,
atau keandalan, adalah konsistensi dari serangkaian pengukuran atau serangkaian
alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes
dengan tes ulang) akan memberikan hasil yang sama, atau untuk pengukuran yang
lebih subjektif, apakah dua orang penilai memberikan skor yang mirip
(reliabilitas antar penilai). Reliabilitas tidak sama dengan validitas. Artinya
pengukuran yang dapat diandalkan akan mengukur secara konsisten, tapi belum
tentu mengukur apa yang seharusnya diukur.
Dalam
penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap
konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi
yang sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang
konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran
yang berulang itu memberikan hasil yang berbeda-beda.
Reliabilitas
alat ukur tidak dapat diketahui dengan pasti tetapi dapat diperkirakan. Dalam
mengestimasi reliabilitas alat ukur, ada tiga cara yang sering digunakan yaitu
:
(1)
pendekatan tes ulang,
(2)
pendekatan dengan tes pararel, dan
(3)
pendekatan satu kali pengukuran.
Pendekatan
tes ulang merupakan pemberian perangkat tes yang sama terhadap sekelompok
subjek sebanyak dua kali dengan selang waktu yang berbeda. Asumsinya adalah
bahwa skor yang dihasilkan oleh tes yang sama akan menghasilkan skor tampak yang
relatif sama. Estimasi dengan pendekatan tes ulang akan menghasilkan koefisien
stabilitas. Untuk memperoleh koefisien reliabilitas melalui pendekatan tes
ulang dapat dilakukan dengan menghitung koefisien korelasi linear antara
distribusi skor subyek pada pemberian tes pertama dengan skor subyek pada
pemberian tes kedua. Pendekatan tes ulang sangat sesuai untuk mengukur
ketrampilan terutama ketrampilan fisik.
2. Jenis-jenis Reliabilitas
Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:
Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:
1.
Relibilitas stabilitas. Menyangkut usaha
memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap unit yang
diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan
indicator yang sama, definisi operasional, dan prosedur pengumpulan data setiap
saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh
reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau
hampir sama.
2.
Reliabilitas ekivalen. Menyangkut usaha
memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada waktu
yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih
indicator yang berbeda, batasan-batasan operasional, paeralatan pengumpulan
data, dan / atau pengamat-pengamat.
Menguji reliabilitas dengan
menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk.
Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali
dipakai dalam survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable
dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua
bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan
untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas
ke dalam skor, lalu skor masing-masing bagian tersebiut dibandingkan. Apabila
dalam skor kemudian skor masing-masing bagian tersebut dibandingkan. Apabila
kedua skor itu relatif sama, dicapailah reliabilitas belah tengah.
Reliabilitas ekivalen dapat juga
diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya,
telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam
ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak
cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan
kecermatan relatif yang sama bila tekanan darahnya yang diukur.
3. Metode pengujian reliabilitas
Tiga teknik pengujian realibilitas instrument antara lain :
Tiga teknik pengujian realibilitas instrument antara lain :
a.
Teknik Paralel (Paralel Form atau
Alternate Form)
Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).
Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).
b.
Teknik Ulang (Test Re-test)
Disebut juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson.
Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.
Disebut juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson.
Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.
Metode pengujian reliabilitas
stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali
(test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama
untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat
yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita
menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang
berbeda dari kuesioner atau wawancara. Misalnya the Minnesota Multiphasic
Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu
kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda
dari kuesioner yang panjang.
Kesulitan terbesar untuk
menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable
yang akan diukur memang benar-benar bersifat stabil sepanjang waktu. Karena
kemungkinan besar tidak ada ukuran yang andal dan sahih yang tersedia. Satu-satunya
faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau
putusdan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit
rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.
c.
Teknik Belah Dua (Split Halve Method)
Disebut juga tenik “single test single trial”. Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan dengan cara undian.
Disebut juga tenik “single test single trial”. Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan dengan cara undian.
Menurut Saifuddin Azwar,
realibilitas ini diukur dengan menentukan hubungan antara skor dua paruh yang
ekuivalen suatu tes, yang disajikan kepada seluruh kelompok pada suatu saat.
Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang
sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien
yang didapat.
Ada beberapa sumber ketidakandalan
(unreliability), beberapa di antaranya telah dituangkan. Satu sumber
ketidakandalan yang terbesar adalah ketidaksahihan (invalidity). Berikut ini
adalah daftar periksa (check list) sumber-sumber yang menyebabkannya (Walizer
,1987) :
1.
Orang atau unit yang diukur mungkin
telah berubah sejak pengukuran pertama dan kedua. (Tentu saja perubahan dalam
skor, haruslah ditafsirkan bukan sebagai ketidakandalan.)
2.
Selama wawancara unit yang sedang diukur
berubah, karena:
a. Pewawancara memperoleh pengalaman
b. Kelelahan pewawancara
c. Subyek mengalami hal-hal yang menyebabkan penafsiran mereka terhadap pertanyaan-pertanyaan berubah (sebagai kebalikan dari perubahan seharusnya dari apa yang sedang diukur).
d. Kesalahan-kesalahan diperbuat.
a. Pewawancara memperoleh pengalaman
b. Kelelahan pewawancara
c. Subyek mengalami hal-hal yang menyebabkan penafsiran mereka terhadap pertanyaan-pertanyaan berubah (sebagai kebalikan dari perubahan seharusnya dari apa yang sedang diukur).
d. Kesalahan-kesalahan diperbuat.
3.
Aspek situasi tempat pengukuran
berlangsung mungkin berubah sejak pengukuran pertama dan yang kedua. Hal-hal
seperti waktu (pagi, siang, sore), tempat berlangsungnya pengukuran,
orang-orang yang berada dekat di sekitar yang mungkin mempengaruhi respon
mereka dan sebagainya mungkin berbeda.
4.
Pertanyaan-pertanyaan mungkin mendua
artinya, sehingga ditafsirkan secara berbeda pada saat pengisian kuesioner yang
berbeda.
5.
Pengkode dan/atau pengamat mungkin
membuat penafsiran sendiri-sendiri.
6.
Apa yang nampak sebagai satu teknik
ekivalen sebenarnya tidaklah demikian karena pemilihan pembandingan yang kurang
baik.
7.
Terjadi kekeliruan dalam mencatat hasil
pengamatan atau memberi kode-kodenya.
8.
Atau mungkin kombinasi penyebab-penyebab
terdahulu.
III. PENYUSUNAN KUESIONER
*
Kuesioner (Questionnaire) : merupakan alat/teknik untuk pengumpulan data yang dilakukan dengan
cara mengajukan seperangkat pertanyaan atau pernyataan tertulis kepada responden
untuk dijawabnya.
* Manfaat/Kegunaan Kuesioner :
1.
Membantu
petugas lapangan
(interviewer) dalam
pengumpulan data tentang hal-hal yang perlu ditanyakan kepada responden;
2.
Petugas lapangan bisa secara sistematis dan berurutan dalam mengajukan pertanyaan;
3.
Pertanyaan yang diajukan kepada responden oleh masing-masing petugas
lapangan dapat diseragamkan,
sehingga data yang diperoleh
bisa diperbandingkan satu sama lainnya.
* Prinsip Penyusunan Kuesioner :
1.
Prinsip Penulisan Kuesioner. :
a.
Isi dan tujuan pertanyaan harus relevan;
b.
Bahasa
yang digunakan mudah dipahami;
c.
Tipe / bentuk pertanyaan : terbuka/tertutup , positif/negatif ;
d.
Pertanyaan tidak boleh mendua (double
barreled questions);
e.
Pertanyaan tidak menggiring responden;
f.
Tidak menanyakan hal-hal yang sudah
lupa;
g.
Pertanyaan tidak panjang dan berbelit;
h.
Urutan
pertanyaan dari hal yang umum menuju hal yang spesifik atau dari
hal
yang mudah menuju hal yang sulit;
i.
Gunakan teknik skala yang relevan , seperti : rating scale (graphic rating scales, itemized rating scale, comparative rating scale); attitude scale (likert, sistemtik differential).
2.
Prinsip Pengukuran :
Sebagai instrumen penelitian, maka sebelum kuesioner diberikan kepada responden harus diuji validitas dan reliabilitasnya terlebih dulu.
3.
Prinsip Penampilan Fisik :
Kuesioner perlu dirancang dan didesain lebih menarik agar
responden senang dan serius dalam menjawab/mengisinya.
*
Langkah-langkah
Penyusunan Kuesioner
1.
Menentukan Tujuan penelitian
Mendefinisikan
permasalahan penelitian dan tujuan khusus yang akan dicapai atau
hipotesis yang akan diuji dengan kuesioner merupakan hal penting untuk
dipertimbangkan oleh seorang peneliti sebelum mengembangkan kuesioner, agar
memperoleh hasil sesuai dengan yang diharapkan.
2.
Menentukan kelompok sampel
Setelah
tujuan atau hipotesis telah dinyatakan secara jelas, target populasi dari mana
sampel akan dipilih harus diidentifikasi. Jika peneliti tidak tidak memiliki pengetahuan
mendalam tentang suatu situasi , maka akan terjadi kesalahan pengiriman
kuesioner pada kelompok yang tidak memiliki informasi yang diminta. Contoh :
seorang mahasiswa pasca sarjana ingin mencari data tentang kebijakan keuangan
sekolah, kuesioner dikirim kepada kepala sekolah dari sekolah dasar sampai
sekolah menengah. Banyak kuesioner yang dikembalikan tidak lengkap. Kuesioner
ini gagal karena kepala sekolah yang menerima kuesioner tersebut memiliki
sedikit pengetahuan tentang topik ini, sehingga mereka tidak mampu memberikan
informasi yang diminta.
Arti-penting
dari isi kuesioner kepada responden yaitu mempengaruhi baik ketepatan dari
informasi yang diterima dan tingkat respon.
3.
Merancang kuesioner
Beberapa
kuesioner penelitian dilemparkan bersama-sama dalam satu atau dua jam.
Pengalaman mengembangkan beberapa kuesioner serampangan sebagai
pendekatan penelitian telah menyebabkan penerima kuesioner tersebut banyak
bersikap negatif, kemudian memasukkan dalam kotak sampah dengan sedikit
lebih cepat. Anda akan perlu untuk mengatasi sikap negatif dengan konstruksi
hati-hati dan administrasi dari kuesioner Anda.
*
Panduan untuk Merancang Kuesioner
1.
Menghindari kuesioner yang singkat.
2.
Jangan menggunakan istilah teknis,
istilah khusus, atau istilah kompleks yang tidak dapat dipahami responden.
3.
Hindari menggunakan kata-kata
pertanyaan atau daftar pada formulir Anda. Banyak orang yang bias terhadap
istilah-istilah ini.
4.
Membuat kuesioner yang menarik dengan
teknik seperti menggunakan tinta berwarna cerah atau kertas dan pencetakan
laser.
5.
Mengatur item sehingga mudah dibaca
dan lengkap.
6.
Nomor pada halaman kuesioner dan
item.
7.
Masukkan nama dan alamat individu
kepada siapa kuesioner harus dikembalikan baik pada awal dan akhir dari
kuesioner, bahkan jika amplop ditujukan diri disertakan.
8.
Kalimat yang singkat, instruksi yang
jelas, dicetak dalam huruf tebal dan huruf besar dan kecil (Kata-kata yang
huruf kapital semua sulit untuk dibaca.)
9.
Mengatur kuesioner dalam urutan yang
logis. Sebagai contoh, Anda mungkin kelompok item dengan konten yang sama atau
item bersama-sama memiliki pilihan respon sama.
10.
Ketika pindah ke topik baru, termasuk
sebuah kalimat transisi untuk membantu responden beralih melatih pemikiran
mereka.
11.
Mulailah dengan item yang menarik dan
tidak terlalu memojokkan.
12.
Kalimat yang sulit ditempatkan
dibagian akhir kuesioner.
13.
Jangan menaruh item penting di akhir kuesioner
panjang.
14.
Memberikan dasar pemikiran untuk item
sehingga responden memahami relevansi mereka untuk penelitian.
15.
Sertakan contoh bagaimana merespon
item yang mungkin membingungkan atau sulit dipahami.
16.
Hindari beberapa istilah seperti,
kebanyakan, dan biasanya, yang tidak memiliki makna yang tepat.
17.
Setiap item dinyatakan sesingkat
mungkin.
18.
Menghindari setiap pernyataan item
negatif karena memungkinkan responden salah mengartikan. Kalimat negatif
cenderung diabaikan, dan responden mungkin memberikan jawaban yang berlawanan
dengan pendapat mereka yang sesungguhnya.
19.
Hindari "makna ganda" item
seperti itu memerlukan subjek untuk merespon dua gagasan yang terpisah dengan
jawaban tunggal. Sebagai contoh: Meskipun serikat buruh yang diinginkan dalam
bidang lapangan, mereka tidak memiliki tempat dalam profesi mengajar.
20.
Ketika menggunakan pertanyaan umum bersamaan dengan
pertanyaan khusus yang terkait, maka pertanyaan umum diajukan terlebih dahulu. Jika pertanyaan tertentu ditanyakan pertama, cenderung
untuk mempersempit fokus responden saat menjawab pertanyaan umum yang berikut.
21.
Hindari bias atau pertanyaan
terkemuka. Jika diberikan petunjuk pada responden untuk jenis jawaban yang
lebih disukai, ada kecenderungan untuk memberikan respon.
Menurut Hamid Darmadi (2011), untuk memperoleh item
kuesioner yang baik, peneliti hendaknya memperhatikan beberapa persyaratan lain
dalam membuat kuesioner.
a.
Relevansi kuesioner: Relevansi pertanyaan dengan
tujuan studi, relevan pertanyaan dengan responden secara perorangan.
b.
Relevansi pertanyaan dengan studi: betul
c.
Relevansi pertanyaan dengan responden: betul.
4.
Anonimitas
Dalam
kebanyakan studi pendidikan, responden diminta untuk mengidentifikasi diri,
namun dapat terjadi anonimitas untuk itu diperlukan informasi personal yang
sangat pribadi sesuai dengan yang diminta. Sebuah kuesioner berkaitan dengan
perilaku seksual akan mendapatkan tanggapan lebih jujur jika responden tetap
anonim.
Masalah
utama dengan kuesioner anonim yang dapat meningkatkan perbaikan tingkat
pengembaliannya tidak mungkin. Ada beberapa solusi untuk masalah ini. Salah
satunya adalah dengan membuat lembar pengkodean yang berisi kode untuk
setiap individu dalam sampel. Kode ini ditempatkan dalam kuesioner Ketika
seorang individu mengembalikan kuesioner, peneliti dapat memeriksa dari nama
orang itu pada lembar kode . Setelah periode waktu yang ditentukan, peneliti
dapat menentukan individu yang belum mengembalikan kuesioner mereka dan
mengirim mereka kuesioner baru.
Metode ini
tidak sepenuhnya anonim, karena peneliti dapat menghubungkan kuesioner untuk
nama individu dengan nama individu pada lembar kode master. Peneliti dapat
mengirim kartu pos prabayar individu secara terpisah.
Individu
yang telah menyelesaikan kuesionernya , ia mengembalikan kuesioner dan kartu
posnya secara terpisah. Kartu pos memberi tahu peneliti bahwa individual
tersebut telah menyelesaikan kuesionernya, tetapi ia tidak tahu yang mana
dari kuesioner yang dikembalikan milik individu tersebut.
5.
Bentuk Item
Menulis item
untuk kuesioner mungkin tampak mudah, tetapi sebenarnya suatu bentuk seni. Anda
harus mampu menulis secara ringkas dan jelas. Ini bukanlah hal yang mudah.
Lebih penting lagi, diperlukan pemahaman yang baik tentang responden sehingga
kita dapat menggunakan bahasa yang mereka mengerti, dan dapat memperoleh semua
informasi yang dibutuhkan tanpa membuang waktu, dan agar item mendapatkan
respont secara jujur.
Kesulitan
utama dalam membangun item kuesioner adalah bahwa istilah pendidikan sering
memiliki makna ganda. Untuk itu dianjurkan agar menyertakan definisi yang
sesuai dengan tujuan penelitian.
Sebuah item
kuesioner dapat berupa bentuk tertutup, yang berarti bahwa pertanyaan hanya
memungkinkan respon yang pasti (mirip dengan pertanyaan pilihan ganda), atau
bentuk terbuka, yang berarti bahwa responden dapat membuat respon mereka
inginkan (mirip dengan pertanyaan esai).dengan bentuk yang digunakan ditentukan
oleh obyektif dari sebuah pertanyaan.
Keuntungan
dari merancang pertanyaan dalam bentuk tertutup adalah membuat kuantifikasi dan
analisis hasil lebih mudah.
Untuk
menentukan beberapa kategori yang digunakan dalam pertanyaan tertutup, dapat
diberikan tes pertanyaan dalam bentuk terbuka dari sejumlah kecil responden.
Jawaban mereka dapat digunakan untuk mengembangkan kategori untuk item bentuk
tertutup. Jika Anda mendapatkan respon yang tidak biasa, "yang lain"
bisa menyediakan pilihan yang lain.
6.
Mengukur Sikap/ Perilaku
Kuesioner
biasanya berisi item yang masing-masing dapat memberi sedikit informasi yang
berbeda. Akibatnya, setiap item adalah suatu uji yang cukup untuk memuaskan
ketika Anda sedang mencari fakta spesifik, seperti jumlah tahun untuk
pengalaman mengajar, jumlah kemenangan dan kerugian selama masa melatih bagi
seorang pelatih sepak bola, atau proporsi siswa gagal aljabar menengah. Ketika
pertanyaan menilai sikap, bagaimanapun, pendekatan uji untuk satu item
dipertanyakan sehubungan dengan validitas dan reabilitas. Sebuah kuesioner yang
mengukur sikap umumnya harus dibangun sebagai skala sikap dan harus menggunakan
sejumlah besar item (biasanya minimal 10) untuk mendapatkan penilaian yang
dapat diandalkan sikap individu.
Jika Anda
ingin mengumpulkan informasi tentang sikap, Anda harus terlebih dahulu
melakukan pencarian literatur penelitian untuk menentukan skala yang
cocok untuk tujuan Anda sudah telah dibangun. Jika skala yang sesuai tidak
tersedia, Anda akan perlu mengembangkan satu Skala Likert, yang biasanya
meminta tingkat perjanjian dengan sikap item (misalnya, skala lima poin mulai
dari "sangat tidak setuju") adalah jenis umum dari skala sikap.
7.
Menguji cobakan kuesioner
Sebelum
kuesioner disebarkan kepada responden, ujicobakanlah lebih dahulu kepada
sejumlah kecil responden. Ini gunanya untuk mengetahui validitas dan
reliabilitas alat ukur dimaksud. Selain itu, ini juga bisa digunakan untuk
mengetahui kemungkinan diterima atau ditolaknya hipotesis yang telah
dirumuskan. Selain itu, jika ternyata dalam uji coba ini terdapat banyak
kesalahan, maka peneliti bisa mengubah atau menyempurkannya.
Untuk memperoleh kuesioner dengan hasil yang
mantap adalah dengan ujicoba. Sampel yang diambil untuk keperluan ujicoba
haruslah sampel dari populasi di mana sampel penelitian akan diambil. Dalam
ujicoba, responden diberikan kesempatan untuk memberikan saran-saran perbaikan
bagi kuesioner yang diujicobakan itu. Situasi ujicoba dilaksanakan harus sama
dengan situasi kapan penelitian sesungguhnya akan dilaksnakan.
8.
Komunikasi awal dengan sampel
Para
peneliti menemukan bahwa menghubungi responden sebelum mengirim kuesioner akan
meningkatkan tingkat respon. Kontak awal yang dilakukan peneliti
mengidentifikasi diri, mendiskusikan tujuan penelitian, dan meminta kerjasama.
Kontak awal dapat dilakukan melalui surat, kartu pos, atau panggilan telepon,
tetapi beberapa bukti menunjukkan bahwa kontak telepon adalah yang paling
efektif.
9.
Menganalisis data kuesioner
Peneliti
yang mempelajari penelitian kualitatif pembelajaran pada lembaga pendidikan
tinggi di Amerika mengikuti pendekatan khusus untuk menganalisis data
kuesioner.
Semua
jawaban (pilihan) diberi kode dan dimasukkan ke dalam program analisis ecstatic
untuk data kualitatif. Prosedur ini memudahkan penentuan prosentase, mean
(rata-rata), range dan tabulasi silang. Semua komentar dan jawaban tertutup dimasukkan
seluruhnya ke dalam analisis teks ethnograf yang memudahkan pengkodean dan
pemilihan kata-kata responden sehingga polanya dapat dipastikan.
Data
kuantitatif dianalisa untuk menghasilkan frekuensi dan prosentase dari
pengecekan setiap kategori jawaban pada pertanyaan tertutup tertentu.
Pada umumnya
diasumsikan bahwa kuesioner dan interview yang sesuai atau paling sesuai untuk
riset deskriptif , kenyataanya kuesioner dan interview dapat digunakan untuk
berbagai disain riset.
Glesne dan
web menyertakan beberapa komentar dari responden dalam merespon pertanyaan.
Dengan cara ini pembaca mendapatkan gambaran perspektif emic yaitu
perspektif para responden terhadap fenomena yang sedang dipelajari. Contohnya
disertakan komentar dari responden tentang pertanyaan terbuka mengenai
ketertarikan mereka terhadap pengajaran kursus metode riset kualitatif.
Data
kuantitatif yang dikumpulkan melalui kuesioner dapat dianalisa dengan metoda
statistik (menggunakan bantuan komputer dengan software program SPSS for
window s versi 10) untuk data kuantitatif, sedang data kualitatif
menggunakan tiga jalur analisis yaitu reduksi data, penyajian data
dan penarikan kesimpulan
REFERENSI :
Arifin
zainal. 2011. Evaluasi Pembelajaran. Bandung: PT Remaja Rosdakarya.
Suprananto, Kusaeri.
2012. Pengukuran dan Penilaian Pendidikan. Yogyakarta: Graha Ilmu.
Widoyoko
Putro,Eko. 2012. Evaluai Program Pembelajaran. Yogyakarta: Pustaka
Pelajar.
Hayati, Mimin.
2007. Teknik dan Penilaian pada tingkat satuan pendidikan. Jakarta: Gaung
persada press.
Arikuto,S
& Jabar. 2004. Evaluasi Pendidikan. Jakarta: Bumi Aksara
The suppliers of metal - TITanium-arts.com
BalasHapusFrom micro touch trimmer Hype-Free Metal to the metal-heads. titanium bike frame Metalheads are a few of the hottest metal bands, titanium flashlight and titanium septum jewelry these titanium crystal three band are very unique.
anonymous horse dildo,male sex doll,wolf dildo,cheap sex toys,sex chair,wholesale sex dolls,vibrators,realistic sex dolls,vibrators read review
BalasHapuse533o4mswjz468 dog dildo,cheap sex toys,wholesale sex toys,finger vibrator,vibrators,Rabbit Vibrators,dog dildo,horse dildos,dog dildo h867y7hwkdj473
BalasHapus