Penilaian Sikap atau Ranah Afektif dan Sosial
A.
Pendahuluan
Benjamin Bloom mengkategorikan tujuan
pendidikan ke dalam ranah kognitif, afektif dan psikomotor (Wikipedia, 2011). Ranah afektif berisi
perilaku-perilaku yang menekankan aspek perasaan dan emosi, seperti minat,
sikap, dan motivasi. Perilaku-perilaku afektif perlu dikembangkan dalam
pendidikan di sekolah. Menurut Depdiknas, pendidikan budaya dan
karakter bangsa harus
diusahakan bersama-sama oleh sekolah, masyarakat, dan pemerintah. Khusus sekolah
seyogyanyanya dilakukan secara bersama oleh semua guru dan
pimpinan sekolah, melalui semua civitas
sekolah dan
menjadi bagian yang tak terpisahkan dari budaya sekolah.
B. Ranah
Afektif dan Ranah Sosial atau Penilaian Sikap
Taksonomi pendidikan yang dikembangkan
oleh Bloom, Krathwhol, dan para kolabolator digunakan untuk merencanakan
objektif instruksional, merancang kurikulum, dan merencanakan pencapaian.
Pengembangannya meliputi ranah kognitif, psikomotorik, afektif dan sosial.
Selanjutnya keempat ranah ini disintesis menjadi kesatuan yang disebut ranah
terpadu (unified domain) (Dettmer,
2006). Afektif (dari bahasa Latin affectus, yang berarti "perasaan") mencakup sejumlah
konstruksi, seperti sikap, nilai, kepercayaan, pendapat, minat, dan motivasi (Koballa, 2011). Sikap (dalam bahasa Inggris attitude)
dapat diartikan cara berpikir. Sikap umumnya
didefinisikan sebagai kecenderungan untuk merespon secara positif atau negatif
terhadap benda, orang, tempat, peristiwa, dan gagasan.
Ranah afektif pada awalnya diklasifikasikan berdasarkan
objektif sikap dan emosi. Tingkatan ranah afektif menurut Krathwohl ada lima, yaitu receiving (menerima), responding
(menanggapi), valuing (menilai), organization (organisasi), dan characterization (karakterisasi) (_____,2011).
Kemudian, ranah afektif diperluas mencakup internalize
(internalisasi nilai-nilai), wonder (rasa
ingin tahu), dan aspire (mencita-citakan)
(Dettmer, 2006). Dettmer menambahkan ranah sosial ke dalam taksonomi Bloom yang
baru. Hal ini sangat beralasan, karena kemampuan afektif seseorang merupakan
faktor internal yang berkaitan dengan perasaan dan proses merasakan dalam diri
seseorang, sedangkan kemampuan sosial berkaitan erat dengan sosial budaya dan
proses interaksi seseorang dengan orang lain atau lingkungan di sekitar.
Penilaian sikap atau ranah afektif dan ranah sosial menggunakan
bentuk penilaian formatif. Metode untuk penilaian formatif ranah afektif dan
ranah sosial dapat menggunakan beberapa
bentuk instrumen pengukuran yang tergantung pada apa yang ingin diukur.
1. Pengukuran Kepribadian
Pengukuran kepribadian dikonsentrasikan bukan pada tes
intelektual atau kompetensi kognitif. Ada beberapa tipe pengukuran kepribadian,
masing-masing tipe merefleksikan teori dengan sudat pandang yang berbeda.
Beberapa tipe merefleksikan teori sifat dan tipe kepribadian, sedangkan
beberapa yang lain merefleksikan teori psikoanalitik dan motivasi. Pendidik
harus tahu dengan tepat tentang hal yang akan diukur dan jenis instrumen yang
akan digunakan, dengan memperhatikan bukti validitas.
a.
Inventori
Dalam inventori, subjek yang dipresentasi
dengan suatu luasan kumpulan pernyataan yang menggambarkan contoh perilaku dan
yang dimaksudkan untuk mengindikasikan apakah setiap pernyataan merupakan
karakteristik perilaku mereka atau tidak, dengan memberi tanda ya, tidak atau
tidak pasti. Skor dikomputasi dengan menghitung jumlah respons yang setuju
dengan sifat yang penguji ukur. Daftar pernyataan disusun dalam bentuk
kuesioner. Kuesioner ini mirip wawancara terstruktur dan peneliti menanyakan pertanyaan
yang sama untuk setiap orang, dan jawaban biasanya diberikan dalam bentuk yang
mudah dinilai, biasanya
dengan bantuan komputer.
Beberapa inventori kepribadian hanya
mengukur satu sifat, misalnya California
F-Scale untuk mengukur autoritarianisme, Cattell's
Sixteen Personalitg
Factor Queslionnoire
untuk mengukur sejumlah sifat, Minnesota Multiphasic Personality lnventory, Guilford-Zimerman Temperament Survey, Mooney Problem Check List, dan Edwards Personal Preference Schedule. Menurut Atkinson dan kawan-kawan,
investori kepribadian mungkin dirancang untuk menilai dimensi tunggal
kepribadian (misalnya, tingkat kecemasan) atau beberapa sifat kepribadian
secara keseluruhan. Investori kepribadian yang terkenal dan banyak digunakan
untuk menilai kepribadian seseorang ialah: (a) Minnesota Multiphasic Personality Inventory (MMPI), (b) Rorced-Choice Inventories, dan (c) Humm-Wadsworth Temperament Scale (H-W Temperament Scale).
1) Minnesota Multiphasic Personality
Inventory (MMPI)
MMPI
terdiri atas kira-kira 550 pernyataan tentag sikap, reaksi emosional, gejala
fisik dan psikologis, serta pengalaman masa lalu. Subjek menjawab tiap
pertanyaan dengan menjawab “benar”, “salah”, atau “tidak dapat mengatakan”.
Pada prinsipnya, jawaban mendapat nilai menurut kesesuaiannya dengan jawaban
yang diberikan oleh orang-orang yang memiliki berbagai macam masalah psikologi.
MMPI dikembangkan guna membantu klinis dalam mendiagnosis gangguan kepribadian.
Para perancang tes tidak menentukan sifat mengukurnya, tetapi memberikan ratusn
pertanyaan tes untuk mengelompokkan individu. Tiap kelompok diketahui berbeda
dari normalnya menurut kriteria tertentu. Kelompok kriteria terdiri atas
individu yang telah dirawat dengan diagnosis gangguan paranoid. Kelompok
kontrol terdiri atas orang yang belum pernah didiagnosis menderita masalah
psikiatrik, tetapi mirip dengn kelompok kriteria dalah hal usia, jenis kelamin,
status sosioekonomi, dan variabel penting lain.
2) Rorced-Choice Inventories
Rorced-Choice
Inventories atau Inventori Pilihan-Paksa termasuk klasifikasi tes yang
volunter. Suatu tes dikatakan volunter bila subjek dapat memilih pilihan yang
lebih disukai, dan tahu bahwa semua pilihan itu benar, tidak ada yang salah
(Muhadjir,1992). Subjek, dalam hal ini, diminta memilih pilihan yang lebih
disukai, lebih sesuai, lebih cocok dengan minatnya, sikapnya, atau pandangan
hidupnya.
3) Humm-Wadsworth Temperament Scale
(H-W Temperament Scale)
H-W
Temperament Scale dikembangkan dari teori kepribadian Rosanoff (Muhadjir,
1992). Menurut teori ini, kepribadian memiliki enam komponen, yang lebih banyak
bertolak dari keragaman abnomal, yaitu:
a) Schizoid Autistik,
mempunyai tendensi tak konsisten, berpikirnya lebih mengarah pada khayalan.
b) Schizoid Paranoid,
mempunyai tendensi tak konsisten, dengan angan bahwa dirinya penting.
c) Cycloid Manik,
emosinya tidak stabil dengan semangat berkobar.
d) Cycloid Depress,
emosinya tak stabil dengan retardasi dan pesimisme.
e) Hysteroid,
ketunaan watak berbatasan dengan tendensi kriminal.
f) Epileptoid,
dengan antusiasme dan aspirasi yang bergerak terus.
H-W Temperament Scale
tersusun dalam sejumlah item yang berfungsi untuk memilahkan kelompok yang
patologik dari kelompok penderita hysteroid, misalnya, diasumsikan memiliki
mental kriminal.
Inventori telah digunakan dalam penelitian
pendidikan untuk memperoleh deskripsi sifat yang menggambarkan kelompok
tertentu, misalnya kelompok dibawah rata-rata, kelompok dropout, kelompok minoritas dan sebagainya. Beberapa penelitian
dikonsentrasikan untuk melihat hubungan antara sifat kepribadian dengan
beberapa variabel seperti kecerdasan, prestasi, dan sikap.
Inventori memiliki keuntungan yaitu murah,
sederhana dan objektif. Kelemahannya berkaitan dengan masalah validitas.
Validitasnya tergantung pada kemampuan responden membaca dan memahami
item-itemnya, pengenalannya akan diri sendiri, dan khususnya keinginan mereka
menjawab dengan jujur dan terbuka. Berdasarkan pada hasil, informasi yang
diperoleh dari inventori mungkin hanya permukaannya saja atau bias. Kemungkinan
ini semestinya dimasukkan ke dalam laporan ketika hasil diperoleh dari
instrumen.
b.
Teknik
Proyektif
Dalam tes-tes
kepribadian dengan pendekatan proyektif, individu memberikan respon pada
stimulus yang tidak terstruktur dan ambigu, dimana hal ini berbeda dengan tes
objektif yang memuat beberapa pertanyaan berstruktur. Sehingga diharapkan
dengan menggunakan tes proyektif, individu secara tidak sadar akan mengungkap
dan menggambarkan struktur dan dinamika kepribadiannya.
Teknik proyektif yang
banyak dikenal dan digunakan secara luas oleh ahli psikologi yaitu tes Rorschach, Thematic Apperception Test (TAT), Children’s Apperception Test (CAT), Draw-A-Person (DAP), Make-A-Picture Story (MAPS), Michigan Picture Story Test, dan Sentence Completion Test. Berikut adalah
penjelasan lebih lanjut mengenai tes-tes tersebut:
1)
Thematic Apperception
Test
(TAT)
TAT adalah yang dikenal sebagai
teknik interpretasi gambar karena menggunakan rangkaian standar provokatif
berupa gambar yang ambigu dan subjek yang harus menceritakan sebuah cerita dari
gambar yang tertera. Subjek diminta untuk mengatakan sebagai sebuah cerita yang
dramatis.
2)
Children’s Apperception Test (CAT)
Bentuk lain dari TAT
adalah CAT (Children’s Apperception Test), yang digunakan untuk anak-anak. CAT menampilkan sepuluh
gambar binatang dalam konteks sosial manusia seperti memainkan game atau tidur di tempat tidur. Pada
saat ini, versi ini dikenal sebagai CAT atau CAT-A (gambar binatang).
3)
Michigan Picture Story Test (MPST)
Tes ini hampir sama
dengan kedua tes diatas dan terdiri dari material yang menggambarkan anak-anak
dalam hubungannya dengan orang tua, polisi, dan figur otoriter lainnya, juga
teman-teman. Tes ini sangat bermanfaat dalam melihat struktur dari sikap
anak-anak terhadap orang dewasa dan teman-teman sekaligus mengevaluasi masalah
yang mungkin timbul.
4)
Make-A-Picture Story (MAPS)
Tes ini juga hampir
sama dengan MPST dalam interpretasi dan tujuan yang dimiliki. Perbedaannya,
individu boleh memilih karakter yang ada untuk membuat sebuah cerita
berdasarkan situasi yang ada.
5)
Figure Drawing
Dalam tes ini, kemampuan menggambar bukanlah
faktor utama. Salah satu bentuk tesnya adalah Draw-A-Person (DAP), dimana
individu diminta untuk menggambar seorang lelaki dan perempuan menggunakan
pensil dan kertas.
6)
Incomplete Sentence Test
Dalam metode proyektif
ini, terdiri dari sejumlah kalimat tidak lengkap yang disajikan untuk
dilengkapi. Biasanya bukan merupakan tes standar dan tidak diperlakukan secara
kuantitatif. Penting sebagai bahan pertimbangan dalam situasi klinis yang
memiliki asumsi bahwa respon individu terhadap stimulus yang ambigu merupakan
proyeksi dari hal-hal yang ada dalam ketidaksadaran. Respon yang diberikan
subjek dapat memberikan gambaran area konflik, termasuk juga kelebihan dan
kekurangan dari kepribadian subjek.
7)
Competency Screening Test
Diberikan kepada
individu yang menjadi terdakwa untuk mempelajari interscorer kehandalan dan validitas prediktif tentang status
mental atau inteligensi individu terkait dengan kasus individu yang sedang
terjadi. Tes juga secara signifikan membedakan antara individu yang
dikategorikan oleh praktisi sebagai tidak berkompetensi secara mental dan yang
dikategorikan sebagai kompeten dalam sidang kasus yang dijalani.
8)
Rorschach Test
Rorschach test juga
dikenal sebagai tes inkblot Rorschach atau sekadar tes Inkblot adalah sebuah
tes psikologi di mana subjek mempersepsi sebuah bentuk gambar tinta yang
dicatat dan kemudian dianalisis dengan menggunakan interpretasi psikologis.
Beberapa psikolog menggunakan tes ini untuk memeriksa kepribadian seseorang
baik karakteristik maupun fungsi emosional. Telah digunakan untuk mendeteksi
gangguan pikiran yang mendasari individu, terutama dalam kasus-kasus di mana
pasien tidak mau untuk menggambarkan proses berpikir mereka secara terbuka. Tes
ini mengambil namadari penciptanya yaitu psikolog dari Swiss, Hermann
Rorschach.
Teknik proyektif digunakan terutama dalam psikologi
klinis untuk mempelajari dan mendiagnosis masalah emosional seseorang. Teknik
ini jarang digunakan dalam pendidikan karena kebutuhannya lebih mengarah untuk
latihan administrasi dan penskoran. Para ahli juga kurang puas terhadap masalah
validitas instrumennya.
2. Skala Sikap
Sikap
merupakan suatu kecenderungan tingkah laku seseorang, subjek atau objek untuk
berbuat sesuatu dengan cara, metode, teknik dan pola tertentu terhadap dunia di
sekitarnya. Guru perlu mengetahui norma-norma yang ada pada peserta didik
bahkan sikap peserta didik terhadap dunia sekitarnya, terutama terhadap mata
pelajaran dan lingkungan sekolah. Jika terdapat sikap peserta didik yang
negatif, guru perlu mencari suatu cara dan teknik tertentu untuk menempatkan
sikap negatif itu menjadi sikap yang positif. Dalam mengukur sikap, guru
hendaknya memperhatikan tiga komponen sikap yaitu (1) kognisi, berkenaan dengan
pengetahuan peserta didik tentang objek, (2) Afeksi, berkenaan dengan perasaan
peserta didik terhadap objek, (3) Konasi, berkenaan dengan kecenderungan
berperilaku peserta didik. Disamping itu guru juga harus memilih salah satu
model skala sikap.
Skala
merupakan seperangkat bilangan untuk menyatakan nilai yang dikenakan pada
subjek, objek, atau perilaku bagi tujuan quantifikasi dan pengukuran kualitas.
Skala digunakan untuk mengukur sikap, nilai dan karakter lainnya. Skala-skala
ini berbeda dari tes dalam hal hasil dari instrumen, tidak seperti tes-tes pada
umumnya, instrumen tidak mengindikasikan kesuksesan atau kegagalan, kelemahan
atau kekuatan. Instrumen mengukur derajat karakteristik proses ketertarikan
individu. Misalnya, mengukur sikap peserta didik terhadap pelajaran kimia.
Pengembangan
skala untuk mengukur sikap, nilai, dan karakter lainnya dapat meliputi berbagai
teknik yang berbeda-beda. Sikap dapat didefinisikan sebagai pengaruh positif
atau negatif terhadap kelompok tertentu, institusi, konsep atau objek sosial.
Pengukuran sikap untuk menduga kemampuan guna menempatkan individu pada
kontinum kesukaan-ketidaksukaan terhadap objek. Ada empat tipe skala sikap yang
umum digunakan.
a.
Summated rating scales (Skala Likert)
Skala Likert, sebagai metode untuk
mengukur sikap, merupakan salah satu tipe skala yang digunakan oleh sebagian
besar peneliti dan memberikan hasil yang baik. Skala Likert menilai sikap
terhadap suatu hal dengan membuat pernyataan kepada responden untuk mengindikasikan
apakah responden menunjukan respon sangat setuju (SS), setuju (S), tidak
berpendapat (TB), tidak setuju (TS), dan sangat tidak setuju (STS) terhadap
pernyataan tentang hal-hal tersebut. Skala Likert dikonstruksi dengan
mengumpulkan sejumlah pernyataan tentang suatu objek, setengah dari jumlah
pernyataan tentang kesukaan dan setengahnya lagi tentang pernyataan
ketidaksukaan terhadap suatu objek. Hal yang penting adalah bahwa
pernyataan-pernyataan ini merakit suatu contoh representatif tentang semua
pendapat atau sikap yang mungkin terhadap suatu objek. Hal yang mungkin sangat
membantu adalah memikirkan semua subtopik yang berhubungan dengan objek sikap
dan kemudian menuliskan item-item pada setiap subtopik. Selanjutnya item-item
ini divalidasi oleh orang yang memiliki pengetahuan dan mengerti batasan sikap
positif dan negatif.
Pernyataan, sepanjang kontinum
setuju-tidak setuju, dipresensikan kepada subjek. Pernyataan harus disusun
secara acak untuk menjamin bahwa respon mengena pada subjek. Untuk menskor
skala, kategori respon harus berbobot. Bagi item pernyataan kesukaan atau
positif, nilai bilangan berturut-turut 5, 4, 3, 2, 1, disusun untuk kategori
respon yang dimulai dengan pernyataan positif. Sangat setuju diberi nilai 5,
sedangkan sangat tidak setuju diberi nilai 1. Bagi item pernyataan
ketidaksukaan atau negatif merupakan kebalikannya, sangat setuju diberi nilai
1, sedangkan sangat tidak setuju diberi nilai 5. Misalnya, mengukur sikap
peserta didik terhadap pelajaran kimia:
Peserta
didik yang sangat menyukai pelajaran kimia akan setuju dengan pernyataan
positif dan tidak setuju dengan pernyataan negatif.
Peserta
didik yang setuju dengan pernyataan pertama diberi nilai 4 dan tidak setuju
dengan pernyataan kedua diberi nilai 4, jumlahnya adalah 8 (4+4) untuk kedua
item. Jumlah seluruh bobot item yang dicentang oleh subjek pada skala akan
merepresentasikan skor total individu.
Skor dengan nilai tertinggi
mengindikasikan sikap positif terhadap objek. Skor tertinggi adalah 5 dikalikan
N (jumlah item) dan skor terendah 1 dikalikan N.
Setelah skala sikap diujicobakan terhadap
kelompok responden, analisis item perlu dilakukan untuk mengidentifikasi item
terbaik. Paling tidak, ada tiga tipe statistik untuk menganalisis: 1) indeks
item diskriminasi, 2) bilangan dan/atau persentase untuk setiap item yang
ditandai responden, 3) mean atau standar deviasi item. Indeks item diskriminasi
menunjukkan jangkauan atau batasan terhadap yang mana setiap item membedakan
responden dalam cara yang sama seperti total skor diskriminan. Indeks item
diskriminasi dikalkulasi dengan mengkorelasikan skor item dengan total skor
skala. Setiap item akan memiliki korelasi minimal 0,25 dengan skor total. Item
yang memiliki korelasi sangat rendah atau negatif akan dieliminasi karena tidak
mengukur hal yang sama sebegai skala total dan tidak berkontribusi terhadap
pengukuran sikap. Statistik 2 dan 3 mengindikasikan jangkauan atau batasan
terhadap yang mana responden memiliki pilihan bervariasi. Item pada yang mana
responden menyebar diantara kategori respon yang lebih disukai akan mengumpul
pada satu atau dua kategori. Setelah memilih item yang baik, instrumen yang
telah direvisi digunakan pada kelompok subjek yang berbeda dan akan memberikan
reliabilitas yang baru.
Ada beberapa kesulitan untuk menempatkan
kriteria yang akan digunakan dalam menentukan validitas skala sikap. Beberapa
peneliti menggunakan observasi perilaku sebagai kriteria bagi sikap yang
diukur, tetapi prosedur ini jarang sekali digunakan karena kesulitan dalam
menentukan perilaku yang bagaimana yang dapat menjadi kriteria terbaik bagi
sikap dan juga kesulitan menjamin validitas pengukuran. Salah satu cara yang
paling mudah untuk memvalidasi adalah menentukan batasan pada dua sikap yang
telah diketahui akan berbeda, misal sikap terhadap masalah aborsi.
b. Equal-appearing intervals scales (Skala Thurstone)
Thurstone mengembangkan sebuah metode bagi
penyusunan spesifik nilai skala untuk item-item sikap. Skala Likert menilai
sikap dengan meminta responden untuk mengindikasikan derajat atau tingkat
kesetujuan-ketidaksetujuan dengan serangkaian pernyataan, sedangkan skala
Turstone menilai dengan mempresentasikan pernyataan tentang suatu topik dengan
rentangan dari sangat suka, melalui sikap netral, menuju sangat tidak suka dan
meminta responden untuk memilih dari pernyataan-pernyataan ini yang mana paling
mendekati berhubunagn dengan sikap mereka sendiri. Membuat skala Thurstone
meliputi beberapa langkah, yaitu:
Mengumpulkan sejumlah besar pernyataan (50-100) yang mengekspresikan keluasan perbedaan derajat kesukaan-ketidaksukaan terhadap objek sikap, termasuk pernyataan netral. Pernyataan diberikan kepada sejumlah besar orang (50 atau lebih) yang memiliki cukup pengetahuan tentang objek untuk mengurutkan pernyataan ke dalam sebelas kategori sepanjang dimensi kesukaan-ketidaksukaan. Kategori A berisi pernyataan yang dapat diputuskan menjadi paling/sangat disukai, kategori B berisi pernyataan sangat disukai selanjutnya, agak sangat disukai, dan seterusnya. Pernyataan ke enam (F) berisi pernyataan netral yang memberi respek sikap netral, dan kategori K berisi pernyataan yang paling/sangat tidak disukai.Klasifikasi pernyataan menjadi kategori-kategori tidak mempunyai sesuatu untuk dilakukan dengan sikap pemilik sikap terhadap objek psikologis, tetapi hanya mencerminkan persepsi mereka tentang kesukaan dan ketidaksukaan mengenai pernyataan.
Setelah keputusan dari pengukuran semua item, distribusi dari rating keputusan disiapkan bagi setiap item. Distribusi akan menunjukkan bilangan keputusan yang menempatkan setiap item ke dalam sebelas kategori. Sebagai contoh, anggapan pernyataan tentang pelajaran kimia ditempatkan dalam kategori A dengan 4 keputusan, dalam kategori B dengan 28 keputusan, dalam C dengan 32 keputusan dan dalam D dengan 16 keputusan. Ada dua nilai, yaitu median dan Q, yang dihitung dari distribusi tersebut.

Median dari rating (distribusi skor pengukuran item)
keputusan adalah 2,75. Ini menjadi skala nilai yang ditunjukkan untuk item
tersebut. Skala nilai mengindikasikan posisi item pada kontinum
positif-negatif. Dalam hal membuat batasan persetujuan diantara
keputusan-keputusan, indeks variabilitas dihitung untuk setiap item. Pengukuran
variabilitas menggunakan Q, yaitu diviasi kuartil, yang sama dengan setengah
dari selisish persentil ke-25 dan ke-75. Q lebih disukai daripada standar
deviasi karena tidak dipengaruhi oleh skor ekstrim. Untuk contoh diatas
Q=(3,38-2,07)/2 = 0,65. Tingginya tingkat persetujuan diantara
keputusan-keputusan tentang bagaimana pernyataan disukai-tidak disukai akan
dihasilkan dengan nilai Q yang rendah. Rendahnya tingkat persetujuan di antara
keputusan-keputusan ditunjukkan dengan nilai Q yang tinggi. Item yang memiliki
nilai Q terlalu tinggi akan dibuang karena menyebabkan ambigu pada skala.
Setelah skala nilai (median) dan nilai Q dihitung untuk setiap pernyataan, langkah selanjutnya adalah memilih pernyataan untuk mewakili poin pada kontinum kesukaan-ketidaksukaan yang didistribusikan pada nilai 1-11. Untuk batasan bahwa skala nilai mewakili kenaikan yang sama, salah satunya harus mencapai interval pengukuran. Jika dua atau lebih item memiliki skala nilai yang sama, item yang memiliki nilai Q paling rendah yang dipilih. Item-item ditempatkan dalam urutan acak pada bentuk akhir dan tentu saja, nilai-nilainya tidak ditunjukkan pada bentuk itu sendiri. Berikut ini contoh skala Thurstone.
Dalam
menentukan skala Thurstone, penguji harus menginstruksikan kepada responden
untuk mencentang hanya pernyataan yang mereka setujui saja. Skor sikap subjek
merupakan rata-rata dari skala nilai (mean atau median) dari pernyataan yang
dicentang. Skor rata-rata menempatkan individu pada kontinum
kesukaan-ketidaksukaan dengan respek terhadap objek sikap. Dari contoh diatas,
jika seorang responden setuju dengan pernyataan yang memiliki nilai 1,5; 2,3;
3,3; dan 4,5 dalam skala Thustone, skor sikapnya adalah 2,9 (median), yang
mengindikasikan sikap suka terhadap mata pelajaran kimia.
Jumlah sebaran skala nilai dari item sikap
yang dicentang oleh beberapa responden dapat diambil sebagai pengukur batasan
atau jangkauan untuk yang mana responden memiliki gambaran sikap yang jelas.
Artinya bahwa seseorang dengan gambaran sikap yang baik terhadap beberapa objek
akan diharapkan untuk mencentang hanya item-item yang sangat dekat dengan skala
nilai. Jika respon seseorang menyebar luas tidak berdekatan item-itemnya, dapat
diasumsikan bahwa responden memiliki ambigu atau miskin gambaran tentang sikap.
c.
Cumulative scales (Skala Guttman)
Kritik terhadap skala sikap Thurstone dan
Likert bahwa skala-skala ini berisi pernyataan-pernyataan heterogen mengenai
berbagai dimensi terhadap suatu objek sikap. Sebagai contoh, pengukuran sikap
terhadap perang dalam skala Thurstone, tidak ada usaha yang dibuat untuk
memisahkan pernyataan etis dari pernyataan yang berhubungan dengan hasil
ekonomis dari perang, atau yang mencerminkan aspek-aspek yang mungkin lainnya
tentang sikap terhadap perang. Sebagai hasil dari kombinasi ini tentang
beberapa dimensi dari satu skala, hal ini bisa sukar untuk membuat beberapa
interpretasi yang jelas dari skor yang diperoleh.
Guttman mengembangkan suatu teknik untuk
mengatasi masalah tersebut. Teknik Guttman, dikarakteristik sebagai suatu skala
unidimensional, bertujuan/bermaksud untuk menentukan jika sikap dipelajari
secara aktual mencakup hanya sebuah dimensi tunggal. Sebuah sikap dianggap
unidimensional hanya jika sikap itu menghasilkan suatu skala kumulatif ― salah
satu dalam yang mana item-item dihubungkan dengan yang lain dalam hal suatu
cara bahwa suatu subjek yang setuju dengan item 2 juga setuju dengan item 1,
jika setuju dengan item 3, juga setuju dengan item 1 dan 2, dan seterusnya.
Dengan demikian, individu yang menyetujui item tertentu dalam tipe skala ini
akan memiliki skor lebih tinggi pada skala total daripada yang tidak menyetujui
item tersebut. Sebagai contoh, mempertimbangkan item berikut dengan meminta
responden menyetujui atau tidak menyetujui:
1.
PTA
seharga dengan waktu yang dihabiskan untuk PTA itu sendiri.
2.
PTA
merupakan suatu pengaruh kuat bagi perbaikan sekolah.
3.
PTA
merupakan organisasi paling penting di Amerika Serikat untuk memperbaiki
sekolah.
Jika ini merupakan skala kumulatif, tentu memungkinkan untuk mengatur semua respon dari responden menjadi tipe contoh/model. Dengan demikian, jika diketahui skor seseorang, tentu memungkinkan untuk menceritakan secara tepat, item mana yang disetujuinya. Sebagai contoh, semua individu dengan skor 2 meyakini bahwa PTA seharga dengan waktu yang dihabiskan untuk itu dan PTA merupakan suatu pengaruh kuat bagi perbaikan sekolah, tetapi tidak yakin bahwa PTA merupakan organisasi paling penting di Amerika Serikat untuk memperbaiki sekolah. Subjek dapat diranking atau diberi peringkat menurut skala responnya.
Saat mengkonstruksi skala kumulatif, satu hal yang harus
ditentukan terlebih dahulu dari semua yaitu apakah item-item membentuk skala
unidimensional. Untuk malakukan hal ini, salah satunya menganalisis
reproduksibilitas dari respon-respon ― artinya, proporsi dari respon secara
aktual jatuh ke dalam contoh/pola. Pada dasarnya skor total, suatu prediksi
yang dibuat dari pola respon terhadap item-item tertentu. Kemudian pola aktual
dari respon dipelajari dan suatu pengukuran dibuat dari batasan terhadap yang
mana respon reprodusibel dari skor total. Salah satu teknik adalah membagi
total jumlah eror dengan total jumlah respon dan substrak dari salah satu.
Guttman menyarankan 0,90 koefisien reproduksibilitas minimum diperlukan untuk
serangkaian item untuk dikenali sebagai bentuk skala unidimensional atau
kumulatif.
Beberapa pendukung bahwa skala Guttman
lebih teoretis dari pada signifikan praktis karena hal ini sulit untuk
mengumpulkan item-item kriteria reproduksibilitas yang memuaskan. Teknik ini
juga dikritik karena tidak menyarankan langkah-langkah untuk mempersiapkan atau
memilih item-item. Hanya setelah item-item dipilih dapat memutuskan
reproduksibilitasnya.
d.
Semantic differensial scales
Salah satu pendekatan pengukuran sikap
adalah Semantic differensial scales
yang merupakan teknik pengukuran sikap yang dikembangkan oleh Osgood, Suci dan
Tannenbaum. Semantic differensial
didasarkan pada asumsi bahwa objek mempunyai dua jenis perbedaan makna
individu, yaitu makna konotatif dan denotatif, yang dapat dinilai secara
independen. Denotatif merujuk pada makna yang terdapat dalam kamus, sedangkan
konotatif merujuk pada makna asosiasi atau saran yang dimaksudkan oleh kata
tersebut. Lebih mudah menetapkan makna denotatif suatu objek daripada makna
konotatifnya. Namun sangat mungkin untuk mendapatkan makna konotatif dengan
meminta secara langsung kepada individu untuk menilai objek yang dimaksud
menggunakan bilangan atau adjektif bipolar. Dengan demikian makna suatu objek
bagi seseorang membuat pola dari nilainya dari objek tersebut pada skala
adjektif bipolar.
Osgood
dan kawan-kawan menemukan, melalui studi faktor analitik, tiga kelompok (cluster) adjektif, yaitu evaluatif yang
terdiri dari objektif seperti baik dan buruk, potensi yang terdiri dari
adjektif seperti kuat atau lemah, dan aktivitas yang terdiri dari adjektif
seperti aktif atau pasif.
Skala sikap dikonstrusi dengan memilih pasangan adjektif yang mewakili dimensi evaluatif. Pasangan adjektif dipresensikan sepanjang tujuh kategori skala respons dan responden langsung memberi tanda X pada salah satu dari tujuh spasi untuk mengindikasi batasan terhadap yang mana setiap adjektif menggambarkan objek. Sebagai contoh, andaikan seseorang ingin mengukur sikap peserta didik kelas dua terhadap sekolah.
Catatan untuk skala di atas bahwa pasangan adjektif
didaftar pada dua sisi untuk meminimalkan rangkaian respon. Rangkaian respon
merujuk pada kecenderungan untuk menyukai posisi tertentu dalam daftar pilihan.
Seseorang harus memiliki kecenderungan untuk memilih secra ekstrim sisi kanan
dan akan mencentang pada posisi tersebut untuk setiap item. Namun sisi skala
diubah secara acak sehingga sisi kanan tidak selalu memuat respon yang paling
disukai, kemudian individu diwajibkan untuk membaca item dan respon dalam
tingkat isinya daripada melihat posisinya. Dalam menskor semantic differensial scale, biasanya, poin-poinnya disusun pada
skala 1-7 dengan 7 mewakili respon paling positif. Dengan demikian, item
pertama pada contoh di atas, bad akan
mendapat skor 1 dan good akan
mendapat skor 7 pada posisi terakhir Pada item ke 2 merupakan kebalikannya,
pada ujung yang satu, active mendapat
skor 7 dan ujung yang lain passive
mendapat skor 1. Nilai-nilai pada semua item ditotal dan dilporkan skor
rata-ratanya.
4.
Rating Scales
Rating
scales (skala penilaian) merupakan salah satu instrumen yang
paling banyak digunakan untuk pengukuran. Rating
scales meliputi asesmen oleh seseorang terhadap kinerja atau perilaku orang
lain. Secara khas, penilai diminta untuk menempatkan orang yang akan dinilai
pada beberapa poin dalam kontinum atau kategori-kategori yang menggambarkan
karakteristik perilaku orang yang dinilai. Nomor nilai dilekatkan/ditempelkan
pada poin atau ketagori tersebut. Penilai diasumsikan telah terbiasa dengan ciri
khas perilaku individual. Rating scales
banyak digunakan dalam penelitian tentang perkembangan anak dan aspek-aspek
perilaku lainnya.
Ada beberapa jenis rating scales, salah satu yang sering digunakan adalah skala
grafik, dimana penilai secara sederhana menempatkan tanda centang pada poin
yang sesuai di atas garis horizontal yang berjalan dari salah satu perilaku
ekstrim ke perilaku ekstrim lainnya. Misalnya:
Jenis
kedua dari rating scales yaitu skala
kategori, yang terdiri dari sejumlah kategori yang disusun dalam suatu seri
orde. Lima sampai tujuh kategori yang banyak digunakan. Penilai menyeleksi
salah satu pilihan terbaik yang mencirikan perilaku orang yang dinilai.
Misalnya, penilai hendak menilai kemampuan peserta didik dan salah satu
karakteristik yang akan dinilai yaitu kreativitas, maka item kategorinya
meliputi, antara lain:
Seberapa
kreatifkah peserta didik Ini? (pilih salah satu)
Luar
biasa kreatif
Sangat
kreatif
Kreatif
Tidak
kreatif
Sama
sekali tidak kreatif
Kadang-kadang
frase deskriptifnya diringkas sebagai berikut:
Seberapa
kreatifkah peserta didik Ini? (pilih salah satu)
Selalu
mempunyai ide kreatif
Mempunyai
banyak ide kreatif
Kadang-kadang
mempunyai ide kreatif
Jarang
sekali mempunyai ide kreatif
Dalam menggunakan skala grafik dan skala kategori, penilai membuat keputusan tanpa membandingkan secara langsung orang yang dinilai dengan seseorang atau sekelompok orang lain. Dalam rating scales komparatif, pada sisi yang lain, penilai diinstruksikan untuk membuat keputusan dengan refrensi langsung ke posisi yang lain yang dengannya individu tersebut dibandingkan. Posisi dalam rating scales didefinisikan dalam istilah populasi yang ditentukan dengan karakteristik yang diketahui. Rating scale komparatif ditunjukkan sebagai berikut
Misalnya,
skala akan digunakan untuk menyeleksi penerimaan peserta didik yang baru saja
lulus. Penilai diminta untuk memutuskan kemampuan calon untuk melakukan
pekerjaan yang dibandingkan dengan semua peserta didik yang diketahui penilai.
Jika rating valid, maka keputusan
memiliki pengertian tentang range dan distribusi kemampuan kelompok total dari
lulusan.
Semua teknik penilaian (rating) harus mempertimbangkan error
(kesalahan), yang dikurangi dengan validitas dan reliabilitas. Error yang
paling sering terjadi yaitu efek halo, yang terjadi ketika penilai mengijinkan
generalisasi kesan subjek untuk mempengaruhi penilaian terhadap
perilaku.Misalnya, guru menilai seorang peserta didik yang memiliki prestasi
yang baik di sekolah (disukai guru), sehingga memberi nilai baik terhadap aspek
kecerdasan, popularitas, kejujuran, kerja keras, dan semua aspek lainnya,
sedangkan peserta didik yang memiliki prestasi rendah (kurang disukai guru)
diberi nilai rendah untuk semua aspek.
Tipe error yang lain
yaitu error generositas, yang menunjukkan tendensi/kecenderungan untuk
memberikan keuntungan bagi subjek. Sebaliknya tipe error of severity, penilai
cenderung memberi nilai terlalu rendah untuk semua aspek atau karakteristik.
Salah satu cara
mengurangi error, penilai perlu dilatih atau melatih diri sebelum diminta untuk
menilai. Mereka harus diinformasikan tentang kemungkinan kesalahan yang dapat
dilakukan. Hal yang paling penting yaitu penilai harus memiliki waktu yang
cukup untuk mengamati perlilaku peserta didik. Cara yang lain, tiap perilaku
dan poin yang akan dinilai harus didefinisikan dengan jelas.
Reliabilitas
rating scales biasanya meningkat oleh
penilai yang membuat penialian
independen pada individu. Penilaian independen dikutubkan atau
dirata-rata untuk memperoleh nilai akhir.
5.
Teknik
Sosiometri
Teknik sosiometri digunakan untuk mempelajari organisasi kelompok sosial. Prosedur dasar, namun dapat dimodifikasi dalam beberapa cara, meliputi proses meminta anggota kelompok tertentu untuk mengindikasikan pilihan pertama, kedua, ketiga dan seterusnya untuk mencocokan berdasarkan kriteria tertentu, biasanya beberapa aktivitas tertentu. Sebagai contoh, setiap peserta didik dalam kelompok belajar atau kelas diminta untuk memilih dua peserta didik lainnya yang mereka suka sebagai teman belajar, teman makan bersama, atau teman bermain. Metode sosiometri terutama sekali meneliti tentang pilihan yang dibuat oleh setiap orang dalam kelompok tertentu. Pilihan yang diperoleh diplotkan pada sosiogram, yang menggambarkan pola interaksi antar individu dalam kelompok.
Seperti terlihat pada gambar, Fred
paling sering dipilih sebagai anggota kelompok, bisa dianggap sebagai ‘bintang’
kelas. Catatan bahwa Pat, Ann dan John saling memilih satu sama lain. Ini
mewakili kelompok orang yang mempunyai kesukaan yang sama, yaitu tiga atau
lebih individu yang saling memilih satu sama lain. Bill tidak ada yang memilih,
ia seorang yang terisolasi. Pilihan-pilihan ditampilkan dalam sosiogram yang
dapat dikuantifikasi dan digunakan untuk tujuan penelitian.
Metode sosiometri secara
luas digunakan dalam penelitian psikologi sosial dan juga dalam penelitian
pendidikan, dimana status sosiometri dapat dipelajari dalam hubungannya dengan
variabel lainnya, seperti kemampuan mental, prestasi, dan peserta didik yang disukai guru.
6.
Observasi
atau pengamatan langsung
Observasi adalah suatu
proses pengamatan dan pencatatan secara sistematis, logis, objektif dan
rasional mengenai berbagai fenomena. Alat yang digunakan dalam melakukan
observasi disebut pedoman observasi. Tujuan utama observasi adalah (1) untuk
mengumpulkan data mengenai suatu fenomena baik berupa peristiwa maupun
tindakan, baik dalam situasi sesungguhnya maupun dalam situasi buatan, (2)
untuk mengukur perilaku kelas (baik perilaku guru maupun perilaku peserta
didik), interaksi antara peserta didik dan guru, dan faktor-faktot yang dapat
diamati lainnya terutama ranah sosial (social
domain) dan ranah afektif. Dalam evaluasi pembelajaran, observasi dapat digunakan
untuk menilai proses dan hasil belajar peserta didik, seperti tingkah laku pada
waktu belajar, berdiskusi, mengerjakan tugas dan lain-lain. Observasi juga
dapat digunakan untuk menilai penampilan guru dalam mengajar, suasana kelas,
hubungan sesama guru, hubungan sesama peserta didik, hubungan guru dengan
peserta didik, dan perilaku lainnya. Namun, observasi memiliki banyak
kelemahan, terutama dalam pelaksanaan, karena untuk mengamati individu maupun
kelompok adalah pekerjaan yang tidak mudah. Masalah validitas dan reliabilitas
instrumen, karena kemungkinan melakukan penilaian subjektif oleh pengamat cukup
besar.
Rating scales dengan skala kategori yang
disusun dalam suatu seri urutan.
Seberapa
mandirikah peserta didik A? (pilih salah satu)
Luar
biasa mandiri
Sangat
mandiri
Mandiri
Tidak
mandiri
Sama
sekali tidak mandiri
Frase deskriptifnya dapat juga diringkas sebagai berikut:
Seberapa
mandirikah peserta didik A? (pilih salah satu)
Selalu
mandiri
Seringkali
mandiri
Kadang-kadang
mandiri
Jarang
sekali mandiri
Seberapa
disiplinkah peserta didik A?
Selalu
disiplin
Seringkali
disiplin
Kadang-kadang
disiplin
Jarang
sekali disiplin
Seberapa
kreatifkah peserta didik A? (pilih salah satu)
Selalu
mempunyai ide kreatif
Mempunyai
banyak ide kreatif
Kadang-kadang
mempunyai ide kreatif
Jarang sekali mempunyai
ide kreatif
Menurut
taksonomi yang dikembangkan oleh Dettmer (2006), fase-fase dalam ranah afektif
berkembang dari tingkat dasar sampai tingkat yang paling tinggi. Sebagai
contoh: Sikap jujur
Menerima
dengan sikap jujur: menerima pelajaran IPA dari guru dan membandingkannya
dengan pengetahuan yang dimiliki.
Menanggapi
dengan sikap jujur: jika pelajaran yang diberikan guru, menurut pemahaman saya,
ada yang keliru, maka guru perlu saya beritahukan.
Menghargai
sikap jujur: dalam eksperimen, hasil yang saya dapatkan berbeda dari referensi
yang ada di buku, saya harus melaporkan hasil saya sesuai dengan eksperimen.
Mengkarakterisasi sikap
jujur: Saya sangat menghargai kejujuran, karena itu saya tidak mau meraih
prestasi dengan cara tidak jujur. Saya selalu rajin belajar agar memperoleh
nilai terbaik. Saya tidak pernah mencontek walaupun tidak ada pengawas dalam
ujian. Bagi saya, kejujuran sama berharganya dengan prestasi. Keberhasilan yang
dicapai dengan cara tidak jujur, bukanlah prestasi.
Kesimpulan
Nilai-nilai
dalam ranah afektif dan ranah sosial perlu dipisahkan karena merupakan dua hal
yang berbeda namun saling berhubungan. Kompetensi dalam ranah sosial juga perlu
dikembangkan disamping ranah afektif. Ranah afektif dan ranah sosial dalam IPA
perlu dikembangkan berdasarkan nilai-nilai yang berhubungan dengan konten dan
objek pelajaran IPA. Nilai-nilai yang dimaksudkan oleh Depdiknas dapat dimasukkan
ke dalam pelajaran IPA dengan membuat indikator ranah afektif. Inventori, skala
sikap, rating scales dan sosiometri
merupakan teknik-teknik pengukuran yang dapat digunakan untuk mengukur kompetensi
yang berkaitan dengan nilai-nilai afektif dan sosial.
DAFTAR PUSTAKA
_____. (2011). Krathwohl's
taxonomy of affective ranah. Artikel. Diambil pada tanggal 17 Oktober 2011,
dari http://classweb.gmu.edu/ndabbagh/Resources/Resources2/ krathstax.html.
Ary, D. (1985). Introduction
to research in Education (3th ed.). USA: College Publishing.
Dettmer, P. (2006). New Blooms in established
fields: four ranahs of learning and doing. ProQuest Education
Journals, 28, 2, 70-78.
Koballa, T. (2011). The
Affective Ranah in Science Education. Artikel. Diambil pada tanggal 17
Oktober 2011, dari http://serc.carleton.edu/NAGTWorkshops/affective/
framework.html.
Wikipedia. (21 Juni 2011). Taksonomi Bloom. Artikel. Diambil pada tanggal 17 Oktober 2011,
dari http://id.wikipedia.org/wiki/Taksonomi_Bloom.
No comments:
Post a Comment