Monday, November 28, 2016

Penilaian Sikap atau Ranah Afektif dan Sosial

Penilaian Sikap atau Ranah Afektif dan Sosial

A.    Pendahuluan
      Benjamin Bloom mengkategorikan tujuan pendidikan ke dalam ranah kognitif, afektif dan psikomotor (Wikipedia, 2011). Ranah afektif berisi perilaku-perilaku yang menekankan aspek perasaan dan emosi, seperti minat, sikap, dan motivasi. Perilaku-perilaku afektif perlu dikembangkan dalam pendidikan di sekolah. Menurut Depdiknas, pendidikan budaya dan karakter bangsa harus diusahakan bersama-sama oleh sekolah, masyarakat, dan pemerintah. Khusus sekolah seyogyanyanya dilakukan secara bersama oleh semua guru dan pimpinan sekolah, melalui semua civitas sekolah dan menjadi bagian yang tak terpisahkan dari budaya sekolah.

B.    Ranah Afektif dan Ranah Sosial atau Penilaian Sikap
      Taksonomi pendidikan yang dikembangkan oleh Bloom, Krathwhol, dan para kolabolator digunakan untuk merencanakan objektif instruksional, merancang kurikulum, dan merencanakan pencapaian. Pengembangannya meliputi ranah kognitif, psikomotorik, afektif dan sosial. Selanjutnya keempat ranah ini disintesis menjadi kesatuan yang disebut ranah terpadu (unified domain) (Dettmer, 2006). Afektif (dari bahasa Latin affectus, yang berarti "perasaan") mencakup sejumlah konstruksi, seperti sikap, nilai, kepercayaan, pendapat, minat, dan motivasi (Koballa, 2011). Sikap (dalam bahasa Inggris attitude) dapat diartikan cara berpikir. Sikap umumnya didefinisikan sebagai kecenderungan untuk merespon secara positif atau negatif terhadap benda, orang, tempat, peristiwa, dan gagasan.
Ranah afektif pada awalnya diklasifikasikan berdasarkan objektif sikap dan emosi. Tingkatan ranah afektif menurut Krathwohl  ada lima, yaitu receiving (menerima), responding (menanggapi), valuing (menilai), organization (organisasi), dan characterization (karakterisasi) (_____,2011). Kemudian, ranah afektif diperluas mencakup internalize (internalisasi nilai-nilai), wonder (rasa ingin tahu), dan aspire (mencita-citakan) (Dettmer, 2006). Dettmer menambahkan ranah sosial ke dalam taksonomi Bloom yang baru. Hal ini sangat beralasan, karena kemampuan afektif seseorang merupakan faktor internal yang berkaitan dengan perasaan dan proses merasakan dalam diri seseorang, sedangkan kemampuan sosial berkaitan erat dengan sosial budaya dan proses interaksi seseorang dengan orang lain atau lingkungan di sekitar.




Penilaian sikap atau ranah afektif dan ranah sosial menggunakan bentuk penilaian formatif. Metode untuk penilaian formatif ranah afektif dan ranah sosial  dapat menggunakan beberapa bentuk instrumen pengukuran yang tergantung pada apa yang ingin diukur.

1. Pengukuran Kepribadian
Pengukuran kepribadian dikonsentrasikan bukan pada tes intelektual atau kompetensi kognitif. Ada beberapa tipe pengukuran kepribadian, masing-masing tipe merefleksikan teori dengan sudat pandang yang berbeda. Beberapa tipe merefleksikan teori sifat dan tipe kepribadian, sedangkan beberapa yang lain merefleksikan teori psikoanalitik dan motivasi. Pendidik harus tahu dengan tepat tentang hal yang akan diukur dan jenis instrumen yang akan digunakan, dengan memperhatikan bukti validitas.
a.       Inventori
      Dalam inventori, subjek yang dipresentasi dengan suatu luasan kumpulan pernyataan yang menggambarkan contoh perilaku dan yang dimaksudkan untuk mengindikasikan apakah setiap pernyataan merupakan karakteristik perilaku mereka atau tidak, dengan memberi tanda ya, tidak atau tidak pasti. Skor dikomputasi dengan menghitung jumlah respons yang setuju dengan sifat yang penguji ukur. Daftar pernyataan disusun dalam bentuk kuesioner. Kuesioner ini mirip wawancara terstruktur dan peneliti menanyakan pertanyaan yang sama untuk setiap orang, dan jawaban biasanya diberikan dalam bentuk yang mudah dinilai, biasanya dengan bantuan komputer.
      Beberapa inventori kepribadian hanya mengukur satu sifat, misalnya California F-Scale untuk mengukur autoritarianisme, Cattell's Sixteen Personalitg Factor Queslionnoire untuk mengukur sejumlah sifat, Minnesota Multiphasic Personality lnventory, Guilford-Zimerman Temperament Survey, Mooney Problem Check List, dan Edwards Personal Preference Schedule. Menurut Atkinson dan kawan-kawan, investori kepribadian mungkin dirancang untuk menilai dimensi tunggal kepribadian (misalnya, tingkat kecemasan) atau beberapa sifat kepribadian secara keseluruhan. Investori kepribadian yang terkenal dan banyak digunakan untuk menilai kepribadian seseorang ialah: (a) Minnesota Multiphasic Personality Inventory (MMPI), (b) Rorced-Choice Inventories, dan (c) Humm-Wadsworth Temperament Scale (H-W Temperament Scale).
1)      Minnesota Multiphasic Personality Inventory (MMPI)
            MMPI terdiri atas kira-kira 550 pernyataan tentag sikap, reaksi emosional, gejala fisik dan psikologis, serta pengalaman masa lalu. Subjek menjawab tiap pertanyaan dengan menjawab “benar”, “salah”, atau “tidak dapat mengatakan”. Pada prinsipnya, jawaban mendapat nilai menurut kesesuaiannya dengan jawaban yang diberikan oleh orang-orang yang memiliki berbagai macam masalah psikologi. MMPI dikembangkan guna membantu klinis dalam mendiagnosis gangguan kepribadian. Para perancang tes tidak menentukan sifat mengukurnya, tetapi memberikan ratusn pertanyaan tes untuk mengelompokkan individu. Tiap kelompok diketahui berbeda dari normalnya menurut kriteria tertentu. Kelompok kriteria terdiri atas individu yang telah dirawat dengan diagnosis gangguan paranoid. Kelompok kontrol terdiri atas orang yang belum pernah didiagnosis menderita masalah psikiatrik, tetapi mirip dengn kelompok kriteria dalah hal usia, jenis kelamin, status sosioekonomi, dan variabel penting lain.
2)      Rorced-Choice Inventories
            Rorced-Choice Inventories atau Inventori Pilihan-Paksa termasuk klasifikasi tes yang volunter. Suatu tes dikatakan volunter bila subjek dapat memilih pilihan yang lebih disukai, dan tahu bahwa semua pilihan itu benar, tidak ada yang salah (Muhadjir,1992). Subjek, dalam hal ini, diminta memilih pilihan yang lebih disukai, lebih sesuai, lebih cocok dengan minatnya, sikapnya, atau pandangan hidupnya.
3)      Humm-Wadsworth Temperament Scale (H-W Temperament Scale)
            H-W Temperament Scale dikembangkan dari teori kepribadian Rosanoff (Muhadjir, 1992). Menurut teori ini, kepribadian memiliki enam komponen, yang lebih banyak bertolak dari keragaman abnomal, yaitu:
a)      Schizoid Autistik, mempunyai tendensi tak konsisten, berpikirnya lebih mengarah pada khayalan.
b)      Schizoid Paranoid, mempunyai tendensi tak konsisten, dengan angan bahwa dirinya penting.
c)      Cycloid Manik, emosinya tidak stabil dengan semangat berkobar.
d)     Cycloid Depress, emosinya tak stabil dengan retardasi dan pesimisme.
e)      Hysteroid, ketunaan watak berbatasan dengan tendensi kriminal.
f)       Epileptoid, dengan antusiasme dan aspirasi yang bergerak terus.
            H-W Temperament Scale tersusun dalam sejumlah item yang berfungsi untuk memilahkan kelompok yang patologik dari kelompok penderita hysteroid, misalnya, diasumsikan memiliki mental kriminal.
      Inventori telah digunakan dalam penelitian pendidikan untuk memperoleh deskripsi sifat yang menggambarkan kelompok tertentu, misalnya kelompok dibawah rata-rata, kelompok dropout, kelompok minoritas dan sebagainya. Beberapa penelitian dikonsentrasikan untuk melihat hubungan antara sifat kepribadian dengan beberapa variabel seperti kecerdasan, prestasi, dan sikap.
      Inventori memiliki keuntungan yaitu murah, sederhana dan objektif. Kelemahannya berkaitan dengan masalah validitas. Validitasnya tergantung pada kemampuan responden membaca dan memahami item-itemnya, pengenalannya akan diri sendiri, dan khususnya keinginan mereka menjawab dengan jujur dan terbuka. Berdasarkan pada hasil, informasi yang diperoleh dari inventori mungkin hanya permukaannya saja atau bias. Kemungkinan ini semestinya dimasukkan ke dalam laporan ketika hasil diperoleh dari instrumen.
b.      Teknik Proyektif
      Dalam tes-tes kepribadian dengan pendekatan proyektif, individu memberikan respon pada stimulus yang tidak terstruktur dan ambigu, dimana hal ini berbeda dengan tes objektif yang memuat beberapa pertanyaan berstruktur. Sehingga diharapkan dengan menggunakan tes proyektif, individu secara tidak sadar akan mengungkap dan menggambarkan struktur dan dinamika kepribadiannya.
      Teknik proyektif yang banyak dikenal dan digunakan secara luas oleh ahli psikologi yaitu tes Rorschach, Thematic Apperception Test (TAT), Children’s Apperception Test (CAT), Draw-A-Person (DAP),  Make-A-Picture Story (MAPS), Michigan Picture Story Test, dan Sentence Completion Test. Berikut adalah penjelasan lebih lanjut mengenai tes-tes tersebut:
1)      Thematic Apperception Test (TAT)
            TAT adalah yang dikenal sebagai teknik interpretasi gambar karena menggunakan rangkaian standar provokatif berupa gambar yang ambigu dan subjek yang harus menceritakan sebuah cerita dari gambar yang tertera. Subjek diminta untuk mengatakan sebagai sebuah cerita yang dramatis.
2)      Children’s Apperception Test (CAT)
            Bentuk lain dari TAT adalah CAT (Children’s Apperception Test), yang digunakan untuk anak-anak. CAT menampilkan sepuluh gambar binatang dalam konteks sosial manusia seperti memainkan game atau tidur di tempat tidur. Pada saat ini, versi ini dikenal sebagai CAT atau CAT-A (gambar binatang).
3)      Michigan Picture Story Test (MPST)
            Tes ini hampir sama dengan kedua tes diatas dan terdiri dari material yang menggambarkan anak-anak dalam hubungannya dengan orang tua, polisi, dan figur otoriter lainnya, juga teman-teman. Tes ini sangat bermanfaat dalam melihat struktur dari sikap anak-anak terhadap orang dewasa dan teman-teman sekaligus mengevaluasi masalah yang mungkin timbul.
4)      Make-A-Picture Story (MAPS)
            Tes ini juga hampir sama dengan MPST dalam interpretasi dan tujuan yang dimiliki. Perbedaannya, individu boleh memilih karakter yang ada untuk membuat sebuah cerita berdasarkan situasi yang ada.
5)      Figure Drawing
            Dalam tes ini, kemampuan menggambar bukanlah faktor utama. Salah satu bentuk tesnya adalah Draw-A-Person (DAP), dimana individu diminta untuk menggambar seorang lelaki dan perempuan menggunakan pensil dan kertas.
6)      Incomplete Sentence Test
            Dalam metode proyektif ini, terdiri dari sejumlah kalimat tidak lengkap yang disajikan untuk dilengkapi. Biasanya bukan merupakan tes standar dan tidak diperlakukan secara kuantitatif. Penting sebagai bahan pertimbangan dalam situasi klinis yang memiliki asumsi bahwa respon individu terhadap stimulus yang ambigu merupakan proyeksi dari hal-hal yang ada dalam ketidaksadaran. Respon yang diberikan subjek dapat memberikan gambaran area konflik, termasuk juga kelebihan dan kekurangan dari kepribadian subjek.
7)      Competency Screening Test
            Diberikan kepada individu yang menjadi terdakwa untuk mempelajari interscorer kehandalan dan validitas prediktif tentang status mental atau inteligensi individu terkait dengan kasus individu yang sedang terjadi. Tes juga secara signifikan membedakan antara individu yang dikategorikan oleh praktisi sebagai tidak berkompetensi secara mental dan yang dikategorikan sebagai kompeten dalam sidang kasus yang dijalani.

8)      Rorschach Test
            Rorschach test juga dikenal sebagai tes inkblot Rorschach atau sekadar tes Inkblot adalah sebuah tes psikologi di mana subjek mempersepsi sebuah bentuk gambar tinta yang dicatat dan kemudian dianalisis dengan menggunakan interpretasi psikologis. Beberapa psikolog menggunakan tes ini untuk memeriksa kepribadian seseorang baik karakteristik maupun fungsi emosional. Telah digunakan untuk mendeteksi gangguan pikiran yang mendasari individu, terutama dalam kasus-kasus di mana pasien tidak mau untuk menggambarkan proses berpikir mereka secara terbuka. Tes ini mengambil namadari penciptanya yaitu psikolog dari Swiss, Hermann Rorschach.
            Teknik proyektif digunakan terutama dalam psikologi klinis untuk mempelajari dan mendiagnosis masalah emosional seseorang. Teknik ini jarang digunakan dalam pendidikan karena kebutuhannya lebih mengarah untuk latihan administrasi dan penskoran. Para ahli juga kurang puas terhadap masalah validitas instrumennya.

2. Skala Sikap
            Sikap merupakan suatu kecenderungan tingkah laku seseorang, subjek atau objek untuk berbuat sesuatu dengan cara, metode, teknik dan pola tertentu terhadap dunia di sekitarnya. Guru perlu mengetahui norma-norma yang ada pada peserta didik bahkan sikap peserta didik terhadap dunia sekitarnya, terutama terhadap mata pelajaran dan lingkungan sekolah. Jika terdapat sikap peserta didik yang negatif, guru perlu mencari suatu cara dan teknik tertentu untuk menempatkan sikap negatif itu menjadi sikap yang positif. Dalam mengukur sikap, guru hendaknya memperhatikan tiga komponen sikap yaitu (1) kognisi, berkenaan dengan pengetahuan peserta didik tentang objek, (2) Afeksi, berkenaan dengan perasaan peserta didik terhadap objek, (3) Konasi, berkenaan dengan kecenderungan berperilaku peserta didik. Disamping itu guru juga harus memilih salah satu model skala sikap.
            Skala merupakan seperangkat bilangan untuk menyatakan nilai yang dikenakan pada subjek, objek, atau perilaku bagi tujuan quantifikasi dan pengukuran kualitas. Skala digunakan untuk mengukur sikap, nilai dan karakter lainnya. Skala-skala ini berbeda dari tes dalam hal hasil dari instrumen, tidak seperti tes-tes pada umumnya, instrumen tidak mengindikasikan kesuksesan atau kegagalan, kelemahan atau kekuatan. Instrumen mengukur derajat karakteristik proses ketertarikan individu. Misalnya, mengukur sikap peserta didik terhadap pelajaran kimia.
            Pengembangan skala untuk mengukur sikap, nilai, dan karakter lainnya dapat meliputi berbagai teknik yang berbeda-beda. Sikap dapat didefinisikan sebagai pengaruh positif atau negatif terhadap kelompok tertentu, institusi, konsep atau objek sosial. Pengukuran sikap untuk menduga kemampuan guna menempatkan individu pada kontinum kesukaan-ketidaksukaan terhadap objek. Ada empat tipe skala sikap yang umum digunakan.
a.       Summated rating scales (Skala Likert)
      Skala Likert, sebagai metode untuk mengukur sikap, merupakan salah satu tipe skala yang digunakan oleh sebagian besar peneliti dan memberikan hasil yang baik. Skala Likert menilai sikap terhadap suatu hal dengan membuat pernyataan kepada responden untuk mengindikasikan apakah responden menunjukan respon sangat setuju (SS), setuju (S), tidak berpendapat (TB), tidak setuju (TS), dan sangat tidak setuju (STS) terhadap pernyataan tentang hal-hal tersebut. Skala Likert dikonstruksi dengan mengumpulkan sejumlah pernyataan tentang suatu objek, setengah dari jumlah pernyataan tentang kesukaan dan setengahnya lagi tentang pernyataan ketidaksukaan terhadap suatu objek. Hal yang penting adalah bahwa pernyataan-pernyataan ini merakit suatu contoh representatif tentang semua pendapat atau sikap yang mungkin terhadap suatu objek. Hal yang mungkin sangat membantu adalah memikirkan semua subtopik yang berhubungan dengan objek sikap dan kemudian menuliskan item-item pada setiap subtopik. Selanjutnya item-item ini divalidasi oleh orang yang memiliki pengetahuan dan mengerti batasan sikap positif dan negatif.

      Pernyataan, sepanjang kontinum setuju-tidak setuju, dipresensikan kepada subjek. Pernyataan harus disusun secara acak untuk menjamin bahwa respon mengena pada subjek. Untuk menskor skala, kategori respon harus berbobot. Bagi item pernyataan kesukaan atau positif, nilai bilangan berturut-turut 5, 4, 3, 2, 1, disusun untuk kategori respon yang dimulai dengan pernyataan positif. Sangat setuju diberi nilai 5, sedangkan sangat tidak setuju diberi nilai 1. Bagi item pernyataan ketidaksukaan atau negatif merupakan kebalikannya, sangat setuju diberi nilai 1, sedangkan sangat tidak setuju diberi nilai 5. Misalnya, mengukur sikap peserta didik terhadap pelajaran kimia:

Peserta didik yang sangat menyukai pelajaran kimia akan setuju dengan pernyataan positif dan tidak setuju dengan pernyataan negatif.
Peserta didik yang setuju dengan pernyataan pertama diberi nilai 4 dan tidak setuju dengan pernyataan kedua diberi nilai 4, jumlahnya adalah 8 (4+4) untuk kedua item. Jumlah seluruh bobot item yang dicentang oleh subjek pada skala akan merepresentasikan skor total individu.
      Skor dengan nilai tertinggi mengindikasikan sikap positif terhadap objek. Skor tertinggi adalah 5 dikalikan N (jumlah item) dan skor terendah 1 dikalikan N.
      Setelah skala sikap diujicobakan terhadap kelompok responden, analisis item perlu dilakukan untuk mengidentifikasi item terbaik. Paling tidak, ada tiga tipe statistik untuk menganalisis: 1) indeks item diskriminasi, 2) bilangan dan/atau persentase untuk setiap item yang ditandai responden, 3) mean atau standar deviasi item. Indeks item diskriminasi menunjukkan jangkauan atau batasan terhadap yang mana setiap item membedakan responden dalam cara yang sama seperti total skor diskriminan. Indeks item diskriminasi dikalkulasi dengan mengkorelasikan skor item dengan total skor skala. Setiap item akan memiliki korelasi minimal 0,25 dengan skor total. Item yang memiliki korelasi sangat rendah atau negatif akan dieliminasi karena tidak mengukur hal yang sama sebegai skala total dan tidak berkontribusi terhadap pengukuran sikap. Statistik 2 dan 3 mengindikasikan jangkauan atau batasan terhadap yang mana responden memiliki pilihan bervariasi. Item pada yang mana responden menyebar diantara kategori respon yang lebih disukai akan mengumpul pada satu atau dua kategori. Setelah memilih item yang baik, instrumen yang telah direvisi digunakan pada kelompok subjek yang berbeda dan akan memberikan reliabilitas yang baru.
      Ada beberapa kesulitan untuk menempatkan kriteria yang akan digunakan dalam menentukan validitas skala sikap. Beberapa peneliti menggunakan observasi perilaku sebagai kriteria bagi sikap yang diukur, tetapi prosedur ini jarang sekali digunakan karena kesulitan dalam menentukan perilaku yang bagaimana yang dapat menjadi kriteria terbaik bagi sikap dan juga kesulitan menjamin validitas pengukuran. Salah satu cara yang paling mudah untuk memvalidasi adalah menentukan batasan pada dua sikap yang telah diketahui akan berbeda, misal sikap terhadap masalah aborsi.
b.    Equal-appearing intervals scales (Skala Thurstone)
      Thurstone mengembangkan sebuah metode bagi penyusunan spesifik nilai skala untuk item-item sikap. Skala Likert menilai sikap dengan meminta responden untuk mengindikasikan derajat atau tingkat kesetujuan-ketidaksetujuan dengan serangkaian pernyataan, sedangkan skala Turstone menilai dengan mempresentasikan pernyataan tentang suatu topik dengan rentangan dari sangat suka, melalui sikap netral, menuju sangat tidak suka dan meminta responden untuk memilih dari pernyataan-pernyataan ini yang mana paling mendekati berhubunagn dengan sikap mereka sendiri. Membuat skala Thurstone meliputi beberapa langkah, yaitu:
            Mengumpulkan sejumlah besar pernyataan (50-100) yang mengekspresikan keluasan perbedaan derajat kesukaan-ketidaksukaan terhadap objek sikap, termasuk pernyataan netral. Pernyataan diberikan kepada sejumlah besar orang (50 atau lebih) yang memiliki cukup pengetahuan tentang objek untuk mengurutkan pernyataan ke dalam sebelas kategori sepanjang dimensi kesukaan-ketidaksukaan. Kategori A berisi pernyataan yang dapat diputuskan menjadi paling/sangat disukai, kategori B berisi pernyataan sangat disukai selanjutnya, agak sangat disukai, dan seterusnya. Pernyataan ke enam (F) berisi pernyataan netral yang memberi respek sikap netral, dan kategori K berisi pernyataan yang paling/sangat tidak disukai.





Klasifikasi pernyataan menjadi kategori-kategori tidak mempunyai sesuatu untuk dilakukan dengan sikap pemilik sikap terhadap objek psikologis, tetapi hanya mencerminkan persepsi mereka tentang kesukaan dan ketidaksukaan mengenai pernyataan.

Setelah keputusan dari pengukuran semua item, distribusi dari rating keputusan disiapkan bagi setiap item. Distribusi akan menunjukkan bilangan keputusan yang menempatkan setiap item ke dalam sebelas kategori. Sebagai contoh, anggapan pernyataan tentang pelajaran kimia ditempatkan dalam kategori A dengan 4 keputusan, dalam kategori B dengan 28 keputusan, dalam C dengan 32 keputusan dan dalam D dengan 16 keputusan. Ada dua nilai, yaitu median dan Q, yang dihitung dari distribusi tersebut.



Median dari rating (distribusi skor pengukuran item) keputusan adalah 2,75. Ini menjadi skala nilai yang ditunjukkan untuk item tersebut. Skala nilai mengindikasikan posisi item pada kontinum positif-negatif. Dalam hal membuat batasan persetujuan diantara keputusan-keputusan, indeks variabilitas dihitung untuk setiap item. Pengukuran variabilitas menggunakan Q, yaitu diviasi kuartil, yang sama dengan setengah dari selisish persentil ke-25 dan ke-75. Q lebih disukai daripada standar deviasi karena tidak dipengaruhi oleh skor ekstrim. Untuk contoh diatas Q=(3,38-2,07)/2 = 0,65. Tingginya tingkat persetujuan diantara keputusan-keputusan tentang bagaimana pernyataan disukai-tidak disukai akan dihasilkan dengan nilai Q yang rendah. Rendahnya tingkat persetujuan di antara keputusan-keputusan ditunjukkan dengan nilai Q yang tinggi. Item yang memiliki nilai Q terlalu tinggi akan dibuang karena menyebabkan ambigu pada skala.
Setelah skala nilai (median) dan nilai Q dihitung untuk setiap pernyataan, langkah selanjutnya adalah memilih pernyataan untuk mewakili poin pada kontinum kesukaan-ketidaksukaan yang didistribusikan pada nilai 1-11. Untuk batasan bahwa skala nilai mewakili kenaikan yang sama, salah satunya harus mencapai interval pengukuran. Jika dua atau lebih item memiliki skala nilai yang sama, item yang memiliki nilai Q paling rendah yang dipilih. Item-item ditempatkan dalam urutan acak pada bentuk akhir dan tentu saja, nilai-nilainya tidak ditunjukkan pada bentuk itu sendiri. Berikut ini contoh skala Thurstone.

Dalam menentukan skala Thurstone, penguji harus menginstruksikan kepada responden untuk mencentang hanya pernyataan yang mereka setujui saja. Skor sikap subjek merupakan rata-rata dari skala nilai (mean atau median) dari pernyataan yang dicentang. Skor rata-rata menempatkan individu pada kontinum kesukaan-ketidaksukaan dengan respek terhadap objek sikap. Dari contoh diatas, jika seorang responden setuju dengan pernyataan yang memiliki nilai 1,5; 2,3; 3,3; dan 4,5 dalam skala Thustone, skor sikapnya adalah 2,9 (median), yang mengindikasikan sikap suka terhadap mata pelajaran kimia.
      Jumlah sebaran skala nilai dari item sikap yang dicentang oleh beberapa responden dapat diambil sebagai pengukur batasan atau jangkauan untuk yang mana responden memiliki gambaran sikap yang jelas. Artinya bahwa seseorang dengan gambaran sikap yang baik terhadap beberapa objek akan diharapkan untuk mencentang hanya item-item yang sangat dekat dengan skala nilai. Jika respon seseorang menyebar luas tidak berdekatan item-itemnya, dapat diasumsikan bahwa responden memiliki ambigu atau miskin gambaran tentang sikap.
c.       Cumulative scales (Skala Guttman)
      Kritik terhadap skala sikap Thurstone dan Likert bahwa skala-skala ini berisi pernyataan-pernyataan heterogen mengenai berbagai dimensi terhadap suatu objek sikap. Sebagai contoh, pengukuran sikap terhadap perang dalam skala Thurstone, tidak ada usaha yang dibuat untuk memisahkan pernyataan etis dari pernyataan yang berhubungan dengan hasil ekonomis dari perang, atau yang mencerminkan aspek-aspek yang mungkin lainnya tentang sikap terhadap perang. Sebagai hasil dari kombinasi ini tentang beberapa dimensi dari satu skala, hal ini bisa sukar untuk membuat beberapa interpretasi yang jelas dari skor yang diperoleh.
      Guttman mengembangkan suatu teknik untuk mengatasi masalah tersebut. Teknik Guttman, dikarakteristik sebagai suatu skala unidimensional, bertujuan/bermaksud untuk menentukan jika sikap dipelajari secara aktual mencakup hanya sebuah dimensi tunggal. Sebuah sikap dianggap unidimensional hanya jika sikap itu menghasilkan suatu skala kumulatif ― salah satu dalam yang mana item-item dihubungkan dengan yang lain dalam hal suatu cara bahwa suatu subjek yang setuju dengan item 2 juga setuju dengan item 1, jika setuju dengan item 3, juga setuju dengan item 1 dan 2, dan seterusnya. Dengan demikian, individu yang menyetujui item tertentu dalam tipe skala ini akan memiliki skor lebih tinggi pada skala total daripada yang tidak menyetujui item tersebut. Sebagai contoh, mempertimbangkan item berikut dengan meminta responden menyetujui atau tidak menyetujui:
1.      PTA seharga dengan waktu yang dihabiskan untuk PTA itu sendiri.
2.      PTA merupakan suatu pengaruh kuat bagi perbaikan sekolah.
3.      PTA merupakan organisasi paling penting di Amerika Serikat untuk memperbaiki sekolah.
            Jika ini merupakan skala kumulatif, tentu memungkinkan untuk mengatur semua respon dari responden menjadi tipe contoh/model. Dengan demikian, jika diketahui skor seseorang, tentu memungkinkan untuk menceritakan secara tepat, item mana yang disetujuinya. Sebagai contoh, semua individu dengan skor 2 meyakini bahwa PTA seharga dengan waktu yang dihabiskan untuk itu dan PTA merupakan suatu pengaruh kuat bagi perbaikan sekolah, tetapi tidak yakin bahwa PTA merupakan organisasi paling penting di Amerika Serikat untuk memperbaiki sekolah. Subjek dapat diranking atau diberi peringkat menurut skala responnya.




Saat mengkonstruksi skala kumulatif, satu hal yang harus ditentukan terlebih dahulu dari semua yaitu apakah item-item membentuk skala unidimensional. Untuk malakukan hal ini, salah satunya menganalisis reproduksibilitas dari respon-respon ― artinya, proporsi dari respon secara aktual jatuh ke dalam contoh/pola. Pada dasarnya skor total, suatu prediksi yang dibuat dari pola respon terhadap item-item tertentu. Kemudian pola aktual dari respon dipelajari dan suatu pengukuran dibuat dari batasan terhadap yang mana respon reprodusibel dari skor total. Salah satu teknik adalah membagi total jumlah eror dengan total jumlah respon dan substrak dari salah satu. Guttman menyarankan 0,90 koefisien reproduksibilitas minimum diperlukan untuk serangkaian item untuk dikenali sebagai bentuk skala unidimensional atau kumulatif.
      Beberapa pendukung bahwa skala Guttman lebih teoretis dari pada signifikan praktis karena hal ini sulit untuk mengumpulkan item-item kriteria reproduksibilitas yang memuaskan. Teknik ini juga dikritik karena tidak menyarankan langkah-langkah untuk mempersiapkan atau memilih item-item. Hanya setelah item-item dipilih dapat memutuskan reproduksibilitasnya.

d.       Semantic differensial scales
      Salah satu pendekatan pengukuran sikap adalah Semantic differensial scales yang merupakan teknik pengukuran sikap yang dikembangkan oleh Osgood, Suci dan Tannenbaum. Semantic differensial didasarkan pada asumsi bahwa objek mempunyai dua jenis perbedaan makna individu, yaitu makna konotatif dan denotatif, yang dapat dinilai secara independen. Denotatif merujuk pada makna yang terdapat dalam kamus, sedangkan konotatif merujuk pada makna asosiasi atau saran yang dimaksudkan oleh kata tersebut. Lebih mudah menetapkan makna denotatif suatu objek daripada makna konotatifnya. Namun sangat mungkin untuk mendapatkan makna konotatif dengan meminta secara langsung kepada individu untuk menilai objek yang dimaksud menggunakan bilangan atau adjektif bipolar. Dengan demikian makna suatu objek bagi seseorang membuat pola dari nilainya dari objek tersebut pada skala adjektif bipolar.
Osgood dan kawan-kawan menemukan, melalui studi faktor analitik, tiga kelompok (cluster) adjektif, yaitu evaluatif yang terdiri dari objektif seperti baik dan buruk, potensi yang terdiri dari adjektif seperti kuat atau lemah, dan aktivitas yang terdiri dari adjektif seperti aktif atau pasif.
Skala sikap dikonstrusi dengan memilih pasangan adjektif yang mewakili dimensi evaluatif. Pasangan adjektif dipresensikan sepanjang tujuh kategori skala respons dan responden langsung memberi tanda X pada salah satu dari tujuh spasi untuk mengindikasi batasan terhadap yang mana setiap adjektif menggambarkan objek. Sebagai contoh, andaikan seseorang ingin mengukur sikap peserta didik kelas dua terhadap sekolah.


Catatan untuk skala di atas bahwa pasangan adjektif didaftar pada dua sisi untuk meminimalkan rangkaian respon. Rangkaian respon merujuk pada kecenderungan untuk menyukai posisi tertentu dalam daftar pilihan. Seseorang harus memiliki kecenderungan untuk memilih secra ekstrim sisi kanan dan akan mencentang pada posisi tersebut untuk setiap item. Namun sisi skala diubah secara acak sehingga sisi kanan tidak selalu memuat respon yang paling disukai, kemudian individu diwajibkan untuk membaca item dan respon dalam tingkat isinya daripada melihat posisinya. Dalam menskor semantic differensial scale, biasanya, poin-poinnya disusun pada skala 1-7 dengan 7 mewakili respon paling positif. Dengan demikian, item pertama pada contoh di atas, bad akan mendapat skor 1 dan good akan mendapat skor 7 pada posisi terakhir Pada item ke 2 merupakan kebalikannya, pada ujung yang satu, active mendapat skor 7 dan ujung yang lain passive mendapat skor 1. Nilai-nilai pada semua item ditotal dan dilporkan skor rata-ratanya.

4.      Rating Scales
   Rating scales (skala penilaian) merupakan salah satu instrumen yang paling banyak digunakan untuk pengukuran. Rating scales meliputi asesmen oleh seseorang terhadap kinerja atau perilaku orang lain. Secara khas, penilai diminta untuk menempatkan orang yang akan dinilai pada beberapa poin dalam kontinum atau kategori-kategori yang menggambarkan karakteristik perilaku orang yang dinilai. Nomor nilai dilekatkan/ditempelkan pada poin atau ketagori tersebut. Penilai diasumsikan telah terbiasa dengan ciri khas perilaku individual. Rating scales banyak digunakan dalam penelitian tentang perkembangan anak dan aspek-aspek perilaku lainnya.
     Ada beberapa jenis rating scales, salah satu yang sering digunakan adalah skala grafik, dimana penilai secara sederhana menempatkan tanda centang pada poin yang sesuai di atas garis horizontal yang berjalan dari salah satu perilaku ekstrim ke perilaku ekstrim lainnya. Misalnya:


Jenis kedua dari rating scales yaitu skala kategori, yang terdiri dari sejumlah kategori yang disusun dalam suatu seri orde. Lima sampai tujuh kategori yang banyak digunakan. Penilai menyeleksi salah satu pilihan terbaik yang mencirikan perilaku orang yang dinilai. Misalnya, penilai hendak menilai kemampuan peserta didik dan salah satu karakteristik yang akan dinilai yaitu kreativitas, maka item kategorinya meliputi, antara lain:
Seberapa kreatifkah peserta didik Ini? (pilih salah satu)
Luar biasa kreatif
Sangat kreatif
Kreatif
Tidak kreatif
Sama sekali tidak kreatif
Kadang-kadang frase deskriptifnya diringkas sebagai berikut:
Seberapa kreatifkah peserta didik Ini? (pilih salah satu)
Selalu mempunyai ide kreatif
Mempunyai banyak ide kreatif
Kadang-kadang mempunyai ide kreatif
Jarang sekali mempunyai ide kreatif
      Dalam menggunakan skala grafik dan skala kategori, penilai membuat keputusan tanpa membandingkan secara langsung orang yang dinilai dengan seseorang atau sekelompok orang lain. Dalam rating scales komparatif, pada sisi yang lain, penilai diinstruksikan untuk membuat keputusan dengan refrensi langsung ke posisi yang lain yang dengannya individu tersebut dibandingkan. Posisi dalam rating scales didefinisikan dalam istilah populasi yang ditentukan dengan karakteristik yang diketahui. Rating scale komparatif ditunjukkan sebagai berikut


Misalnya, skala akan digunakan untuk menyeleksi penerimaan peserta didik yang baru saja lulus. Penilai diminta untuk memutuskan kemampuan calon untuk melakukan pekerjaan yang dibandingkan dengan semua peserta didik yang diketahui penilai. Jika rating valid, maka keputusan memiliki pengertian tentang range dan distribusi kemampuan kelompok total dari lulusan.
                        Semua teknik penilaian (rating) harus mempertimbangkan error (kesalahan), yang dikurangi dengan validitas dan reliabilitas. Error yang paling sering terjadi yaitu efek halo, yang terjadi ketika penilai mengijinkan generalisasi kesan subjek untuk mempengaruhi penilaian terhadap perilaku.Misalnya, guru menilai seorang peserta didik yang memiliki prestasi yang baik di sekolah (disukai guru), sehingga memberi nilai baik terhadap aspek kecerdasan, popularitas, kejujuran, kerja keras, dan semua aspek lainnya, sedangkan peserta didik yang memiliki prestasi rendah (kurang disukai guru) diberi nilai rendah untuk semua aspek.
                        Tipe error yang lain yaitu error generositas, yang menunjukkan tendensi/kecenderungan untuk memberikan keuntungan bagi subjek. Sebaliknya tipe error of severity, penilai cenderung memberi nilai terlalu rendah untuk semua aspek atau karakteristik.
                        Salah satu cara mengurangi error, penilai perlu dilatih atau melatih diri sebelum diminta untuk menilai. Mereka harus diinformasikan tentang kemungkinan kesalahan yang dapat dilakukan. Hal yang paling penting yaitu penilai harus memiliki waktu yang cukup untuk mengamati perlilaku peserta didik. Cara yang lain, tiap perilaku dan poin yang akan dinilai harus didefinisikan dengan jelas.
Reliabilitas rating scales biasanya meningkat oleh penilai yang membuat penialian  independen pada individu. Penilaian independen dikutubkan atau dirata-rata untuk memperoleh nilai akhir.
5.      Teknik Sosiometri
    Teknik sosiometri digunakan untuk mempelajari organisasi kelompok sosial. Prosedur dasar, namun dapat dimodifikasi dalam beberapa cara, meliputi proses meminta anggota kelompok tertentu untuk mengindikasikan pilihan pertama, kedua, ketiga dan seterusnya untuk mencocokan berdasarkan kriteria tertentu, biasanya beberapa aktivitas tertentu. Sebagai contoh, setiap peserta didik dalam kelompok belajar atau kelas diminta untuk memilih dua peserta didik lainnya yang mereka suka sebagai teman belajar, teman makan bersama, atau teman bermain. Metode sosiometri terutama sekali meneliti tentang pilihan yang dibuat oleh setiap orang dalam kelompok tertentu. Pilihan yang diperoleh diplotkan pada sosiogram, yang menggambarkan pola interaksi antar individu dalam kelompok.

Seperti terlihat pada gambar, Fred paling sering dipilih sebagai anggota kelompok, bisa dianggap sebagai ‘bintang’ kelas. Catatan bahwa Pat, Ann dan John saling memilih satu sama lain. Ini mewakili kelompok orang yang mempunyai kesukaan yang sama, yaitu tiga atau lebih individu yang saling memilih satu sama lain. Bill tidak ada yang memilih, ia seorang yang terisolasi. Pilihan-pilihan ditampilkan dalam sosiogram yang dapat dikuantifikasi dan digunakan untuk tujuan penelitian.
                        Metode sosiometri secara luas digunakan dalam penelitian psikologi sosial dan juga dalam penelitian pendidikan, dimana status sosiometri dapat dipelajari dalam hubungannya dengan variabel lainnya, seperti kemampuan mental, prestasi, dan  peserta didik yang disukai guru.
6.      Observasi atau pengamatan langsung
     Observasi adalah suatu proses pengamatan dan pencatatan secara sistematis, logis, objektif dan rasional mengenai berbagai fenomena. Alat yang digunakan dalam melakukan observasi disebut pedoman observasi. Tujuan utama observasi adalah (1) untuk mengumpulkan data mengenai suatu fenomena baik berupa peristiwa maupun tindakan, baik dalam situasi sesungguhnya maupun dalam situasi buatan, (2) untuk mengukur perilaku kelas (baik perilaku guru maupun perilaku peserta didik), interaksi antara peserta didik dan guru, dan faktor-faktot yang dapat diamati lainnya terutama ranah sosial (social domain) dan ranah afektif. Dalam evaluasi pembelajaran, observasi dapat digunakan untuk menilai proses dan hasil belajar peserta didik, seperti tingkah laku pada waktu belajar, berdiskusi, mengerjakan tugas dan lain-lain. Observasi juga dapat digunakan untuk menilai penampilan guru dalam mengajar, suasana kelas, hubungan sesama guru, hubungan sesama peserta didik, hubungan guru dengan peserta didik, dan perilaku lainnya. Namun, observasi memiliki banyak kelemahan, terutama dalam pelaksanaan, karena untuk mengamati individu maupun kelompok adalah pekerjaan yang tidak mudah. Masalah validitas dan reliabilitas instrumen, karena kemungkinan melakukan penilaian subjektif oleh pengamat cukup besar.

Rating scales dengan skala kategori yang disusun dalam suatu seri urutan.
Seberapa mandirikah peserta didik A? (pilih salah satu)
Luar biasa mandiri
Sangat mandiri
Mandiri
Tidak mandiri
Sama sekali tidak mandiri

Frase deskriptifnya dapat juga diringkas sebagai berikut:
Seberapa mandirikah peserta didik A? (pilih salah satu)
Selalu mandiri
Seringkali mandiri
Kadang-kadang mandiri
Jarang sekali mandiri
Seberapa disiplinkah peserta didik A?
Selalu disiplin
Seringkali disiplin
Kadang-kadang disiplin
Jarang sekali disiplin
Seberapa kreatifkah peserta didik A? (pilih salah satu)
Selalu mempunyai ide kreatif
Mempunyai banyak ide kreatif
Kadang-kadang mempunyai ide kreatif
Jarang sekali mempunyai ide kreatif


Menurut taksonomi yang dikembangkan oleh Dettmer (2006), fase-fase dalam ranah afektif berkembang dari tingkat dasar sampai tingkat yang paling tinggi. Sebagai contoh: Sikap jujur
Menerima dengan sikap jujur: menerima pelajaran IPA dari guru dan membandingkannya dengan pengetahuan yang dimiliki.
Menanggapi dengan sikap jujur: jika pelajaran yang diberikan guru, menurut pemahaman saya, ada yang keliru, maka guru perlu saya beritahukan.
Menghargai sikap jujur: dalam eksperimen, hasil yang saya dapatkan berbeda dari referensi yang ada di buku, saya harus melaporkan hasil saya sesuai dengan eksperimen.
Mengkarakterisasi sikap jujur: Saya sangat menghargai kejujuran, karena itu saya tidak mau meraih prestasi dengan cara tidak jujur. Saya selalu rajin belajar agar memperoleh nilai terbaik. Saya tidak pernah mencontek walaupun tidak ada pengawas dalam ujian. Bagi saya, kejujuran sama berharganya dengan prestasi. Keberhasilan yang dicapai dengan cara tidak jujur, bukanlah prestasi.


Kesimpulan

Nilai-nilai dalam ranah afektif dan ranah sosial perlu dipisahkan karena merupakan dua hal yang berbeda namun saling berhubungan. Kompetensi dalam ranah sosial juga perlu dikembangkan disamping ranah afektif. Ranah afektif dan ranah sosial dalam IPA perlu dikembangkan berdasarkan nilai-nilai yang berhubungan dengan konten dan objek pelajaran IPA. Nilai-nilai yang dimaksudkan oleh Depdiknas dapat dimasukkan ke dalam pelajaran IPA dengan membuat indikator ranah afektif. Inventori, skala sikap, rating scales dan sosiometri merupakan teknik-teknik pengukuran yang dapat digunakan untuk mengukur kompetensi yang berkaitan dengan nilai-nilai afektif dan sosial.

DAFTAR PUSTAKA

_____. (2011). Krathwohl's taxonomy of affective ranah. Artikel. Diambil pada tanggal 17 Oktober 2011, dari  http://classweb.gmu.edu/ndabbagh/Resources/Resources2/ krathstax.html.

Ary, D. (1985). Introduction to research in Education (3th ed.). USA: College Publishing.

Dettmer, P. (2006). New Blooms in established fields: four ranahs of learning and doing. ProQuest Education Journals, 28, 2, 70-78.

Koballa, T. (2011). The Affective Ranah in Science Education. Artikel. Diambil pada tanggal 17 Oktober 2011, dari http://serc.carleton.edu/NAGTWorkshops/affective/ framework.html.

Wikipedia. (21 Juni 2011). Taksonomi Bloom. Artikel. Diambil pada tanggal 17 Oktober 2011, dari http://id.wikipedia.org/wiki/Taksonomi_Bloom.

0 komentar:

Post a Comment