Program Studi Pendidikan Kimia Fakultas Keguruan dan Ilmu Pendidikan Universitas Palangka Raya

Asesmen Ranah Afektif

BAB I

PENDAHULUAN



A. Latar Belakang Masalah

Benjamin Bloom mengkategorikan tujuan pendidikan ke dalam ranah kognitif, afektif dan psikomotor (Wikipedia, 2011). Ranah kognitif berisi perilaku-perilaku yang menekankan aspek intelektual, seperti pengetahuan, pemahaman, dan pengertian. Ranah afektif berisi perilaku-perilaku yang menekankan aspek perasaan dan emosi, seperti minat, sikap, dan motivasi. Ranah psikomotor berisi perilaku-perilaku yang menekankan aspek keterampilan motorik seperti menulis, melakukan, menggunakan, dan mengoperasikan.

Penelitian yang dilakukan oleh Richardson pada tahun 1990-an menunjukkan bahwa ada pergeseran dalam pendidikan, yaitu cenderung berorientasi lebih mengutamakan aspek kognitif. Secara teoretis sikap selaras dengan perasaan, dan keyakinan selaras dengan kognisi (Koballa, 2011). Sikap sepertinya tidak berhubungan dengan kognisi, tetapi dapat diasumsikan bahwa jika pengetahuan seseorang baik maka ada kemungkinan bahwa sikapnya baik. Walaupun belum tentu, karena sikap seseorang dipengaruhi oleh pengetahuan dan keyakinannya terhadap nilai-nilai atau aturan-aturan tertentu. Oleh sebab itu, aspek-aspek dalam ranah afektif merupakan bagian yang penting untuk dikembangkan melalui kegiatan pembelajaran dan sebagai suatu kesatuan seharusnya tidak boleh dipisahkan dari ranah kognitif. Penilaian aspek-aspek afektif tidak dapat dilakukan hanya dengan mengukur pengetahuan peserta didik. Penilaian aspek-aspek afektif perlu didasarkan pada informasi dari hasil pengamatan, hasil wawancara, hasil penilaian diri melalui angket, atau yang lainnya, baik sebelum pelaksanaan, maupun selama pelaksanaan pembelajaran terjadi.

Pada tahun 1985, Bloom melakukan studi yang menunjukkan bahwa setidaknya diperlukan waktu sepuluh tahun kerja keras, terlepas dari kejeniusan atau bakat alami seseorang, untuk mencapai prestasi dan pengakuan terhormat dalam bidangnya. Studi Bloom ditujukan untuk 120 atlet, artis, seniman, ahli biokimia, dan matematikawan terkenal. Setiap orang dalam penelitian ini memerlukan setidaknya satu dekade untuk belajar keras atau latihan sehingga mencapai pengakuan internasional. Perenang Olimpiade terlatih butuh waktu rata-rata 15 tahun sebelum terkenal, pianis terbaik butuh 15 tahun untuk mendapatkan pengakuan internasional. Peneliti, pemahat, dan matematikawan terkenal membutuhkan jumlah waktu yang sama (New World Encyclopedia, 2011). Dengan analogi ini, demikian juga halnya dengan sikap, sikap yang baik tidak dimiliki secara otomatis, melainkan melalui suatu proses pembentukan. Tentu pembentukan ini sangat dipengaruhi oleh nilai-nilai, pandangan, dan aturan-aturan dalam keluarga, sekolah dan masyarakat. Dalam pendidikan, terutama selama kegiatan pembelajaran baik di lingkungan sekolah maupun di luar sekolah, peserta didik harus dilatih untuk menyerap nilai-nilai, cara pandang, dan aturan-aturan yang baik. Oleh karena itu, guru harus merencanakan dan melaksanakan kegiatan pembelajaran sebaik-baiknya untuk menanamkan nilai-nilai, pandangan, dan aturan-aturan untuk membentuk karakter peserta didik.

Pembelajaran merupakan program inti di sekolah. Suatu program direncanakan dan dilaksanakan untuk mencapai tujuan atau hasil tertentu. Suatu program dikatakan berhasil bila mencapai hasil yang baik bahkan sangat baik atau sempurna sesuai dengan kriteria yang ditentukan, sebaliknya suatu program dikatakan gagal bila tidak mencapai hasil sesuai dengan kriteria minimal. Kriteria merupakan ukuran yang menjadi dasar untuk menilai atau menetapkan. Kriteria minimal menjadi standar atau patokan untuk menilai atau menetapkan keberhasilan. Oleh karena itu, kriteria sangat dibutuhkan untuk menilai suatu program.

Kemampuan afektif merupakan bagian dari hasil belajar dan memiliki peran yang penting. Keberhasilan pembelajaran pada ranah kognitif dan psikomotor sangat ditentukan oleh kondisi afektif peserta didik. Peserta didik yang memiliki minat belajar dan sikap positif terhadap pelajaran akan merasa senang mempelajari mata pelajaran tersebut, sehingga dapat diharapkan akan mencapai hasil pembelajaran yang optimal (Djemari Mardapi, 2004). Kemampuan afektif juga akan menetukan tingkat kemampuan seseorang dalam bersosialisasi. Kemampuan-kemampuan ini tentu dibentuk melewati proses pembelajaran.

Proses pembelajaran yang baik diharapkan mencapai hasil yang baik, bahkan mencapai hasil yang sangat baik jika diusahakan dengan maksimal. Bila proses pembelajaran yang dianggap telah dilaksanakan dengan optimal, tetapi hanya mencapai hasil yang standar bahkan dibawah standar, tentu dalam hal ini ada sesuatu yang salah atau kurang. Asesmen dan evaluasi program pembelajaran sangat membantu untuk menemukan kesalahan, kekurangan, kelamahan atau penyebab lain yang mengakibatkan kegagalan suatu program. Tindak lanjut dari hasil evaluasi antara lain melakukan perbaikan dan penambahan unsur-unsur tertentu untuk menutupi kekurangan sebelumnya.

Asesmen dan evaluasi untuk program pembelajaran perlu dilakukan terhadap rencana pelaksanaan, proses pelaksanaan, dan hasil pelaksanaan tergantung tujuannya. Salah satu tujuannya untuk mengantisipasi waktu yang tepat untuk melakukan perbaikan atau perubahan, baik pada waktu merencanakan, melaksanakan maupun setelah pelaksanaan. Walaupun hasil yang dicapai sangat baik, perlu dilakukan evaluasi untuk melakukan peningkatan kualitas, khususnya kualitas pembelajaran. Aspek paling penting dalam pembelajaran yang harus direncanakan dan dilaksanakan dengan baik adalah kegiatan yang dilakukan guru dan peserta didik.

Pembelajaran pada umumnya cenderung menekankan pada aspek-aspek dalam ranah kognitif, yaitu mengukur dan menilai tentang pengetahuan peserta didik. Peserta didik yang dikategorikan berhasil jika telah mencapai standar kompetensi atau memperoleh pengetahuan sesuai dengan kriteria minimal bahkan diharapkan mencapai nilai sangat baik. Namun demikian, peserta didik yang mencapai nilai sangat baik tidak menjamin bahwa peserta didik tersebut pasti mempunyai sikap atau moral yang baik dan mampu bersosialisasi dengan baik. Menilai pengetahuan tidak sama dengan menilai sikap, moral atau kemampuan bersosialisasi. Peserta didik yang mencapai standar bahkan nilai sangat baik dalam pengetahuan tertentu dapat dianggap telah bertanggung jawab terhadap tugas belajar. Namun demikian, pendidik perlu mengetahui bahwa peserta didik mempunyai sikap, moral atau cara bergaul yang baik, seperti sikap terhadap guru, sikap terhadap teman, sikap terhadap pelajaran, sikap terhadap lingkungan, sikap dalam kelompok belajar atau sikap dalam bekerja sama, dan sikap terhadap berbagai objek lainnya dan bagaimana cara peserta didik berkomunikasi, berkolaborasi, dan berubah. Kompetensi hasil belajar afektif peserta didik sangat erat kaitannya dengan kompetensi hasil belajar ranah sosial. Oleh karena itu, aspek-aspek dalam ranah afektif dan ranah sosial sangat perlu diukur dan dinilai untuk melihat kemajuan perkemabangan peserta didik.



B. Rumusan Masalah

Berdasarkan latar belakang masalah, rumusan masalah dalam makalah ini adalah:

1. Apa saja kompetensi ranah afektif dan ranah sosial yang perlu dinilai?

2. Mengapa perlu melakukan asesmen ranah afektif dan ranah sosial?

3. Bagaimana mengkonstruksi instrumen asesmen ranah afektif dan sosial?



C. Tujuan

Berdasarkan rumusan masalah, tujuan penulisan makalah ini adalah untuk:

1. Memahami alasan dan tujuan melakukan asesmen ranah afektif dan sosial.

2. Memahami prinsip dan prosedur mengkonstruksi instumen asesmen ranah afektif.


BAB II

PEMBAHASAN

A. Asesmen atau penilaian

Asesmen adalah proses mengumpulkan informasi tentang peserta didik atau tentang kelas untuk maksud-maksud pengambilan keputusan (Arends, 2008). Informasi dapat diperoleh dengan cara informal misalnya observasi dan wawancara, dapat juga dengan cara formal misalnya melalui PR, tes, dan tugas dengan laporan tertulis. Asesmen merupakan proses berkelanjutan yang terkait erat dengan pengajaran.

Asesmen formatif (Assesment for learning) dikumpulkan sebelum atau selama proses pengajaran yang bertujuan untuk mengumpulkan informasi tentang pengetahuan dan keterampilan yang sebelumnya sudah dimiliki peserta didik, dan untuk membantu guru dalam membuat perencanaan (Arends, 2008). Menurut Sudjana (2010), penialian formatif dilaksanakan selama proses pembelajaran untuk melihat kemajuan proses belajar itu sendiri. Asesmen formatif juga dapat digunakan untuk maksud mengetahui sikap, motivasi dan cita-cita peserta didik. Informasi dari asesmen formatif tidak digunakan untuk membuat keputusan tentang hasil belajar peserta didik, tetapi digunakan untuk hal-hal yang berkenaan dengan pengelompokan peserta didik, perencanaan pelajaran dan unit pelajaran, memperbaiki program pengajaran dan strategi pengajaran.

Asesmen sumatif (Assesment of learning) adalah upaya untuk mengumpulkan informasi tentang peserta didik atau program setelah serangkaian kegiatan instruksional terjadi (Arends, 2008). Menurut Sudjana (2010), penilaian sumatif adalah penilaian yang dilaksanakan pada akhir unit program, yaitu akhir catur wulan, akhir semester atau akhir tahun. Asesmen sumatif dimaksudkan untuk merangkum seberapa baik kinerja peserta didik tertentu, kelompok peserta didik tertentu, atau guru tertentu pada sejumlah sasaran atau tujuan belajar. Asesmen sumatif dirancang untuk memperoleh informasi yang akan digunakan dalam membuat keputusan tentang penacapaian/prestasi peserta didik, tujuannya untuk melihat hasil program.

Assesment as learning adalah bentuk penilaian dengan membuat bagian penilaian yang tidak terpisah dari proses instruksional. Assesment as learning melibatkan peserta didik dalam penilaian diri sendiri secara terus menerus dan dirancang untuk membantu peserta didik menjadi pembelajar mandiri (Arends, 2008). Assesment as learning menggunakan bentuk penilaian oleh teman sejawat, dan memberikan umpan balik. Bentuk penilaian ini sangat penting karena dua alasan. Pertama, penilaian ini membantu peserta didik mencapai tujuan akhir pendidikan, yaitu pengembangan pelajar yang mandiri. Kedua, peserta didik sering lebih mudah menerima umpan balik dari teman sejawat daripada umpan balik dari figur berotoritas (misal guru).

Menurut Sudjana (2010), ada beberapa jenis penilaian yang lain, yang juga memiliki fungsi penting, yaitu: penilaian diagnostik, penilaian selektif dan penilaian penempatan. Penialian diagnostik adalah penilaian yang bertujuan untuk melihat kelemahan-kelemahan peserta didik serta faktor-faktor penyebabnya. Penilaian selektif adalah penilaian yang bertujuan untuk keperluan seleksi, yaitu ujian penyaringan masuk ke lembaga pendidikan. Penilaian penempatan adalah penilaian yang ditujukan untuk mengetahui keterampilan dan kompetensi yang dibutuhkan sebagai prasyarat mengikuti program pembelajaran yang akan dilaksanakan.



B. Ranah Afektif dan Ranah Sosial

Taksonomi pendidikan yang dikembangkan oleh Bloom, Krathwhol, dan para kolabolator digunakan untuk merencanakan objektif instruksional, merancang kurikulum, dan merencanakan pencapaian. Pengembangannya meliputi ranah kognitif, psikomotorik, afektif dan sosial. Selanjutnya keempat ranah ini disintesis menjadi kesatuan yang disebut ranah terpadu (unified domain) (Dettmer, 2006). Pada hakekatnya tugas pendidik adalah memberikan instruksional kepada peserta didik selama proses pembelajaran. Sebelum melaksanakan peran instruksional, pendidik perlu merancang kurikulum termasuk di dalamnya silabus dan RPP. Pendidik melaksanakan proses pembelajaran dengan berpedoman pada rancangan yang telah dibuat. Dalam hal ini, keempat ranah sebaiknya tidak dipisahkan antara satu dari yang lainnya.

Afektif (dari bahasa Latin affectus, yang berarti "perasaan") mencakup sejumlah konstruksi, seperti sikap, nilai, kepercayaan, pendapat, minat, dan motivasi (Koballa, 2011). Sikap dalam bahasa Inggris diterjemahkan attitude yang dapat diartikan cara berpikir atau sikap. Sikap umumnya didefinisikan sebagai kecenderungan untuk merespon secara positif atau negatif terhadap benda, orang, tempat, peristiwa, dan gagasan.

Ranah afektif pada awalnya diklasifikasikan berdasarkan objektif sikap dan emosi. Tingkatan ranah afektif menurut Krathwohl ada lima, yaitu receiving (menerima), responding (menanggapi), valuing (menilai), organization (organisasi), dan characterization (karakterisasi) (_____,2011). Kemudian, ranah afektif diperluas mencakup internalize (internalisasi nilai-nilai), wonder (rasa ingin tahu), dan aspire (mencita-citakan) (Dettmer, 2006).

Taksonomi Bloom (Dettmer, 2006) terdiri dari empat ranah dan delapan fase. Fase-fase setiap ranah paralel dengan fase-fase ranah yang lain dalam mensintesis keterpaduan. Dalam merencanakan kegiatan pembelajaran, khususnya merancang objektif instruksional, dan melaksanakan kegiatan pembelajaran, serta melakukan asesmen dan evaluasi pembelajaran dapat menggunakan bantuan tabel taksonomi Bloom yang ditunjukkan pada tabel 1 dan tabel 2.

Fase 1 dan 2 merupakan pembelajaran dasar, fase esensial yang bercirikan realisme dan berkenaan dengan pengetahuan peserta didik. Fase 3, 4, dan 5 merupakan pembelajaran terapan, fase perkembangan yang bercirikan pragmatisme, dan berkenaan dengan keterampilan peserta didik. Fase 6, 7, dan 8 merupakan pembelajaran ideasional, fase generatif (kemampuan memberikan gagasan) yang bercirikan idealisme dan berkenaan dengan kemampuan peserta didik untuk mewujudkan yang dicita-citakan.

Ranah afetif berkaitan erat dengan ranah sosial. Tingkat kompetensi dalam ranah afektif akan mempengaruhi tingkat kompetensi dalam ranah sosial. Kemampuan seseorang untuk menerima akan mempengaruhi kemampuannya berhubungan, kemampuannya untuk menanggapi akan mempengaruhi kemampuan berkomunikasi dan kemampuan berkreasi akan mempengaruhi kemampuan untuk berubah. Pada hakekatnya, hal-hal yang berkenaan dengan sikap seseorang merupakan aspek-aspek dalam ranah afektif, sedangkan bagaimana seseorang bersikap merupakan aspek-aspek dalam rana sosial. Kemampuan seseorang menanggapi merupakan aspek afketif, sedangkan bagaimana caranya merespon atau mengkomunikasinnya merupakan aspek sosial.

Kemauan untuk menerima pengajaran dari guru, keinginan untuk mendengarkan dan mencatat uraian guru, penghargaannya terhadap guru dan mata pelajaran itu sendiri, keinginan untuk bertanya merupakan contoh ciri-ciri hasil belajar ranah afektif. Cara menerima, cara mendengarkan, cara menghargai, dan cara bertanya merupakan ciri dari hasil belajar ranah sosial. Dettmer (2006) mencirikan hasil belajar sosial dalam delapan fase, yaitu: cara berelasi, cara berkominikasi, cara berpartisipasi, cara mempertimbangkan, cara mengambil keputusan, cara berkolaborasi, cara berinisiasi dan cara melakukan perubahan. Prosesnya adalah melalui interaksi dengan objek sekitar sedangkan tujuannya adalah untuk memperkaya relasi.



Tujuan pembelajaran dalam ranah afektif dan sosial merupakan kompetensi yang perlu dicapai peserta didik. PP No.19 Tahun 2005, pasal 64 ayat (3) memuat bahwa “Penilaian hasil belajar kelompok mata pelajaran agama dan akhlak mulia serta kelompok mata pelajaran kewarganegaraan dan kepribadian dilakukan melalui: pengamatan terhadap perubahan perilaku dan sikap untuk menilai perkembangan afeksi dan kepribadian peserta didik; serta ujian, ulangan, dan/atau penugasan untuk mengukur aspek kognitif peserta didik.” dan ayat (4) “Penilaian hasil belajar kelompok mata pelajaran ilmu pengetahuan dan teknologi diukur melalui ulangan, penugasan, dan/atau bentuk lain yang sesuai dengan karakteristik materi yang dinilai.”, hal ini dapat diasumsikan bahwa pengamatan ataupun bentuk lainnya terhadap perubahan atau pembentukan perilaku peserta didik memberikan informasi untuk penilaian afektif kelompok mata pelajaran agama dan akhlak mulia.

Karakteristik afektif yang penting, yaitu sikap, minat, konsep diri, nilai, dan moral (Depdiknas, 2008). Sikap merupakan suatu kecenderungan untuk bertindak secara suka atau tidak suka terhadap suatu objek. Sikap dapat dibentuk melalui cara mengamati dan menirukan sesuatu yang positif, kemudian melalui penguatan serta menerima informasi verbal. Penilaian sikap adalah penilaian yang dilakukan untuk mengetahui sikap peserta didik terhadap mata pelajaran, kondisi pembelajaran, pendidik, dan sebagainya. Minat adalah suatu disposisi yang terorganisir melalui pengalaman yang mendorong seseorang untuk memperoleh objek khusus, aktivitas, pemahaman, dan keterampilan untuk tujuan perhatian atau pencapaian. Konsep diri adalah evaluasi yang dilakukan individu terhadap kemampuan dan kelemahan yang dimiliki. Target, arah, dan intensitas konsep diri pada dasarnya seperti ranah afektif yang lain. Konsep diri ini penting untuk menentukan jenjang karir peserta didik, yaitu dengan mengetahui kekuatan dan kelemahan diri sendiri dapat dipilih alternatif karir yang tepat bagi peserta didik. Nilai adalah suatu objek, aktivitas, atau ide yang dinyatakan oleh individu dalam mengarahkan minat, sikap, dan kepuasan. Target nilai cenderung menjadi ide, target nilai dapat juga berupa sesuatu seperti sikap dan perilaku. Arah nilai dapat positif dan dapat negatif. Moral berkaitan dengan perasaan salah atau benar terhadap kebahagiaan orang lain atau perasaan terhadap tindakan yang dilakukan diri sendiri. Moral berkaitan dengan prinsip, nilai, dan keyakinan seseorang.

Menurut Suharsimi (2001), tujuan penilaian afektif adalah:
1. Untuk mendapatkan umpan balik baik bagi guru maupun bagi peserta didik sebagai dasar untuk memperbaiki proses belajar mengajar dan mengadakan program perbaikan bagi peserta didik.
2. Untuk mengetahui tingkat perubahan tingkah laku peserta didik yang dicapai dan diperlukan sebagai bahan bagi, antara lain: perbaikan tingkah laku peserta didik, pemberian laporan kepada orang tua/wali, dan penentuan kelulusan peserta didik.
3. Untuk menempatkan peserta didik dalam situasi belajar-mengajar yang tepat sesuai dengan tingkat pencapaian dan kemampuan serta karakteristik peserta didik.
4. Untuk mengenal latar belakang kegiatan belajar dan kelainan tingkah laku peserta didik.

Penilaian ranah afektif dan ranah sosial menggunakan bentuk penilaian formatif. Metode untuk penilaian formatif ranah afektif dan ranah sosial dapat menggunakan beberapa bentuk instrumen pengukuran yang tergantung pada apa yang ingin diukur.

1. Pengukuran Kepribadian

Pengukuran kepribadian dikonsentrasikan bukan pada tes intelektual atau kompetensi kognitif. Ada beberapa tipe pengukuran kepribadian, masing-masing tipe merefleksikan teori dengan sudat pandang yang berbeda. Beberapa tipe merefleksikan teori sifat dan tipe kepribadian, sedangkan beberapa yang lain merefleksikan teori psikoanalitik dan motivasi. Pendidik harus tahu dengan tepat tentang hal yang akan diukur dan jenis instrumen yang akan digunakan, dengan memperhatikan bukti validitas.

a. Inventori

Dalam inventori, subjek yang dipresentasi dengan suatu luasan kumpulan pernyataan yang menggambarkan contoh perilaku dan yang dimaksudkan untuk mengindikasikan apakah setiap pernyataan merupakan karakteristik perilaku mereka atau tidak, dengan memberi tanda ya, tidak atau tidak pasti. Skor dikomputasi dengan menghitung jumlah respons yang setuju dengan sifat yang penguji ukur. Daftar pernyataan disusun dalam bentuk kuesioner. Kuesioner ini mirip wawancara terstruktur dan peneliti menanyakan pertanyaan yang sama untuk setiap orang, dan jawaban biasanya diberikan dalam bentuk yang mudah dinilai, biasanya dengan bantuan komputer.

Beberapa inventori kepribadian hanya mengukur satu sifat, misalnya California F-Scale untuk mengukur autoritarianisme, Cattell's Sixteen Personalitg Factor Queslionnoire untuk mengukur sejumlah sifat, Minnesota Multiphasic Personality lnventory, Guilford-Zimerman Temperament Survey, Mooney Problem Check List, dan Edwards Personal Preference Schedule. Menurut Atkinson dan kawan-kawan, investori kepribadian mungkin dirancang untuk menilai dimensi tunggal kepribadian (misalnya, tingkat kecemasan) atau beberapa sifat kepribadian secara keseluruhan. Investori kepribadian yang terkenal dan banyak digunakan untuk menilai kepribadian seseorang ialah: (a) Minnesota Multiphasic Personality Inventory (MMPI), (b) Rorced-Choice Inventories, dan (c) Humm-Wadsworth Temperament Scale (H-W Temperament Scale).

1) Minnesota Multiphasic Personality Inventory (MMPI)

MMPI terdiri atas kira-kira 550 pernyataan tentag sikap, reaksi emosional, gejala fisik dan psikologis, serta pengalaman masa lalu. Subjek menjawab tiap pertanyaan dengan menjawab “benar”, “salah”, atau “tidak dapat mengatakan”. Pada prinsipnya, jawaban mendapat nilai menurut kesesuaiannya dengan jawaban yang diberikan oleh orang-orang yang memiliki berbagai macam masalah psikologi. MMPI dikembangkan guna membantu klinis dalam mendiagnosis gangguan kepribadian. Para perancang tes tidak menentukan sifat mengukurnya, tetapi memberikan ratusn pertanyaan tes untuk mengelompokkan individu. Tiap kelompok diketahui berbeda dari normalnya menurut kriteria tertentu. Kelompok kriteria terdiri atas individu yang telah dirawat dengan diagnosis gangguan paranoid. Kelompok kontrol terdiri atas orang yang belum pernah didiagnosis menderita masalah psikiatrik, tetapi mirip dengn kelompok kriteria dalah hal usia, jenis kelamin, status sosioekonomi, dan variabel penting lain.

2) Rorced-Choice Inventories

Rorced-Choice Inventories atau Inventori Pilihan-Paksa termasuk klasifikasi tes yang volunter. Suatu tes dikatakan volunter bila subjek dapat memilih pilihan yang lebih disukai, dan tahu bahwa semua pilihan itu benar, tidak ada yang salah (Muhadjir,1992). Subjek, dalam hal ini, diminta memilih pilihan yang lebih disukai, lebih sesuai, lebih cocok dengan minatnya, sikapnya, atau pandangan hidupnya.

3) Humm-Wadsworth Temperament Scale (H-W Temperament Scale)

H-W Temperament Scale dikembangkan dari teori kepribadian Rosanoff (Muhadjir, 1992). Menurut teori ini, kepribadian memiliki enam komponen, yang lebih banyak bertolak dari keragaman abnomal, yaitu:
a) Schizoid Autistik, mempunyai tendensi tak konsisten, berpikirnya lebih mengarah pada khayalan.
b) Schizoid Paranoid, mempunyai tendensi tak konsisten, dengan angan bahwa dirinya penting.
c) Cycloid Manik, emosinya tidak stabil dengan semangat berkobar.
d) Cycloid Depress, emosinya tak stabil dengan retardasi dan pesimisme.
e) Hysteroid, ketunaan watak berbatasan dengan tendensi kriminal.
f) Epileptoid, dengan antusiasme dan aspirasi yang bergerak terus.

H-W Temperament Scale tersusun dalam sejumlah item yang berfungsi untuk memilahkan kelompok yang patologik dari kelompok penderita hysteroid, misalnya, diasumsikan memiliki mental kriminal.

Inventori telah digunakan dalam penelitian pendidikan untuk memperoleh deskripsi sifat yang menggambarkan kelompok tertentu, misalnya kelompok dibawah rata-rata, kelompok dropout, kelompok minoritas dan sebagainya. Beberapa penelitian dikonsentrasikan untuk melihat hubungan antara sifat kepribadian dengan beberapa variabel seperti kecerdasan, prestasi, dan sikap.

Inventori memiliki keuntungan yaitu murah, sederhana dan objektif. Kelemahannya berkaitan dengan masalah validitas. Validitasnya tergantung pada kemampuan responden membaca dan memahami item-itemnya, pengenalannya akan diri sendiri, dan khususnya keinginan mereka menjawab dengan jujur dan terbuka. Berdasarkan pada hasil, informasi yang diperoleh dari inventori mungkin hanya permukaannya saja atau bias. Kemungkinan ini semestinya dimasukkan ke dalam laporan ketika hasil diperoleh dari instrumen.

b. Teknik Proyektif

Dalam tes-tes kepribadian dengan pendekatan proyektif, individu memberikan respon pada stimulus yang tidak terstruktur dan ambigu, dimana hal ini berbeda dengan tes objektif yang memuat beberapa pertanyaan berstruktur. Sehingga diharapkan dengan menggunakan tes proyektif, individu secara tidak sadar akan mengungkap dan menggambarkan struktur dan dinamika kepribadiannya.

Teknik proyektif yang banyak dikenal dan digunakan secara luas oleh ahli psikologi yaitu tes Rorschach, Thematic Apperception Test (TAT), Children’s Apperception Test (CAT), Draw-A-Person (DAP), Make-A-Picture Story (MAPS), Michigan Picture Story Test, dan Sentence Completion Test. Berikut adalah penjelasan lebih lanjut mengenai tes-tes tersebut:

1) Thematic Apperception Test (TAT)

TAT adalah yang dikenal sebagai teknik interpretasi gambar karena menggunakan rangkaian standar provokatif berupa gambar yang ambigu dan subjek yang harus menceritakan sebuah cerita dari gambar yang tertera. Subjek diminta untuk mengatakan sebagai sebuah cerita yang dramatis.

2) Children’s Apperception Test (CAT)

Bentuk lain dari TAT adalah CAT (Children’s Apperception Test), yang digunakan untuk anak-anak. CAT menampilkan sepuluh gambar binatang dalam konteks sosial manusia seperti memainkan game atau tidur di tempat tidur. Pada saat ini, versi ini dikenal sebagai CAT atau CAT-A (gambar binatang).

3) Michigan Picture Story Test (MPST)

Tes ini hampir sama dengan kedua tes diatas dan terdiri dari material yang menggambarkan anak-anak dalam hubungannya dengan orang tua, polisi, dan figur otoriter lainnya, juga teman-teman. Tes ini sangat bermanfaat dalam melihat struktur dari sikap anak-anak terhadap orang dewasa dan teman-teman sekaligus mengevaluasi masalah yang mungkin timbul.

4) Make-A-Picture Story (MAPS)

Tes ini juga hampir sama dengan MPST dalam interpretasi dan tujuan yang dimiliki. Perbedaannya, individu boleh memilih karakter yang ada untuk membuat sebuah cerita berdasarkan situasi yang ada.

5) Figure Drawing

Dalam tes ini, kemampuan menggambar bukanlah faktor utama. Salah satu bentuk tesnya adalah Draw-A-Person (DAP), dimana individu diminta untuk menggambar seorang lelaki dan perempuan menggunakan pensil dan kertas.

6) Incomplete Sentence Test

Dalam metode proyektif ini, terdiri dari sejumlah kalimat tidak lengkap yang disajikan untuk dilengkapi. Biasanya bukan merupakan tes standar dan tidak diperlakukan secara kuantitatif. Penting sebagai bahan pertimbangan dalam situasi klinis yang memiliki asumsi bahwa respon individu terhadap stimulus yang ambigu merupakan proyeksi dari hal-hal yang ada dalam ketidaksadaran. Respon yang diberikan subjek dapat memberikan gambaran area konflik, termasuk juga kelebihan dan kekurangan dari kepribadian subjek.

7) Competency Screening Test

Diberikan kepada individu yang menjadi terdakwa untuk mempelajari interscorer kehandalan dan validitas prediktif tentang status mental atau inteligensi individu terkait dengan kasus individu yang sedang terjadi. Tes juga secara signifikan membedakan antara individu yang dikategorikan oleh praktisi sebagai tidak berkompetensi secara mental dan yang dikategorikan sebagai kompeten dalam sidang kasus yang dijalani.

8) Rorschach Test

Rorschach test juga dikenal sebagai tes inkblot Rorschach atau sekadar tes Inkblot adalah sebuah tes psikologi di mana subjek mempersepsi sebuah bentuk gambar tinta yang dicatat dan kemudian dianalisis dengan menggunakan interpretasi psikologis. Beberapa psikolog menggunakan tes ini untuk memeriksa kepribadian seseorang baik karakteristik maupun fungsi emosional. Telah digunakan untuk mendeteksi gangguan pikiran yang mendasari individu, terutama dalam kasus-kasus di mana pasien tidak mau untuk menggambarkan proses berpikir mereka secara terbuka. Tes ini mengambil namadari penciptanya yaitu psikolog dari Swiss, Hermann Rorschach.

Teknik proyektif digunakan terutama dalam psikologi klinis untuk mempelajari dan mendiagnosis masalah emosional seseorang. Teknik ini jarang digunakan dalam pendidikan karena kebutuhannya lebih mengarah untuk latihan administrasi dan penskoran. Para ahli juga kurang puas terhadap masalah validitas instrumennya.

2. Skala Sikap

Sikap merupakan suatu kecenderungan tingkah laku seseorang, subjek atau objek untuk berbuat sesuatu dengan cara, metode, teknik dan pola tertentu terhadap dunia di sekitarnya. Guru perlu mengetahui norma-norma yang ada pada peserta didik bahkan sikap peserta didik terhadap dunia sekitarnya, terutama terhadap mata pelajaran dan lingkungan sekolah. Jika terdapat sikap peserta didik yang negatif, guru perlu mencari suatu cara dan teknik tertentu untuk menempatkan sikap negatif itu menjadi sikap yang positif. Dalam mengukur sikap, guru hendaknya memperhatikan tiga komponen sikap yaitu (1) kognisi, berkenaan dengan pengetahuan peserta didik tentang objek, (2) Afeksi, berkenaan dengan perasaan peserta didik terhadap objek, (3) Konasi, berkenaan dengan kecenderungan berperilaku peserta didik. Disamping itu guru juga harus memilih salah satu model skala sikap.

Skala merupakan seperangkat bilangan untuk menyatakan nilai yang dikenakan pada subjek, objek, atau perilaku bagi tujuan quantifikasi dan pengukuran kualitas. Skala digunakan untuk mengukur sikap, nilai dan karakter lainnya. Skala-skala ini berbeda dari tes dalam hal hasil dari instrumen, tidak seperti tes-tes pada umumnya, instrumen tidak mengindikasikan kesuksesan atau kegagalan, kelemahan atau kekuatan. Instrumen mengukur derajat karakteristik proses ketertarikan individu. Misalnya, mengukur sikap peserta didik terhadap pelajaran kimia.

Pengembangan skala untuk mengukur sikap, nilai, dan karakter lainnya dapat meliputi berbagai teknik yang berbeda-beda. Sikap dapat didefinisikan sebagai pengaruh positif atau negatif terhadap kelompok tertentu, institusi, konsep atau objek sosial. Pengukuran sikap untuk menduga kemampuan guna menempatkan individu pada kontinum kesukaan-ketidaksukaan terhadap objek. Ada empat tipe skala sikap yang umum digunakan.

a. Summated rating scales (Skala Likert)

Skala Likert, sebagai metode untuk mengukur sikap, merupakan salah satu tipe skala yang digunakan oleh sebagian besar peneliti dan memberikan hasil yang baik. Skala Likert menilai sikap terhadap suatu hal dengan membuat pernyataan kepada responden untuk mengindikasikan apakah responden menunjukan respon sangat setuju (SS), setuju (S), tidak berpendapat (TB), tidak setuju (TS), dan sangat tidak setuju (STS) terhadap pernyataan tentang hal-hal tersebut. Skala Likert dikonstruksi dengan mengumpulkan sejumlah pernyataan tentang suatu objek, setengah dari jumlah pernyataan tentang kesukaan dan setengahnya lagi tentang pernyataan ketidaksukaan terhadap suatu objek. Hal yang penting adalah bahwa pernyataan-pernyataan ini merakit suatu contoh representatif tentang semua pendapat atau sikap yang mungkin terhadap suatu objek. Hal yang mungkin sangat membantu adalah memikirkan semua subtopik yang berhubungan dengan objek sikap dan kemudian menuliskan item-item pada setiap subtopik. Selanjutnya item-item ini divalidasi oleh orang yang memiliki pengetahuan dan mengerti batasan sikap positif dan negatif.

Pernyataan, sepanjang kontinum setuju-tidak setuju, dipresensikan kepada subjek. Pernyataan harus disusun secara acak untuk menjamin bahwa respon mengena pada subjek. Untuk menskor skala, kategori respon harus berbobot. Bagi item pernyataan kesukaan atau positif, nilai bilangan berturut-turut 5, 4, 3, 2, 1, disusun untuk kategori respon yang dimulai dengan pernyataan positif. Sangat setuju diberi nilai 5, sedangkan sangat tidak setuju diberi nilai 1. Bagi item pernyataan ketidaksukaan atau negatif merupakan kebalikannya, sangat setuju diberi nilai 1, sedangkan sangat tidak setuju diberi nilai 5. Misalnya, mengukur sikap peserta didik terhadap pelajaran kimia:



Peserta didik yang sangat menyukai pelajaran kimia akan setuju dengan pernyataan positif dan tidak setuju dengan pernyataan negatif.

Peserta didik yang setuju dengan pernyataan pertama diberi nilai 4 dan tidak setuju dengan pernyataan kedua diberi nilai 4, jumlahnya adalah 8 (4+4) untuk kedua item. Jumlah seluruh bobot item yang dicentang oleh subjek pada skala akan merepresentasikan skor total individu.

Skor dengan nilai tertinggi mengindikasikan sikap positif terhadap objek. Skor tertinggi adalah 5 dikalikan N (jumlah item) dan skor terendah 1 dikalikan N.

Setelah skala sikap diujicobakan terhadap kelompok responden, analisis item perlu dilakukan untuk mengidentifikasi item terbaik. Paling tidak, ada tiga tipe statistik untuk menganalisis: 1) indeks item diskriminasi, 2) bilangan dan/atau persentase untuk setiap item yang ditandai responden, 3) mean atau standar deviasi item. Indeks item diskriminasi menunjukkan jangkauan atau batasan terhadap yang mana setiap item membedakan responden dalam cara yang sama seperti total skor diskriminan. Indeks item diskriminasi dikalkulasi dengan mengkorelasikan skor item dengan total skor skala. Setiap item akan memiliki korelasi minimal 0,25 dengan skor total. Item yang memiliki korelasi sangat rendah atau negatif akan dieliminasi karena tidak mengukur hal yang sama sebegai skala total dan tidak berkontribusi terhadap pengukuran sikap. Statistik 2 dan 3 mengindikasikan jangkauan atau batasan terhadap yang mana responden memiliki pilihan bervariasi. Item pada yang mana responden menyebar diantara kategori respon yang lebih disukai akan mengumpul pada satu atau dua kategori. Setelah memilih item yang baik, instrumen yang telah direvisi digunakan pada kelompok subjek yang berbeda dan akan memberikan reliabilitas yang baru.

Ada beberapa kesulitan untuk menempatkan kriteria yang akan digunakan dalam menentukan validitas skala sikap. Beberapa peneliti menggunakan observasi perilaku sebagai kriteria bagi sikap yang diukur, tetapi prosedur ini jarang sekali digunakan karena kesulitan dalam menentukan perilaku yang bagaimana yang dapat menjadi kriteria terbaik bagi sikap dan juga kesulitan menjamin validitas pengukuran. Salah satu cara yang paling mudah untuk memvalidasi adalah menentukan batasan pada dua sikap yang telah diketahui akan berbeda, misal sikap terhadap masalah aborsi.

a. Equal-appearing intervals scales (Skala Thurstone)
Thurstone mengembangkan sebuah metode bagi penyusunan spesifik nilai skala untuk item-item sikap. Skala Likert menilai sikap dengan meminta responden untuk mengindikasikan derajat atau tingkat kesetujuan-ketidaksetujuan dengan serangkaian pernyataan, sedangkan skala Turstone menilai dengan mempresentasikan pernyataan tentang suatu topik dengan rentangan dari sangat suka, melalui sikap netral, menuju sangat tidak suka dan meminta responden untuk memilih dari pernyataan-pernyataan ini yang mana paling mendekati berhubunagn dengan sikap mereka sendiri. Membuat skala Thurstone meliputi beberapa langkah, yaitu:

Mengumpulkan sejumlah besar pernyataan (50-100) yang mengekspresikan keluasan perbedaan derajat kesukaan-ketidaksukaan terhadap objek sikap, termasuk pernyataan netral. Pernyataan diberikan kepada sejumlah besar orang (50 atau lebih) yang memiliki cukup pengetahuan tentang objek untuk mengurutkan pernyataan ke dalam sebelas kategori sepanjang dimensi kesukaan-ketidaksukaan. Kategori A berisi pernyataan yang dapat diputuskan menjadi paling/sangat disukai, kategori B berisi pernyataan sangat disukai selanjutnya, agak sangat disukai, dan seterusnya. Pernyataan ke enam (F) berisi pernyataan netral yang memberi respek sikap netral, dan kategori K berisi pernyataan yang paling/sangat tidak disukai.



Klasifikasi pernyataan menjadi kategori-kategori tidak mempunyai sesuatu untuk dilakukan dengan sikap pemilik sikap terhadap objek psikologis, tetapi hanya mencerminkan persepsi mereka tentang kesukaan dan ketidaksukaan mengenai pernyataan.

Setelah keputusan dari pengukuran semua item, distribusi dari rating keputusan disiapkan bagi setiap item. Distribusi akan menunjukkan bilangan keputusan yang menempatkan setiap item ke dalam sebelas kategori. Sebagai contoh, anggapan pernyataan tentang pelajaran kimia ditempatkan dalam kategori A dengan 4 keputusan, dalam kategori B dengan 28 keputusan, dalam C dengan 32 keputusan dan dalam D dengan 16 keputusan. Ada dua nilai, yaitu median dan Q, yang dihitung dari distribusi tersebut.



Median dari rating (distribusi skor pengukuran item) keputusan adalah 2,75. Ini menjadi skala nilai yang ditunjukkan untuk item tersebut. Skala nilai mengindikasikan posisi item pada kontinum positif-negatif. Dalam hal membuat batasan persetujuan diantara keputusan-keputusan, indeks variabilitas dihitung untuk setiap item. Pengukuran variabilitas menggunakan Q, yaitu diviasi kuartil, yang sama dengan setengah dari selisish persentil ke-25 dan ke-75. Q lebih disukai daripada standar deviasi karena tidak dipengaruhi oleh skor ekstrim. Untuk contoh diatas Q=(3,38-2,07)/2 = 0,65. Tingginya tingkat persetujuan diantara keputusan-keputusan tentang bagaimana pernyataan disukai-tidak disukai akan dihasilkan dengan nilai Q yang rendah. Rendahnya tingkat persetujuan di antara keputusan-keputusan ditunjukkan dengan nilai Q yang tinggi. Item yang memiliki nilai Q terlalu tinggi akan dibuang karena menyebabkan ambigu pada skala.

Setelah skala nilai (median) dan nilai Q dihitung untuk setiap pernyataan, langkah selanjutnya adalah memilih pernyataan untuk mewakili poin pada kontinum kesukaan-ketidaksukaan yang didistribusikan pada nilai 1-11. Untuk batasan bahwa skala nilai mewakili kenaikan yang sama, salah satunya harus mencapai interval pengukuran. Jika dua atau lebih item memiliki skala nilai yang sama, item yang memiliki nilai Q paling rendah yang dipilih. Item-item ditempatkan dalam urutan acak pada bentuk akhir dan tentu saja, nilai-nilainya tidak ditunjukkan pada bentuk itu sendiri. Berikut ini contoh skala Thurstone.



Dalam menentukan skala Thurstone, penguji harus menginstruksikan kepada responden untuk mencentang hanya pernyataan yang mereka setujui saja. Skor sikap subjek merupakan rata-rata dari skala nilai (mean atau median) dari pernyataan yang dicentang. Skor rata-rata menempatkan individu pada kontinum kesukaan-ketidaksukaan dengan respek terhadap objek sikap. Dari contoh diatas, jika seorang responden setuju dengan pernyataan yang memiliki nilai 1,5; 2,3; 3,3; dan 4,5 dalam skala Thustone, skor sikapnya adalah 2,9 (median), yang mengindikasikan sikap suka terhadap mata pelajaran kimia.

Jumlah sebaran skala nilai dari item sikap yang dicentang oleh beberapa responden dapat diambil sebagai pengukur batasan atau jangkauan untuk yang mana responden memiliki gambaran sikap yang jelas. Artinya bahwa seseorang dengan gambaran sikap yang baik terhadap beberapa objek akan diharapkan untuk mencentang hanya item-item yang sangat dekat dengan skala nilai. Jika respon seseorang menyebar luas tidak berdekatan item-itemnya, dapat diasumsikan bahwa responden memiliki ambigu atau miskin gambaran tentang sikap.

a. Cumulative scales (Skala Guttman)
Kritik terhadap skala sikap Thurstone dan Likert bahwa skala-skala ini berisi pernyataan-pernyataan heterogen mengenai berbagai dimensi terhadap suatu objek sikap. Sebagai contoh, pengukuran sikap terhadap perang dalam skala Thurstone, tidak ada usaha yang dibuat untuk memisahkan pernyataan etis dari pernyataan yang berhubungan dengan hasil ekonomis dari perang, atau yang mencerminkan aspek-aspek yang mungkin lainnya tentang sikap terhadap perang. Sebagai hasil dari kombinasi ini tentang beberapa dimensi dari satu skala, hal ini bisa sukar untuk membuat beberapa interpretasi yang jelas dari skor yang diperoleh.

Guttman mengembangkan suatu teknik untuk mengatasi masalah tersebut. Teknik Guttman, dikarakteristik sebagai suatu skala unidimensional, bertujuan/bermaksud untuk menentukan jika sikap dipelajari secara aktual mencakup hanya sebuah dimensi tunggal. Sebuah sikap dianggap unidimensional hanya jika sikap itu menghasilkan suatu skala kumulatif ― salah satu dalam yang mana item-item dihubungkan dengan yang lain dalam hal suatu cara bahwa suatu subjek yang setuju dengan item 2 juga setuju dengan item 1, jika setuju dengan item 3, juga setuju dengan item 1 dan 2, dan seterusnya. Dengan demikian, individu yang menyetujui item tertentu dalam tipe skala ini akan memiliki skor lebih tinggi pada skala total daripada yang tidak menyetujui item tersebut. Sebagai contoh, mempertimbangkan item berikut dengan meminta responden menyetujui atau tidak menyetujui:

1. PTA seharga dengan waktu yang dihabiskan untuk PTA itu sendiri.
2. PTA merupakan suatu pengaruh kuat bagi perbaikan sekolah.
3. PTA merupakan organisasi paling penting di Amerika Serikat untuk memperbaiki sekolah.

Jika ini merupakan skala kumulatif, tentu memungkinkan untuk mengatur semua respon dari responden menjadi tipe contoh/model. Dengan demikian, jika diketahui skor seseorang, tentu memungkinkan untuk menceritakan secara tepat, item mana yang disetujuinya. Sebagai contoh, semua individu dengan skor 2 meyakini bahwa PTA seharga dengan waktu yang dihabiskan untuk itu dan PTA merupakan suatu pengaruh kuat bagi perbaikan sekolah, tetapi tidak yakin bahwa PTA merupakan organisasi paling penting di Amerika Serikat untuk memperbaiki sekolah. Subjek dapat diranking atau diberi peringkat menurut skala responnya.


Saat mengkonstruksi skala kumulatif, satu hal yang harus ditentukan terlebih dahulu dari semua yaitu apakah item-item membentuk skala unidimensional. Untuk malakukan hal ini, salah satunya menganalisis reproduksibilitas dari respon-respon ― artinya, proporsi dari respon secara aktual jatuh ke dalam contoh/pola. Pada dasarnya skor total, suatu prediksi yang dibuat dari pola respon terhadap item-item tertentu. Kemudian pola aktual dari respon dipelajari dan suatu pengukuran dibuat dari batasan terhadap yang mana respon reprodusibel dari skor total. Salah satu teknik adalah membagi total jumlah eror dengan total jumlah respon dan substrak dari salah satu. Guttman menyarankan 0,90 koefisien reproduksibilitas minimum diperlukan untuk serangkaian item untuk dikenali sebagai bentuk skala unidimensional atau kumulatif.

Beberapa pendukung bahwa skala Guttman lebih teoretis dari pada signifikan praktis karena hal ini sulit untuk mengumpulkan item-item kriteria reproduksibilitas yang memuaskan. Teknik ini juga dikritik karena tidak menyarankan langkah-langkah untuk mempersiapkan atau memilih item-item. Hanya setelah item-item dipilih dapat memutuskan reproduksibilitasnya.

a. Semantic differensial scales
Salah satu pendekatan pengukuran sikap adalah Semantic differensial scales yang merupakan teknik pengukuran sikap yang dikembangkan oleh Osgood, Suci dan Tannenbaum. Semantic differensial didasarkan pada asumsi bahwa objek mempunyai dua jenis perbedaan makna individu, yaitu makna konotatif dan denotatif, yang dapat dinilai secara independen. Denotatif merujuk pada makna yang terdapat dalam kamus, sedangkan konotatif merujuk pada makna asosiasi atau saran yang dimaksudkan oleh kata tersebut. Lebih mudah menetapkan makna denotatif suatu objek daripada makna konotatifnya. Namun sangat mungkin untuk mendapatkan makna konotatif dengan meminta secara langsung kepada individu untuk menilai objek yang dimaksud menggunakan bilangan atau adjektif bipolar. Dengan demikian makna suatu objek bagi seseorang membuat pola dari nilainya dari objek tersebut pada skala adjektif bipolar.

Osgood dan kawan-kawan menemukan, melalui studi faktor analitik, tiga kelompok (cluster) adjektif, yaitu evaluatif yang terdiri dari objektif seperti baik dan buruk, potensi yang terdiri dari adjektif seperti kuat atau lemah, dan aktivitas yang terdiri dari adjektif seperti aktif atau pasif.

Skala sikap dikonstrusi dengan memilih pasangan adjektif yang mewakili dimensi evaluatif. Pasangan adjektif dipresensikan sepanjang tujuh kategori skala respons dan responden langsung memberi tanda X pada salah satu dari tujuh spasi untuk mengindikasi batasan terhadap yang mana setiap adjektif menggambarkan objek. Sebagai contoh, andaikan seseorang ingin mengukur sikap peserta didik kelas dua terhadap sekolah.

Catatan untuk skala di atas bahwa pasangan adjektif didaftar pada dua sisi untuk meminimalkan rangkaian respon. Rangkaian respon merujuk pada kecenderungan untuk menyukai posisi tertentu dalam daftar pilihan. Seseorang harus memiliki kecenderungan untuk memilih secra ekstrim sisi kanan dan akan mencentang pada posisi tersebut untuk setiap item. Namun sisi skala diubah secara acak sehingga sisi kanan tidak selalu memuat respon yang paling disukai, kemudian individu diwajibkan untuk membaca item dan respon dalam tingkat isinya daripada melihat posisinya. Dalam menskor semantic differensial scale, biasanya, poin-poinnya disusun pada skala 1-7 dengan 7 mewakili respon paling positif. Dengan demikian, item pertama pada contoh di atas, bad akan mendapat skor 1 dan good akan mendapat skor 7 pada posisi terakhir Pada item ke 2 merupakan kebalikannya, pada ujung yang satu, active mendapat skor 7 dan ujung yang lain passive mendapat skor 1. Nilai-nilai pada semua item ditotal dan dilporkan skor rata-ratanya.

3. Rating Scales
Rating scales (skala penilaian) merupakan salah satu instrumen yang paling banyak digunakan untuk pengukuran. Rating scales meliputi asesmen oleh seseorang terhadap kinerja atau perilaku orang lain. Secara khas, penilai diminta untuk menempatkan orang yang akan dinilai pada beberapa poin dalam kontinum atau kategori-kategori yang menggambarkan karakteristik perilaku orang yang dinilai. Nomor nilai dilekatkan/ditempelkan pada poin atau ketagori tersebut. Penilai diasumsikan telah terbiasa dengan ciri khas perilaku individual. Rating scales banyak digunakan dalam penelitian tentang perkembangan anak dan aspek-aspek perilaku lainnya.

Ada beberapa jenis rating scales, salah satu yang sering digunakan adalah skala grafik, dimana penilai secara sederhana menempatkan tanda centang pada poin yang sesuai di atas garis horizontal yang berjalan dari salah satu perilaku ekstrim ke perilaku ekstrim lainnya. Misalnya:



Jenis kedua dari rating scales yaitu skala kategori, yang terdiri dari sejumlah kategori yang disusun dalam suatu seri orde. Lima sampai tujuh kategori yang banyak digunakan. Penilai menyeleksi salah satu pilihan terbaik yang mencirikan perilaku orang yang dinilai. Misalnya, penilai hendak menilai kemampuan peserta didik dan salah satu karakteristik yang akan dinilai yaitu kreativitas, maka item kategorinya meliputi, antara lain:

Seberapa kreatifkah peserta didik Ini? (pilih salah satu)
Luar biasa kreatif
Sangat kreatif
Kreatif
Tidak kreatif
Sama sekali tidak kreatif

Kadang-kadang frase deskriptifnya diringkas sebagai berikut:
Seberapa kreatifkah peserta didik Ini? (pilih salah satu)
Selalu mempunyai ide kreatif
Mempunyai banyak ide kreatif
Kadang-kadang mempunyai ide kreatif
Jarang sekali mempunyai ide kreatif

Dalam menggunakan skala grafik dan skala kategori, penilai membuat keputusan tanpa membandingkan secara langsung orang yang dinilai dengan seseorang atau sekelompok orang lain. Dalam rating scales komparatif, pada sisi yang lain, penilai diinstruksikan untuk membuat keputusan dengan refrensi langsung ke posisi yang lain yang dengannya individu tersebut dibandingkan. Posisi dalam rating scales didefinisikan dalam istilah populasi yang ditentukan dengan karakteristik yang diketahui. Rating scale komparatif ditunjukkan sebagai berikut


Misalnya, skala akan digunakan untuk menyeleksi penerimaan peserta didik yang baru saja lulus. Penilai diminta untuk memutuskan kemampuan calon untuk melakukan pekerjaan yang dibandingkan dengan semua peserta didik yang diketahui penilai. Jika rating valid, maka keputusan memiliki pengertian tentang range dan distribusi kemampuan kelompok total dari lulusan.

Semua teknik penilaian (rating) harus mempertimbangkan error (kesalahan), yang dikurangi dengan validitas dan reliabilitas. Error yang paling sering terjadi yaitu efek halo, yang terjadi ketika penilai mengijinkan generalisasi kesan subjek untuk mempengaruhi penilaian terhadap perilaku.Misalnya, guru menilai seorang peserta didik yang memiliki prestasi yang baik di sekolah (disukai guru), sehingga memberi nilai baik terhadap aspek kecerdasan, popularitas, kejujuran, kerja keras, dan semua aspek lainnya, sedangkan peserta didik yang memiliki prestasi rendah (kurang disukai guru) diberi nilai rendah untuk semua aspek.

Tipe error yang lain yaitu error generositas, yang menunjukkan tendensi/kecenderungan untuk memberikan keuntungan bagi subjek. Sebaliknya tipe error of severity, penilai cenderung memberi nilai terlalu rendah untuk semua aspek atau karakteristik.

Salah satu cara mengurangi error, penilai perlu dilatih atau melatih diri sebelum diminta untuk menilai. Mereka harus diinformasikan tentang kemungkinan kesalahan yang dapat dilakukan. Hal yang paling penting yaitu penilai harus memiliki waktu yang cukup untuk mengamati perlilaku peserta didik. Cara yang lain, tiap perilaku dan poin yang akan dinilai harus didefinisikan dengan jelas.

Reliabilitas rating scales biasanya meningkat oleh penilai yang membuat penialian independen pada individu. Penilaian independen dikutubkan atau dirata-rata untuk memperoleh nilai akhir.

3. Teknik Sosiometri
Teknik sosiometri digunakan untuk mempelajari organisasi kelompok sosial. Prosedur dasar, namun dapat dimodifikasi dalam beberapa cara, meliputi proses meminta anggota kelompok tertentu untuk mengindikasikan pilihan pertama, kedua, ketiga dan seterusnya untuk mencocokan berdasarkan kriteria tertentu, biasanya beberapa aktivitas tertentu. Sebagai contoh, setiap peserta didik dalam kelompok belajar atau kelas diminta untuk memilih dua peserta didik lainnya yang mereka suka sebagai teman belajar, teman makan bersama, atau teman bermain. Metode sosiometri terutama sekali meneliti tentang pilihan yang dibuat oleh setiap orang dalam kelompok tertentu. Pilihan yang diperoleh diplotkan pada sosiogram, yang menggambarkan pola interaksi antar individu dalam kelompok.


Seperti terlihat pada gambar, Fred paling sering dipilih sebagai anggota kelompok, bisa dianggap sebagai ‘bintang’ kelas. Catatan bahwa Pat, Ann dan John saling memilih satu sama lain. Ini mewakili kelompok orang yang mempunyai kesukaan yang sama, yaitu tiga atau lebih individu yang saling memilih satu sama lain. Bill tidak ada yang memilih, ia seorang yang terisolasi. Pilihan-pilihan ditampilkan dalam sosiogram yang dapat dikuantifikasi dan digunakan untuk tujuan penelitian.

Metode sosiometri secara luas digunakan dalam penelitian psikologi sosial dan juga dalam penelitian pendidikan, dimana status sosiometri dapat dipelajari dalam hubungannya dengan variabel lainnya, seperti kemampuan mental, prestasi, dan peserta didik yang disukai guru.

3. Observasi atau pengamatan langsung
Observasi adalah suatu proses pengamatan dan pencatatan secara sistematis, logis, objektif dan rasional mengenai berbagai fenomena. Alat yang digunakan dalam melakukan observasi disebut pedoman observasi. Tujuan utama observasi adalah (1) untuk mengumpulkan data mengenai suatu fenomena baik berupa peristiwa maupun tindakan, baik dalam situasi sesungguhnya maupun dalam situasi buatan, (2) untuk mengukur perilaku kelas (baik perilaku guru maupun perilaku peserta didik), interaksi antara peserta didik dan guru, dan faktor-faktot yang dapat diamati lainnya terutama ranah sosial (social domainl) dan ranah afektif. Dalam evaluasi pembelajaran, observasi dapat digunakan untuk menilai proses dan hasil belajar peserta didik, seperti tingkah laku pada waktu belajar, berdiskusi, mengerjakan tugas dan lain-lain. Observasi juga dapat digunakan untuk menilai penampilan guru dalam mengajar, suasana kelas, hubungan sesama guru, hubungan sesama peserta didik, hubungan guru dengan peserta didik, dan perilaku lainnya. Namun, observasi memiliki banyak kelemahan, terutama dalam pelaksanaan, karena untuk mengamati individu maupun kelompok adalah pekerjaan yang tidak mudah. Masalah validitas dan reliabilitas instrumen, karena kemungkinan melakukan penilaian subjektif oleh pengamat cukup besar.

4. Wawancara
Wawancara merupakan salah satu bentuk alat evaluasi jenis non-tes yang dilakukan melalui percakapan atau tanya jawab, baik langsung maupun tidak langsung dengan peserta didik. Wawancara memiliki kelebihan dalam hal informasi yang diperoleh dari tiap individu secara langsung. Namun dalam hal memastikan tingkat kebenaran informasi yang diperoleh juga bukan pekerjaan yang mudah. Untuk menyusun pedoman wawancara dapat mengikuti langkah-langkah sebagai berikut:
i. Merumuskan tujuan wawancara
ii. Membuat kisi-kisi (layout) dan pedoman wawancara
iii. Menyusun pertanyaan sesuai dengan data yang diperlukan dan bentuk pertanyaan yang diinginkan. Untuk itu perlu diperhatikan kata-kata yang digunakan, cara bertanya dan jangan membuat peserta didik bersikap defensif.
iv. Melaksanakan uji coba untuk melihat kelemahan-kelemahan pertanyaan yang disusun sehingga dapat diperbaiki lagi.
v. Melaksanakan wawancara dalam situasi yang sebenarnya.

5. Teknik Pemberian Penghargaan Kepada Peserta Didik
Teknik pemberian penghargaan ini dianggap penting karena banyak respons dan tindakan positif dari peserta didik yang timbul sebagai akibat tindakan belajar, tetapi kurang mendapat perhatian dan tanggapan yang serius dari guru. Semestinya, guru memberikan penghargaan terhadap setiap tindakan positif dari peserta didik dalam berbagai bentuk sehingga dapat meningkatkan motivasi belajar. Dalam pemberian penghargaan, ada dua teknik yang dapat digunakan guru, yaitu verbal dan nonverbal.

i. Teknik verbal, yaitu pemberian penghargaan yang berupa pujian, dukungan, dorongan, atau pengakuan seperti kata bagus, benar, betul, tepat, baik, dan sebagainya. Dapat juga dalam bentuk kalimat, seperti prestasimu baik sekali, baik, dan sebagainya.
ii. Teknik nonverbal, yaitu penghargaan melalui:
a. Mimik dan gerakan tubuh, seperti senyuman, anggukan, acungan ibu jari, dan tepuk tangan.
b. Cara mendekati (proximity), yaitu guru mendekati peserta didik untuk menunjukan perhatian atau kesenangannya terhadap pekerjaan atau penampilan peserta didik.
c. Sentuhan (contact), seperti menepuk-nepuk bahu, menjabat tangan, dan mengelus kepala. Dalam menerapkan penghargaan dengan sentuhan ini perlu diperhatikan beberapa hal, yaitu usia anak, budaya, dan norma agama.
d. Kegiatan yang menyenangkan, yaitu memberi kesempatan kepada peserta didik untuk melakukan suatu kegiatan yang disenanginya sebagai penghargaan atas prestasi belajarnya yang baik. Misalnya guru memberi kesempatan kepada peserta didik untuk menjadi pemimpin kelompok investigasi sebagai penghargaan atas prestasinya dalam pelajaran.
e. Simbol atau benda, seperti komentar tertulis secara positif pada buku peserta didik, piagam penghargaan, dan hadiah (alat-alat tulis, buku, uang, dan sebagainya)

Penghargaan tak penuh (partial), yaitu pengargaan yang diberikan kepada peserta didik yang memberikan jawaban kurang sempurna atau sebagian yang benar. Dalam hal ini, guru sebaiknya mengatakan “ya, jawabanmu sudah baik, tetapi masih perlu disempurnakan lagi”

C. Pengembangan Instrumen Penilaian Ranah Afektif

Pengukuran ranah afektif dapat dilakukan melalui metode observasi, angket penilaian diri. Penggunaan metode observasi berdasarkan pada asumsi bahwa karateristik afektif dapat dilihat dari perilaku atau perbuatan yang ditampilkan dan/atau reaksi psikologi. Metode penilaian diri dengan asumsi bahwa yang mengetahui keadaan afektif seseorang adalah dirinya sendiri. Skala pengkuran dapat menggunakan skala Likert, Skala pilihan ganda, skala Thurstone, skala Guttman, semantic differential, dan pengkuran minat (Arikunto, 2008).

Ada 11 (sebelas) langkah dalam mengembangkan instrumen penilaian afektif, yaitu:
1. menentukan spesifikasi instrumen
2. menulis instrumen
3. menentukan skala instrumen
4. menentukan pedoman penskoran
5. menelaah instrumen
6. merakit instrumen
7. melakukan ujicoba
8. menganalisis hasil ujicoba
9. memperbaiki instrumen
10. melaksanakan pengukuran
11. menafsirkan hasil pengukuran

Tahap-tahap ini dijelaskan sebagai berikut:
1. Spesifikasi instrumen
Menurut Djemari Mardapi (2004), spesifikasi instrumen terdiri dari tujuan dan kisi-kisi instrumen. Dalam bidang pendidikan pada dasarnya pengukuran afektif ditinjau dari tujuannya, ada empat macam instrumen, yaitu instrumen (1) sikap, (2) minat, (3) konsep diri, (4) nilai, sedangkan menurut Depdiknas (2008) ada lima, yaitu ditambah dengan instrumen (5) moral.

a. Instrumen sikap
Instrumen sikap bertujuan untuk mengetahui sikap peserta didik terhadap suatu objek, misalnya terhadap kegiatan sekolah, mata pelajaran, pendidik, dan sebagainya. Sikap terhadap mata pelajaran bisa positif bisa negatif. Hasil pengukuran sikap berguna untuk menentukan strategi pembelajaran yang tepat.

b. Instrumen minat
Instrumen minat bertujuan untuk memperoleh informasi tentang minat peserta didik terhadap mata pelajaran, yang selanjutnya digunakan untuk meningkatkan minat peserta didik terhadap mata pelajaran.

c. Instrumen konsep diri
Instrumen konsep diri bertujuan untuk mengetahui kekuatan dan kelemahan diri sendiri. Peserta didik melakukan evaluasi secara objektif terhadap potensi yang ada dalam dirinya. Karakteristik potensi peserta didik sangat penting untuk menentukan jenjang karirnya. Informasi kekuatan dan kelemahan peserta didik digunakan untuk menentukan program yang sebaiknya ditempuh.

d. Instrumen nilai
Instrumen nilai bertujuan untuk mengungkap nilai dan keyakinan peserta didik. Informasi yang diperoleh berupa nilai dan keyakinan yang positif dan yang negatif. Hal-hal yang bersifat positif diperkuat sedangkan yang bersifat negatif dikurangi dan akhirnya dihilangkan.

e. Instrumen moral
Instrumen moral bertujuan untuk mengungkap moral. Informasi moral seseorang diperoleh melalui pengamatan terhadap perbuatan yang ditampilkan dan laporan diri melalui pengisian kuesioner. Hasil pengamatan dan hasil kuesioner menjadi informasi tentang moral seseorang.

Dalam menyusun spesifikasi instrumen perlu memperhatikan empat hal yaitu (1) tujuan pengukuran, (2) kisi-kisi instrumen, (3) bentuk dan format instrumen, dan (4) panjang instrumen. Setelah menetapkan tujuan pengukuran afektif, kegiatan berikutnya adalah menyusun kisi-kisi instrumen. Kisi-kisi (blue-print), merupakan matrik yang berisi spesifikasi instrumen yang akan ditulis. Langkah pertama dalam menentukan kisi-kisi adalah menentukan definisi konseptual yang berasal dari teori-teori yang diambil dari buku teks. Selanjutnya mengembangkan definisi operasional berdasarkan kompetensi dasar, yaitu kompetensi yang dapat diukur. Definisi operasional ini kemudian dijabarkan menjadi sejumlah indikator. Indikator merupakan pedoman dalam menulis instrumen. Tiap indikator bisa dikembangkan dua atau lebih instrumen.

2. Penulisan Instrumen
Pada tahap ini membuat tabel kisi-kisi instrumen. Penilaian ranah afektif peserta didik dilakukan dengan menggunakan instrumen penilaian afektif sebagai berikut.

a. Instrumen sikap
Definisi konseptual: Sikap merupakan kecenderungan merespon secara konsisten baik menyukai atau tidak menyukai suatu objek. Instrumen sikap bertujuan untuk mengetahui sikap peserta didik terhadap suatu objek, misalnya kegiatan sekolah. Sikap bisa positif bisa negatif. Definisi operasional: sikap adalah perasaan positif atau negatif terhadap suatu objek. Objek bisa berupa kegiatan atau mata pelajaran. Cara yang mudah untuk mengetahui sikap peserta didik adalah melalui kuesioner. Pertanyaan tentang sikap meminta responden menunjukkan perasaan yang positif atau negatif terhadap suatu objek, atau suatu kebijakan. Kata-kata yang sering digunakan pada pertanyaan sikap menyatakan arah perasaan seseorang; menerima-menolak,menyenangi-tidak menyenangi, baik-buruk, diingini-tidak diingini.

b. Instrumen minat
Instrumen minat bertujuan untuk memperoleh informasi tentang minat peserta didik terhadap suatu mata pelajaran yang selanjutnya digunakan untuk meningkatkan minat peserta didik terhadap mata pelajaran tersebut. Definisi konseptual: Minat adalah keinginan yang tersusun melalui pengalaman yang mendorong individu mencari objek, aktivitas, konsep, dan keterampilan untuk tujuan mendapatkan perhatian atau penguasaan. Definisi operasional: Minat adalah keingintahuan seseorang tentang keadaan suatu objek.

c. Instrumen konsep diri
Instrumen konsep diri bertujuan untuk mengetahui kekuatan dan kelemahan diri sendiri. Informasi kekuatan dan kelemahan peserta didik digunakan untuk menentukan program yang sebaiknya ditempuh oleh peserta didik. Definisi konsep: konsep diri merupakan persepsi seseorang terhadap dirinya sendiri yang menyangkut keunggulan dan kelemahannya. Definisi operasional konsep diri adalah pernyataan tentang kemampuan diri sendiri yang menyangkut mata pelajaran.

d. Instrumen nilai
Definisi konseptual: Nilai adalah keyakinan terhadap suatu pendapat, kegiatan, atau objek. Definisi operasional nilai adalah keyakinan seseorang tentang keadaan suatu objek atau kegiatan. Instrumen nilai bertujuan untuk mengungkap nilai dan keyakinan individu. Informasi yang diperoleh berupa nilai dan keyakinan yang positif dan yang negatif. Hal-hal yang positif ditingkatkan sedang yang negatif dikurangi dan akhirnya dihilangkan. Selain melalui kuesioner ranah afektif peserta didik, sikap, minat, konsep diri, dan nilai dapat digali melalui pengamatan. Pengamatan karakteristik afektif peserta didik dilakukan di tempat dilaksanakannya kegiatan pembelajaran. Untuk mengetahui keadaan ranah afektif peserta didik, perlu ditentukan dulu indikator substansi yang akan diukur, dan pendidik harus mencatat setiap perilaku yang muncul dari peserta didik yang berkaitan dengan indikator tersebut.

e. Instrumen Moral
Instrumen ini bertujuan untuk mengetahui moral peserta didik.

3. Skala instrumen
Pengukuran ranah afektif tidak dapat dilakukan setiap saat (dalam arti pengukuran formal) karena perubahan tingkah laku peserta didik tidak dapat berubah sekejap waktu. Pengubahan sikap seseorang memerlukan waktu yang relatif lama. Demikian juga pengembangan minat dan penghargaan serta nilai-nilai (Arikunto, 2001). Skala untuk menilai sikap telah dibahas pada bagian sebelumnya.

4. Pedoman penskoran
Sistem penskoran yang digunakan tergantung pada skala pengukuran. Apabila digunakan skala Thurstone, maka skor tertinggi untuk tiap butir 11 dan skor terendah 1. Untuk instrumen dengan skala beda semantik, tertinggi 7 terendah 1. Untuk skala Likert, pada awalnya skor tertinggi tiap butir 5 dan terendah 1. Dalam pengukuran sering terjadi kecenderungan responden memilih jawaban pada katergori tiga 3 (tiga) untuk skala Likert. Untuk menghindari hal tersebut skala Likert dimodifikasi dengan hanya menggunakan 4 (empat) pilihan, agar jelas sikap atau minat responden. Skor perolehan perlu dianalisis untuk tingkat peserta didik dan tingkat kelas, yaitu dengan mencari rerata (mean) dan simpangan baku skor. Selanjutnya ditafsirkan hasilnya untuk mengetahui minat masing-masing peserta didik dan minat kelas terhadap suatu mata pelajaran.

5. Telaah instrumen
Kegiatan pada telaah instrumen adalah menelaah apakah: a) butir pertanyaan/ pernyataan sesuai dengan indikator, b) bahasa yang digunakan komunikatif dan menggunakan tata bahasa yang benar, c) butir pertanyaan/pernyataan tidak bias, d) format instrumen menarik untuk dibaca, e) pedoman menjawab atau mengisi instrumen jelas, dan f) jumlah butir dan/atau panjang kalimat pertanyaan/pernyataan sudah tepat sehingga tidak menjemukan untuk dibaca/dijawab.

Telaah dilakukan oleh pakar dalam bidang yang diukur dan akan lebih baik bila ada pakar penilaian. Telaah bisa juga dilakukan oleh teman sejawat bila yang diinginkan adalah masukan tentang bahasa dan format instrumen. Bahasa yang digunakan adalah yang sesuai dengan tingkat pendidikan responden. Hasil telaah selanjutnya digunakan untuk memperbaiki instrumen.

Panjang instrumen berhubungan dengan masalah kebosanan, yaitu tingkat kejemuan dalam mengisi instrumen. Lama pengisian instrumen sebaiknya tidak lebih dari 30 menit. Langkah pertama dalam menulis suatu pertanyaan/ pernyataan adalah informasi apa yang ingin diperoleh, struktur pertanyaan, dan pemilihan kata-kata. Pertanyaan yang diajukan jangan sampai bias, yaitu mengarahkan jawaban responden pada arah tertentu, positif atau negatif.

6. Merakit instrumen
Setelah instrumen dtelaah selanjutnya instrumen dirakit, yaitu menentukan format tata letak instrumen dan urutan pertanyaan/ pernyataan. Format instrumen harus dibuat menarik dan tidak terlalu panjang, sehingga responden tertarik untuk membaca dan mengisinya. Setiap sepuluh pertanyaan sebaiknya dipisahkan dengan cara memberi spasi yang lebih, atau diberi batasan garis empat persegi panjang. Urutkan pertanyaan/pernyataan sesuai dengan tingkat kemudahan dalam menjawab atau mengisinya.

Apapun bentuk instrumen yang digunakan untuk melakukan pengukuran harus terlebih dahulu dikalibrasi atau divalidasi sebelum dipergunakan (Munadi, 2010). Instrumen yang baik akan memberi data yang baik dan diinterpretasikan dengan lebih baik bila diperoleh melalui proses pengukuran yang objektif, sahih dan reliabel. Dalam menganalisis kualitas instrumen aspek afektif dan sosial yang perlu diperhatikan secara cermat adalah analisis validitas dan realibilitas. Analisis secara empiris adalah telaah instrumen non tes hasil belajar berdasarkan data hasil uji coba lapangan. Analisis empiris difokuskan pada analisis validitas dan reliabilitas instrumen. Analisis validitas berkaitan dengan analisis isi (content validity), analisis konstruk (construct validity), analisis prediktif (predictive validity). Analisis reliabilitas umumnya difokuskan pada konsistensi internal (internal consistency), inter-rater analysis.

Berkaitan dengan konstruksi, pengertian konstruk yang bersifat terpendam dan abstrak, biasanya berkaitan dengan banyak indikator perilaku empirik menuntut adanya uji analisis melalui analisis faktor. Analisis faktor dapat digunakan untuk menguji hipotesis-hipotesis mengenai eksistensi konstruk-konstruk atau kalau tidak ada hipotesis yang dipersoalkan untuk mencari konstruk-konstruk dalam kelompok variabel-variabel. Ada dua pendekatan dalam analisis faktor yakni: (1) Pendekatan eksploratori (exploratory factor analysis) melalui metode principal component analysis (PCA), dan (2) Pendekatan konfirmatori (confirmatory factor analysis) melalui metode analisis maximum likelihood (ML).

7. Ujicoba
Setelah dirakit instrumen diujicobakan kepada responden, sesuai dengan tujuan penilaian apakah kepada peserta didik, kepada guru atau orang tua peserta didik. Untuk itu dipilih sampel yang karakteristiknya mewakili populasi yang ingin dinilai. Bila yang ingin dinilai adalah peserta didik SMA, maka sampelnya juga peserta didik SMA. Sampel yang diperlukan minimal 30 peserta didik, bisa berasal dari satu sekolah atau lebih.

Pada saat ujicoba yang perlu dicatat adalah saran-saran dari responden atas kejelasan pedoman pengisian instrumen, kejelasan kalimat yang digunakan, dan waktu yang diperlukan untuk mengisi instrumen. Waktu yang digunakan disarankan bukan waktu saat responden sudah lelah. Selain itu sebaiknya responden juga diberi minuman agar tidak lelah. Perlu diingat bahwa pengisian instrumen penilaian afektif bukan merupakan tes, sehingga walau ada batasan waktu namun tidak terlalu ketat.

Agar responden mengisi instrumen dengan akurat sesuai harapan, maka sebaiknya instrumen dirancang sedemikian rupa sehingga waktu yang diperlukan mengisi instrumen tidak terlalu lama. Berdasarkan pengalaman, waktu yang diperlukan agar tidak jenuh adalah 30 menit atau kurang.

8. Analisis hasil ujicoba
Analisis hasil ujicoba meliputi variasi jawaban tiap butir pertanyaan/ pernyataan. Jika menggunakan skala instrumen 1 sampai 7, dan jawaban responden bervariasi dari 1 sampai 7, maka butir pertanyaan/pernyataan pada instrumen ini dapat dikatakan baik. Namun apabila jawabannya hanya pada satu pilihan jawaban saja, misalnya pada pilihan nomor 3, maka butir instrumen ini tergolong tidak baik. Indikator yang digunakan adalah besarnya daya beda. Bila daya beda butir instrumen lebih dari 0,30, butir instrumen tergolong baik. Indikator lain yang diperhatikan adalah indeks keandalan yang dikenal dengan indeks reliabilitas. Batas indeks reliabilitas minimal 0,70. Bila indeks ini lebih kecil dari 0,70, kesalahan pengukuran akan melebihi batas. Oleh karena itu diusahakan agar indeks keandalan instrumen minimal 0,70.

9. Perbaikan instrumen
Perbaikan dilakukan terhadap butir-butir pertanyaan/pernyataan yang tidak baik, berdasarkan analisis hasil ujicoba. Bisa saja hasil telaah instrumen baik, namun hasil ujicoba empirik tidak baik. Untuk itu butir pertanyaan/pernyataan instrumen harus diperbaiki. Perbaikan termasuk mengakomodasi saran-saran dari responden ujicoba. Instrumen sebaiknya dilengkapi dengan pertanyaan terbuka.

10. Pelaksanakan pengukuran
Pelaksanaan pengukuran perlu memperhatikan waktu dan ruangan yang digunakan. Waktu pelaksanaan bukan pada waktu responden sudah lelah. Ruang untuk mengisi instrumen harus memiliki cahaya (penerangan) yang cukup dan sirkulasi udara yang baik. Tempat duduk juga diatur agar responden tidak terganggu satu sama lain. Diusahakan agar responden tidak saling bertanya pada responden yang lain agar jawaban kuesioner tidak sama atau homogen. Pengisian instrumen dimulai dengan penjelasan tentang tujuan pengisian, manfaat bagi responden, dan pedoman pengisian instrumen.

11. Penafsirkan hasil pengukuran
Hasil pengukuran berupa skor atau angka. Untuk menafsirkan hasil pengukuran diperlukan suatu kriteria. Kriteria yang digunakan tergantung pada skala dan jumlah butir pertanyaan/pernyataan yang digunakan.


BAB III

PENUTUP


Kesimpulan

1. Penilaian ranah afektif lebih ditekankan pada perkembangan sikap peserta didik, yaitu kemampuan menerima, merespon, menilai, mengorganisasi, menilai, menginternal, membentu karakter, memiliki rasa ingin tahu dan memiliki cita-cita/aspirasi. Ranah sosial yang perlu dinilai adalah kemampuan berhubungan, berkomunikasi, berpartisipasi, berdiskusi, mengambil keputusan, berkolaborasi, berinisiasi, dan berubah/melakukan perubahan.

2. Alasan dan tujuan utama melakukan asesmen ranah afektif adalah untuk mengumpulkan informasi tentang sikap, minat, konsep diri, nilai dan moral peserta didik. Kemajuan perkembangan kompetensi hasil belajar pada ranah efektif sangat mempengaruhi kompetensi hasil belajar dalam ranah sosial, yang erat kaitannya antara sikap dan cara berinteraksi.

3. Prinsip dan prosedur dalam mengkonstruksi instrumen asesmen ranah afektif perlu memperhatikan aspek-aspek sikap, minat, konsep diri, nilai dan moral peserta didik. Bentuk-bentuk instrumen yang dapat digunakan untuk pengukuran aspek afektif dan sosial antara lain observasi, wawancara, skala sikap, angket, inventori kepribadian, dan teknik sosiometri. Ada 11 (sebelas) langkah dalam mengembangkan instrumen penilaian, yaitu:

1. menentukan spesifikasi instrumen

2. menulis instrumen

3. menentukan skala instrumen

4. menentukan pedoman penskoran

5. menelaah instrumen

6. merakit instrumen

7. melakukan ujicoba

8. menganalisis hasil ujicoba

9. memperbaiki instrumen

10. melaksanakan pengukuran

11. menafsirkan hasil pengukuran



DAFTAR PUSTAKA


_____. (2011). Krathwohl's taxonomy of affective ranah. Artikel. Diambil pada tanggal 17 Oktober 2011, dari http://classweb.gmu.edu/ndabbagh/ Resources/Resources2/krathstax.html.

Arends, R. I. (2008). Learning to teach. (Terjemahan Helly Prajitno & Sri Mulyantini). New York: McGraw Hill. (Buku asli diterbitkan tahun 2007).

Ary, D. (1985). Introduction to research in Education (3th ed.). USA: College Publishing.

Arifin, Z. (2009). Evaluasi pembelajaan, prinsip, teknik, dan prosedur. Bandung: PT. Remaja Rosdakarya.

Suharsimi, A. (2001). Dasar-dasar evaluasi pendidikan. Jakarta: PT. Bumi Aksara.

Depdiknas. (2005). Peraturan Pemerintah RI Nomor 19, Tahun 2005, tentang Standar Nasional Pendidikan.

Depdiknas. (2008). Pengembangan perangkat penilian afektif.

Dettmer, P. (2006). New Blooms in established fields: four ranahs of learning and doing. ProQuest Education Journals, 28, 2, 71-73.

Koballa, T. (2011). The Affective Ranah in Science Education. Artikel. Diambil pada tanggal 17 Oktober 2011, dari http://serc.carleton.edu/ NAGTWorkshops/affective/framework.html.

Mardapi, D. (2008). Teknik penyusunan instrumen tes dan non tes. Yogyakarta: Mitra Cendekia.

Munadi, S. (2010). Analisis kualitas soal untuk penilaian aspek afektif. Makalah disajikan dalam Workshop penyusunan instrumen evaluasi afektif matakuliah pengembangan kepribadian, di Universitas Negeri Yogyakarta.

National Research Council. (2002). Achieving high educational standards for all: conference summary. Washington D.C.: National Academy Press. http://www.nap.edu/catalog/10256.html

New World Encyclopedia. (2 April 2008). Bloom, Benjamin. Artikel. Diambil pada tanggal 17 Oktober 2011, dari http://www.newworldencyclopedia. org/entry/Benjamin_Bloom.

Sudjana, N. (2010). Penilaian hasil proses belajar mengajar. Bandung: PT. Remaja Rosdakarya.

The Australian curriculum in New South Wales. http://www.boardofstudies.nsw. edu.au/australian-curriculum/

Wikipedia. (21 Juni 2011). Taksonomi Bloom. Artikel. Diambil pada tanggal 17 Oktober 2011, dari http://id.wikipedia.org/wiki/Taksonomi_Bloom.


Lampiran
>>>Click<<<
Share:

No comments:

Post a Comment

Pengembang

Pengembang

Statistik Pengunjung

Post Populer

ANGGOTA

Ads

Post Terbaru