Kuder, Richardson, KR20, KR21 ve Cronbach alfa hakkında

Aslında bu kadar uzun yazmayacaktım ama Kuder bu aralar hakkında çok şey okuduğum kişilerden birisi, Richardson ise neredeyse hiç bir yerde hayatı hakkında bilgi bulunamayacak kadar unutulmaya yüz tutmuş bir kişi. İkisi de psikoloji tarihi içinde çok önemli yerlere sahipler. Hele Richardson….. Klasik bir laf vardır biliyorsunuz psikolojide ölçme araçlarının kullanımı Amerikan ordusu savaşa girince yaygınlık kazandı diye. ışte o yaygınlığı kazandıran adamın ta kendisi Richardson…

KR20 ve KR21 formülleri, 1937 yılında G. Frederic Kuder (1903-2000) ( ki kendisi Kuder tercih envanterinin de geliştiricisidir, hatta Personnel Psychology (ortak) ve Educational and Psychological Measurement dergilerinin de kurucusudur. Ölünceye dek de APA danışma psikolojisi bölüm kurucusu ve başkanıydı) ve  Marion Webster Richardson (1896-1965), (1946-1948 arasında APA’nın sosyal hizmetler bölüm başkanlığını yapmıştır, kendisi aslında Amerikan ordusunda Yarbay’dır. Richardson, 1941 yılında ünlü zeka kuramcısı ve test gelişiricisi Cattell’i Amerikan ordusuna subay seçmek için gerekli olan testleri birlikte geliştirmek amacıyla orduya davet etmiş ve 3 yıl birlikte çalışmışlardır) tarafından yayımlanmıştır. Kuder ve Richardson’un tanışması muhtemelen Kuder’in doktorasını aldıktan sonra Cattell’in yönettiği Science Press dergisinde editör olarak çalışmaya başladığı dönemde Cattell aracılığıyla olmuştur ama kesin bilgim yok. Kuder ve Richardson bağımsız olarak yaptıkları çalışmaların ortak bir noktada birleşebileceğini görmüş ve ölçme araçlarının güvenilirliği için elde ettikleri bulguları birleştirmişlerdir. Aslında, bilindiği üzere Kuder ve Richardson 1937 yılında test güvenilirliğinin belirlenebilmesi amacıyla 30 kadar formül yayımlamışlardır. Bu formüllerin her birisi, testlerin belirli özelliklere sahip olmaları durumlarında (1-0 şeklinde puanlanan testler; tüm maddelerinin güçlükleri birbirine eşit olan testler gibi) kullanılabilecek olan güvenilirlik katsayısı formülleridir. Bu formüller arasından en çok bilinenleri 20 ve 21 numaralı formülerdir. 20 numaralı formül, yani KR20 formülü, test güvenilirliğini hesaplamada o güne kadar kullanılmakta olan test tekrar test ya da testi yarıya bölme yöntemlerinin gideremediği bazı sorunları ortadan kaldırabilmek amacıyla geliştirilmiştir. Bu sorunların en büyüğü, özellikle tek uygulamanın söz konusu olduğu durumlarda güvenilirliği belirlerken kullanılan testi yarıya bölme yönteminin taşıdığı bir problemdir. Test nereden yarıya bölünecektir. ılk yarı son yarı şeklinde mi? yoksa tek maddeler çift maddeler şeklinde mi? Ayrıca hangi yarının kullanıldığına bağlı olarak hesaplanan korelasyon katsayıları da birbirinden farklı değerleri ifade ettiğinden testi yarıya bölme yöntemi kararsız sonuçlar verme eğilimindedir.

İşte bu noktada Kuder ve Richardson, bir testin içinde bulunan ve mümkün olan bütün yarılar arasındaki korelasyonları hesaplamayı ve bu korelasyonların ortalamasını almayı önerdiler. Fakat uygulamada tüm yarılar arası korelasyonları hesaplamak çok büyük zaman kaybı yaratacağından bu durumu kısa yoldan halleden bir formül türettiler. Türettikleri formül sadece test içindeki maddelerin 1 ve 0 şeklinde puanlandığı durumlarda geçerli olan bir formüldü. Çünkü birazdan göreceksiniz formülün önemli terimlerinden birisini (madde puanları varyansı) hesaplayabilmek için terimi oluşturan ögelerin binom dağılımına sahip olması gerekmektedir. Ayrıca bunun ikinci nedeni de şu: Kuder, forced-choice denen yanıtlama sisteminin bireylerden elde edilecek bilgilerin geçerliliğini arttıracağına inanan bir kişiymiş bunda da oldukça ısrarcıymış.

Formülün mantığı çok basitti. Bu formülde her madde bir test yarısı olarak varsayılıyordu. Maddeler arasındaki korelasyonu bulmak için klasik korelasyon katsayısı yöntemi izlendi. Biliyorsunuz korelasyon katsayısını hesaplarken, (bütün, parçaların biraraya gelmelerinden daha farklı bir şeydir gerekçesinden dolayı) değişkenlerin birlikte/yanyana ilişkiye katkıları, o değişkenlerin birlikte oluşturdukları bütün varyansa (bileşenlerin ortak varyansı) oranlanır.

Yani

r=Bileşenlerin birlikte-yanyana varyansı / Bileşenlerin ortak-bütünlük varyansı

Aynı mantık Kuder Richardson için de geçerliydi.

Onlar madde puanları varyanslarını, yani bileşenlerin (maddelerin) yanyana-birlikte oluşturdukları varyansı test puanları varyansına yani bileşenlerin (maddelerin) birlikte ürettikleri ortak varyansa oranladılar. Böylece ortaya maddelerin birbirlerine ne kadar benzediklerine ilişkin bilgi veren bir indis çıkmış oldu. Madde puanları varyansı (yani pay) ne kadar küçükse (yani maddeleri birbirine ne kadar benziyorsa) payda ne olursa olsun ortaya çıkacak değer 0 ya da 0’a yakın bir değer olarak hesaplanıyordu. Hesaplanan değerin 0’a yaklaşması birbirine benzemenin arttığı anlamına geliyordu, bunu tersine çevirebilmesi, 1.00’e yakın olmanın benzerliği yansıtması için de bu indisin 1,00’den farkını aldılar.  Bulunan bu değer o testteki ortalama benzerlik oranını göstereceğinden bu değeri mümkün olan bütün test yarısı karşılaştırması sayısı ile çarpmak gerekecekti. Bunu da (madde sayısı!) (K!) o da K/K-1   yani madde sayısı/madde sayısı-1 le çözdüler. Sonuçta ortaya şu formül çıkmış oldu
p= madde güçlük değeri

q= 1- madde güçlük değeri

K= madde sayısı

SX2= Test puanları varyansı

p*q’ların toplamı madde puanları varyansını verir.
Bu formül 0,00 ile +1,00 arasında değişen bir katsayı bildirir. Değer (sıfır) 0’a yaklaştıkça güvenilirliğin düştüğü +1,00’e yaklaştıkça da güvenilirliğin yükseldiği yorumu yapılır.

KR21 ise yukarıdaki formülün çok benzeridir fakat KR21’deki temel varsayım tüm maddelerin eşit madde güçlük değerine sahip olduğu şeklindedir. KR21 formülü şöyledir.

Bu formülde test ortalaması önemlidir çünkü tüm maddelerin aynı güçlükte olması, madde puanları varyansının her karşılaştırma yani her test yarısı arası karşılaştırma için aynı değeri alması demektir. Bu formül de KR20 gibi değerşer üretmektedir ve yorumlanması da KR20 gibidir. Fakat bu formül eğer madde güçlükleri birbirine eşit olmadığı halde kullanılırsa o test için olabilecek en düşük güvenilirlik katsayısını bildirir. Yani uyguladığınız bir test için KR21 dğerini hesaplarsanız elinizdeki testin güvenilirlik açısından en kötü nereye kadar inebileceğini görmüş olursunuz.

Daha sonra Cronbach 1951 yılında bu iki formülden yola çıkarak 1-0 şeklinde puanlanmayan ölçme araçları için de kullanılabilecek ünlü Cronbach alfa formülünü geliştirdi. Bu formülde ise tek değişik olan yer madde varyansının hesaplanmasında kullanılan yöntemin p*q yerine madde puanı dağılımının klasik varyans formülü ile hesaplanmasıdır.

Bütün bunların dışında başka bir açıdan bakmak gerekirse Cronbach alfa, KR20-21 gibi iç tutarlılık katsayılarına şu türden bir yorum da getirilebilir diye düşünüyorum. Sosyal bilimlerde kullandığımız ölçme araçlarının birimleri fizik bilimlerdeki ölçme araçlarındaki birimlerin verdikleri bilgiler gibi bilgi vermemektedir. Fizik bilimlerde kullanılan ölçme araçlarında bulunan her bir birim bir diğerine özdeştir. Bizim araçlarımızın birimleri ise bu türden bir özdeşliğe sahip değildir. ıstenen, hiç olmazsa bu özdeşliğe yakın bir yerde durmaktır. ışte bu yakınlığın derecesini ölçeğimizi oluşturan birimlerin (yani maddelerin) birbirine ne kadar benzediklerini analiz ederek ortaya koyabiliriz. İşte bu analiz iç tutarlılık olarak karşımıza çıkan Cronbach alfa, KR20-21 analizleridir.

 

Soru ve önerilerinizi aşağıdaki yorum bölümüne yazabilirsiniz

 

5 yorum

  1. Hocam 13 soruluk bir testte kr20 ve kr21 sonuçları kaç çıkarsa testin güvenilirliği yüksek diyebiliriz? Ayrıca kr20 ve kr21 sonuçlarımın birbirine yakın olmamasında nasıl bir yorumlama yapabiliriz?

    • Genel kabul 0.70 ve üzerinde olması yönünde. KR20 ve KR21 değerlerinin birbirine yakın olmamasının sebeplerinden birisi maddelerin güçlüklerinin birbirinden çok farklı olması olabilir. KR20 tüm maddelerin güçlüklerini dikkate alırken KR21 güçlüklerin ortalamasını dikkate alarak bir tane güçlük varmış gibi davranır.

Bir yanıt bırakın

E-posta hesabınız yayımlanmayacak.


*


This site uses Akismet to reduce spam. Learn how your comment data is processed.