top of page

Güvenirlik Kestirme Yöntemleri

Güvenirlik Kuramı işlenirken güvenirliği tam olarak hesaplamanın mümkün olmadığını, bunun yerine güvenirliği kestirmek zorunda olduğumuza değinmiştik. Burada, başlıca güvenirlik kestirme yöntemleri tanıtılacak, örnekler verilecek ve bu yöntemlerin güçlü ve zayıf noktalarına değinilecektir. Bu yöntemler:

5.1. Test - Tekrar Test Yöntemi

Testin aynı denekler üzerinde, belli bir zaman dilimi içerisinde ve belli koşullar sağlanarak tekrar uygulanması işlemidir. Bu yaklaşım, "iki uygulama arasında geçen zaman içerisinde ölçülen özelikte önemli değişikliğin olmadığı" sayıltısına dayanır. Bu sayıltının karşılanabilmesi için iki ölçüm arsında geçen süre önemlidir. Bir şeyi iki defa ölçersek, iki gözlem arasındaki korelasyon, kısmen iki ölçme zamanı arasında geçen süreden etkilenebilir. Yani, süre ne kadar kısalırsa korelasyon o kadar yüksek; süre ne kadar uzarsa korelasyon da o kadar düşük çıkabilir. Bunun nedeni iki gözlemin geçen zamanla bağlantılı olmasıdır-süre kısaldıkça hatalara katkıda bulunan daha çok benzer etkenler olabilir. Bu nedenle, iki uygulama arasında geçen süre, ne hatırlanacak kadar kısa ne de testle ölçülen özelikler bakımından öğrencilerin değişebileceği kadar uzun tutulmalıdır. Genellikle, testin tekrarı için 10 ile 20 günlük bir sürenin yeterli olacağı düşünülür.

 

Örnek

15 maddelik bir Türkçe testi 20 gün arayla aynı öğrenci grubuna (n = 15) uygulanmış ve elde edilen puanlar aşağıda verilmiştir. Tabloda birinci uygulamadan elde edilen puanlar X, ikinci uygulamadan elde edilen puanlar ise Y ile gösterildiğine göre, bu testin güvenirlik katsayısı kaçtır?

 

 

 

Çözüm

 

Bir testin iki ayrı uygulaması arasındaki tutarlılık o testin güvenirliğini vermektedir. Bu örneğe göre, testin iki ayrı uygulaması arasındaki tutarlılık korelasyon ile hesaplanabilir. Eldeki örnekte, değişkenlerden her ikisi de sürekli olduğuna göre iki uygulama arasmdaki ilişki aşağıda verilen Pearson Momentler Çarpımı Korelasyon tekniği ile hesaplanabilir (Baykul, 1999).

Korelasyon eşitliği için istenenleri hesaplamak amacıyla yukarıdaki gibi bir tablo oluşturulabilir. Bu tablodan yararlanarak istenen değerleri eşitlikte yerine koyarsak korelasyon,

bulunur.

Bu korelasyon katsayısı eldeki testin tutarlı ölçümler verdiğine, dolayısıyla güvenirliğine ilişkin güçlü bir kanıt anlamına gelir. Her zaman eldeki örneğe benzer korelasyon katsayılarına ulaşmak olanaklı olmayabilir. Bu durumda, elde edilen korelasyon katsayısını testin kullanılış amacına bağlı olarak yorumlamak doğru olur. Örneğin, eğer test sonuçları önemli bir karar için kullanılacaksa, güvenirlik katsayısının olabildiğince l'e yakın olması gerekir. Test bir sınıfta öğrenci başarısını yoklamak amacıyla geliştiriliyorsa, güvenirlik katsayısının örneğin 0,80 düzeyinde olması yeterli görülebilir. Öte yandan, testin güvenirliği madde sayısından etkilenebileceği için daha az sayıda maddeden oluşan bir test için örneğin 0,70 düzeyinde bulunan güvenirlik katsayısı anlamlı görülebilir.

5.2. Eş Değer (Alternatif) Formlar Yöntemi

Eş değer formlar yöntemi uygulanış biçimiyle test-tekrar yöntemiyle aynıdır, ancak güvenirlik konusunda aynı yapıyı ölçtüğü düşünülen iki eş değer form arasındaki uyuma dayanır. Eş değer formlar yöntemi, aynı testin tekrar uygulanmasının mümkün olmadığı durumlarda kullanılır. Bunu yapmanın bir yolu, aynı yapıda birçok soru üretmek ve bu sorulan rasgele iki parçaya ayırarak eş değer formlar oluşturmak ve aynı gruba iki farklı zamanda uygulamaktır. Bu iki eş değer form arasındaki korelasyon güvenirliğin tahmini olarak kullanılır. Bu yöntemle ilgili önemli sorunlardan birisi, aynı yapıda çok sayıda madde üretilmesi gereğidir ve bu her zaman kolay olmayabilir. Diğer bir sorun ise, eş değer formlar yöntemi formların ölçülen özellikler bakımından eş değer veya eşit olduğu sayıltısına dayanır. Bu sayıtınm karşılanması amacıyla formlar çok sayıda madde arasından rastgele örneklem yoluyla seçilerek oluşturulmaya çalışılır. Ancak, bu işlem sayıltının karşılanması için yeterli olmayabilir. Eş değerliğin kanıtlanması için başka istatistiksel işlemlere gereksinim duyulur ki, bu işlemler burada değinilmeyecek kadar karmaşık ve zahmetlidir. Eş değer formlar yöntemi bir yönüyle aşağıda açıklanan test-yarı yöntemine de benzetilebilir. En önemli farkı, eş değer formlar yönteminde formlar eş değer olarak yapılandırılır ve iki form birbirinden bağımsız olarak uygulanır. Oysa test-yarı yönteminde uygulama bir tek oturumda gerçekleştirilir. Ek olarak, eş değer formlar, öntest ve sontest kullanılan deneysel araştırma desenlerinin iç geçerliğini artırmada da önemli bir avantaj sağlayabilir.

5.3. Test - Yarı Yöntemi

Test-yarı yöntemi test bir defa uygulandığında güvenirlik kestirme yöntemlerinden biridir. Bu yöntemde, eldeki test bir defa uygulanır ve test rastgele iki eşit yarıya ayrılarak her bir yarısı için öğrencilerin toplam puanları hesaplanır. Burada, toplam testin rastgele iki eşit yarıya ayrılmasının nedeni, her bir yarının diğeriyle aynı amaca hizmet etme olasılığını artırmaktır. Her bir alt test için hesaplanan puanlar arasındaki ilişki (>h) iki alt test arasındaki tutarlılığı verir. Bu şekilde hesaplanan tutarlılık katsayısını toplam testin güvenirliği gibi yorumlamak doğru olmaz. O nedenle, iki yarı arasındaki tutarlılığın toplam teste genellenmesi gerekir. İki yarı arasındaki tutarlılığı toplam testin güvenirliği için genellerken alt testlerin varyanslarının eşit olup olmama durumuna göre hareket edilmesi gerekir (Turgut, 1995)

5.4. İç Tutarlılık Katsayısı

İç tutarlılık katsayısı, test bir defa denendikten sonra deneme sonuçlarına dayanarak maddeler arasındaki uyumun düzeyine ilişkin bilgi vermeyi amaçlar. Genellikle tek boyutlu yapılar için hesaplanması uygun düşer (Ebel, 1972). Eğer temel amaç diğerleriyle uyum gösteren maddelerden ola şan bir test geliştirmekse, ortak amaçlara hizmet eden maddelerin bir araç olması gerekir. Bu durum testin kendi içinde tutarlı olmasını sağlar. Eğer test kendi içinde tutarlıysa, o testle güvenilir ölçümler elde etme olasılığı artar. Bir testin iç tutarlılık katsayısını kestirme, testin madde istatistiklerinin hesaplanıp hesaplanmadığına bağlı olarak değişebilir. Eğer maddeci istatistikleri belli olan bir test için iç tutarlılık katsayısı hesaplanacaksa,

K: Testtki madde sayısı

pq: Madde varyansı

S2x: Test ham puanlarının varyansı

Eğer, ham puanlardan hareketle iç tutarlılık katsayısı hesaplanacaksa,

5.5. Cronbach Alpha (a) Güvenirlik Katsayısı

Alpha güvenirlik katsayısı, yanıtları iki kata gorili (dikatomik) olmayan dereceleme niteliğindeki ölçeklerin veya her bir seçeneği farklı ağırlıklara dayanarak puanlama yapılan testlerin iç tutarlılık katsayısını hesaplamada kullanılan bir yöntemdir. Cronbach Alpha (a) güvenirlik katsayısı K.R. FC R 20 ve 2 i 'in daha genel hâlidir. Burada, önce bir yarının güvenirliğini hesaplayıp, daha sonra diğer yarının maddelerini yine tesadüfi olarak iki parçaya ayırdığımızı ve tekrar bir yarının güvenirliğini hesapladığımızı ve tüm muhtemel yarıların güvenirliğini hesaplayana kadar devam ettiğimizi düşünelim. Cronbach Alpha, matematiksel olarak tüm muhtemel test-yarı tahminlerinin ortalamasına eşittir. Ancak, bu şekilde hesaplama duruma göre sonsuza kadar gidebilir. Alpha (a) güvenirlik kestirme yöntemi, tüm muhtemel yarıların korelasyonlarının ortalamasına eşit olsa da, hesaplama asla bu şekilde yapılmaz. Onun yerine, sonuca en hızlı bir biçimde ulaşmak için geliştirilmiş olan şu eşitlikten yararlanılır: (Crocker ve Algina, 1986):

Ayrıca, özellikle gözlem ölçeklerinin veya yapılan gözlemlerin güvenirliğini kestirmek amacıyla, Yargılayıcılar Arası (inter-rater reliability) ya da Gözlemciler Arası (inter-observer reliability) Güvenirlik olarak bilinen güvenirlik kestirme yöntemlerinden yararlanılır. Ölçme kapsamında yer alan kimi özellikler, örneğin psiko-motor davranışlar bir gözlemci ya da bir yargıcının doğrudan gözlemi sonucunda ölçülebilir. Bu durumda, gözlem işini bir kişi ya da kişilerin yapması mümkün olabilir. Eğer, gözlem doğrudan ve bir kişi tarafından yapılıyorsa, elde edilen sonuçların güvenilir olup olmadığı konusunda endişelenmeliyiz. Çünkü gözlem sırasında kolayca zihnimiz karışabilir, gözlemleri yanlış yorumlayabilir ya da tekrar eden işleri yapmaktan usanabiliriz. O nedenle, gözlemin ya da gözlem sonuçlarının güvenilir olup olmadığmı kanıtlamalıyız. Bir gözlemin güvenirliği konusunda kanıt aramak amacıyla izlenebilecek çeşitli yollar vardır. Bunlardan biri, iki gözlemci kullanmak ve gözlemciler arasındaki tutarlılığı kontrol etmektir. Bu işlemi asıl gözleme geçmeden önce gerçekleştirmek daha doğrudur. Yani, yapılacak gözlemin tutarlılığı, dolayısıyla güvenirliği için önceden deneme yapmak ve deneme sonuçlarını uygun istatistiksel teknikler yardımıyla karşılaştırmaktır. Çoğu zaman gözlem sonuçları, "gözlendi/gözlenemedi, evet/hayır, yeterli/yetersiz" gibi iki kategorili (dikatomik) olarak kaydedilebileceği gibi "tamamen uygun............... kesinlikle uygun değil" gibi örneğin 5 dereceli bir ölçek üzerine de kaydedilerek elde edilebilir. Birinci durumda, gözlemciler ya da yargıcılar arasındaki uyumu, yani gözlemciler arası tutarlılığı Kappa istatistiği olarak bilinen istatistikten; ikinci durumda ise Pearson Çarpım Momentler korelasyon hesaplama tekniğinden yararlanarak kestirmek mümkündür.

1.PNG
2.PNG
3.PNG
4.PNG
5.PNG
6.PNG
7.PNG
8.PNG
bottom of page