EÖD-Ders3.2-Güvenirlik | SESHAT ARAŞTIRMA GRU

Ölçmede Hata ve Gerçek Puan

Eğitimde ve psikolojide hangi özellik ölçülürse ölçülsün mutlaka ölçme sonuçlarına bir miktar hata karışacaktır. Hatasız ölçme söz konusu değildir. Ölçme alan yazınında bireylerin performansları altında yatan örtük özelliği açıklamak üzere bazı kuramlar geliştirilmiştir. Bu kuramların biri klasik test kuramı veya gerçek puan kuramıdır. Bu kurama göre bir testten elde edilen puanın iki bileşeni vardır; gerçek puan ve hata puanı.

Gerçek Puan Kuramı Ölçmeyle ilgili bir kuram olan Gerçek Puan Kuramı, ünlü İngiliz psikolog Charles Spearman'ın korelasyon kavramına dayanır (Willams, 2003). Charles Spearman, gözlenen ölçümlere karışan hatalar üzerine mantıksal ve matematiksel tartışmaları içeren yayınlarında (1904-1913 arası), gözlenen ölçümler arasındaki korelasyonun gerçek ölçümler arasındaki korelasyondan daha düşük olacağını göstermiştir. Bu düşünce gerçek puan kuramının temelini oluşturmuş, sonraki yıllarda Guilfort, Gülüksen, Magnusson ve Lord ve Novick gibi birçok yazar gerçek puan kuramını geliştirmişlerdir (Crocker ve Algina, 1986).

Gerçek puan kuramı, özellikle eğitim ve psikolojideki ölçmelerde karşılaşılan birçok sorunun çözümüne katkı getirmiş, istenen özelliklere sahip ölçme araçlarının geliştirilmesine yol göstermiştir. Gerçek puan kuramı, ölçmeyle ilgili tek kuram değildir. Günümüzde, örtük özelikler kuramı (latent trait theory) olarak bilinen daha yeni bir kuram olmasına karşın, gerçek puan kuramının açık, anlaşılır ve basit olması yaygınlığını ve uygulanabilirliğini artırmıştır.

Gerçek puan kuramı, anlaşılması son derece kolay bir kuramdır (daha geniş açıklama için bakınız (Crocker, L., Algina, J., (1986)).

Bunun için X = T + e eşitliğini incelemek yeterlidir. Bu eşitlik, gerçek puan kuramına göre gözlenen ölçümü (X) tanımlar.

Buna göre, her ölçüm iki bileşenden oluşur:

1. Gerçek puan, yani ölçülenin sahip olduğu gerçek değer (T),

2. ölçme sonuçlarına karışan hata (e).

Öyleyse, ölçme sonunda elde ettiğimiz ölçümlerin, gerçek değerlerle ölçme sonuçlarına karışan hataların birleşmesinden oluştuğunu söyleyebiliriz.

Eşitliğe göre, gözlenen ölçümler hata miktarı arttıkça gerçek değerden uzaklaşır, azaldıkça gerçek değere yaklaşır; hata (e) = 0 olduğunda ise gerçek değere eşit olur. Gözlenen ölçümün gerçek değere eşit olması, gözlenen ölçümün yüzde yüz güvenilir olduğunu gösterir. Öte yandan, T = X - e eşitliği, gerçek puanların (T), gözlenen puanlardan (X) hatanın (e) çıkartılmasıyla elde edilebileceğini gösterir. Ne yazık ki, eşitlik kuramsal olarak doğru kabul edilse de, uygulamada ölçme sonuçlarına karışan hatanın miktarını tam olarak bilemediğimiz için gerçek puanın da ne kadar olduğunu hesaplayamayız. Ancak, bu eşitlik gözlenen ölçümlerin güvenirliğini artırmak için hatanın kontrol altına alınması gerektiğini vurgulaması bakımından önemlidir. Aşağıda bu konu ayrıntılı olarak ele alınmaktadır.

Hata Türleri

Ölçme sonuçlarına karışan hata türleri;

•Sabit hata: Her bir ölçme için miktarı değişmeyen hatalara sabit hata denir.

•Sistematik hata: Ölçmeye karışan hatanın miktarı değişkendir. Hatanın miktarı ölçme aracının yapısına, test alanların testle ölçülen özellik dışındaki bazı özelliklerine, ölçülen özelliğin miktarına, puanlama işlemini yapana göre değişebilir.

•Tesadüfi (random-seçkisiz) hata: Ölçme sonuçlarına karışan, kaynağı, yönü ve ölçme sonuçlarını hangi yönde etkileyeceği kestirilemeyen hata türüdür.

1. Sabit Hata

Bir ölçmeden başka bir ölçmeye tekrar eden, ölçme sonuçlarına karışan ve miktar olarak değişmeyen hatalara sabit hata denir. Örneğin, bir terazinin her ölçümde 50 gr eksik tartabilecek biçimde ayarlanmış olması, bu teraziyle yapılacak her ölçümün 50 gr eksik tartılmasına neden olur. Bu durumda, bu teraziyle ölçülen her değişken için hata miktarı tekrar eder, ancak yapılan hatanın miktarı sabit kalır.

Tarih dersinde yaptığı bir yazılı yoklama sınavım puanlayan öğretmen, puanlama sırsında yazısı güzel olan öğrencilerin tümüne fazladan 10 puan ekliyorsa, yapılan hata sabit hatadır. Çünkü ölçme amaçlarının arasında güzel yazmayı yoklamak olmadığı hâlde, güzel yazı yazanlara fazladan puan eklemek öğrencilerin yanıtlarına hatalı puanlar vermek anlamına gelir. Aynı şekilde çirkin yazı yazan her öğrenciye alabileceğinden 10 puan daha düşük vermek de sabit hataya örnek gösterilebilir. Hiç devamsızlık yapmamış öğrencilerin geçme puanına 5 puan eklemek de sabit hataya neden olur.

Sabit hatayla ilgili başka bir ilginç örnek de şu olabilir: Yapılan bir testin söz gelimi 20. maddesinin doğru yanıtı B seçeneği olduğu hâlde, puanlama anahtarında doğru yanıt C seçeneği olarak işaretlenmiş ise 20. soruyu doğru yanıtlayan her öğrenci bu soruya karşılık gelen puan kadar düşük alacaktır. Öte yandan, aynı sorunun C seçeneğini işaretleyerek yanlış yanıtlayan öğrenciler ise fazla puan alacaklardır. Bu örnekte, hem soruyu doğru yanıtlayan hem de C seçeneğini işaretleyerek yanlış yanıtlayan her öğrenci için yapılan hata tekrar edecek, ancak hatanın miktarı değişmeyecektir. Aralarındaki fark, öğrencilerin birinci durumda 20. soruya karşılık gelen puan kadar eksik, ikinci durumda ise fazla puan almalarıdır.

2. Sistematik Hata

Bir ölçmeden başka bir ölçmeye tekrar eden ancak, ölçülen değişkenin büyüklüğüne, boyutuna göre miktarı değişen hatalara sistematik hata denir. Sistematik hata, aşağıdaki örneklerde açıklandığı gibi, ölçme sonuçlarını sistematik olarak etkileyen bir faktörden dolayı oluşur. Örneğin, eğer öğrencilerin sınav yapıldığı ortamın yakınında trafik gürültüsü varsa, bu durum öğrencilerin puanlarım etkiler ve sistematik olarak düşüşüne neden olabilir. Yani, gürültüden etkilenme derecelerine bağlı olarak öğrencilerin puanlarına yansıyabilecek hata, bir öğrenciden başka bir öğrenciye değişiklik gösterebilir. Bu durumda ortaya çıkan hata sistematik hata türündendir. Öğrencilerin yazılı sınavlarını yeterli önlem almadan gelişi güzel puanlayan bir öğretmenin takdir ettiği puanların da hatalı olma olasılığı oldukça yüksek olacaktır. Yine bu durumda puanlara yansıyan hata, öğrencilere göre değişiklik göstereceğinden sistematik hata olarak açıklanabilir.

3. Tesadüfi (Rastlantısal) Hata Ölçme işleminin herhangi bir evresinde, ölçme sonuçlarına tesadüfi olarak karışan veya ölçme sonuçlarınıı tesadüfi olarak etkileyen herhangi bir faktörden kaynaklanan hataya tesadüfi hata denir. Örneğin, öğrencilerin ruhsal durumu başarısını etkileyebilir. Bu durum bazı çocukların gözlenen puanlarına yükseltirken, bazılarınınkini yapay olarak düşürebilir. Tesadüfi hatayla ilgili bilinmesi gereken en önemli noktalardan biri, bütün ölçümler üzerinde sürekli bir etkisi olmadığıdır. Bu nedenle, tesadüfi hata ölçme sonuçlarının değişkenliğini artırırken, ortalama üzerinde fazla etki yaratmaz. Tesadüfi hata, yukarıda sözü edilen kaynaklardan herhangi biri veya birkaçından kaynaklanabilir. Ölçmeyi yapan kişi, bu tür hatalara karşı dikkatli olmalıdır. Çünkü ölçme sonuçlarına rasgele karışabilecek hataları önleme konusundaki çabalarımız, ölçme sonuçlarının güvenirliğini artırmaya hizmet eder.

Hatanın Kaynakları

Gerçek puan kuramına göre hata, gerçek puanlarla gözlenen puanlar arasındaki fark (e = T-X) olarak tanımlanabilir (Turgut, 1995). Farkın artması hatanın artması, azalması ise hatanın azalması anlamına gelir. Buna göre, ölçme sonuçlarına herhangi bir nedenden dolayı karışabilecek hata, gözlenen puanların gerçek puanlardan daha fazla sapmasına neden olur. Ölçme sonuçlarına karışabilecek hatanın kaynaklarının bilinmesi, hataları en az düzeye indirgemek açısından önemlidir ve bu konuda alınabilecek önlemlere yol gösterebilir. Böylece gerçek puanlarla gözlenen puanlar arasındaki fark azaltılarak güvenirliğin artırılmasına hizmet edilmiş olur. Ölçme sonuçlarına karışan hata;

1. Ölçme Aracı,

2. Ölçmenin Yapıldığı Ortam,

3. Ölçmeyi Yapan Kişi,

4. Ölçme Yöntemi ve

5. Ölçülen Değişkenden kaynaklanabilir.

1. Ölçme Aracı

Ölçme aracı güvenirlik, geçerlik ve kullanışlılık bakımından istenen niteliklerde değilse, ölçme sonuçlarının hatalı olma olasılığı yüksek olacak demektir. Eldeki kaynakta, güvenirlik, geçerlik ve kullanışlılık gibi, bir ölçme aracında bulunması gereken nitelikler üzerinde durulmasının asıl nedeni, araçtan kaynaklanabilecek hataları kontrol altına almaya çalışmaktır.

Gerçek puanı tanımlayan T = X - e eşitliği incelendiğinde, hata ile gerçek puan arasında ters orantılı bir ilişki olduğu görülebilir. Buna göre, hata azaldıkça gözlenen puanlar gerçek değere yaklaşır, arttıkça gerçek değerden uzaklaşır. O hâlde, gözlenen puanların gerçek puanlara yaklaşmasını gözlenen puanların güvenirliğinin artması, uzaklaşmasını ise azalması olarak yorumlayabiliriz.

Diğer yandan, e = T - X eşitliğine göre, gerçek değerin bilinememesi nedeniyle ölçme sonuçlarına karışan hatanın miktarı istatistiksel yollarla kestirilmeye çalışılsa da tam olarak hesaplanamaz. Bu güçlük nedeniyle, hata ile uğraşmak yerine ölçme aracının güvenirliğini çalışmak daha uygundur ve araçtan kaynaklanabilecek hatanın dolaylı olarak kontrol altına alınmasına yardımcı olur.

2. Ölçmenin Yapıldığı Ortam Ölçmenin yapıldığı ortam ölçme koşulları açısından uygun değilse, ölçme sonuçlarına ortamdan dolayı hata karışabilir. Örneğin, sınav salonları veya derslikler yeteri kadar aydınlatılmamış, ısıtılmamış veya havalandırılmamış ise bu tür ortamlardan olumsuz olarak etkilenebilecek adaylar olabilir ve bu adaylar sınavlarda gerçek performanslarını sergileyemezler. Bu durum ölçme sonuçlarına ortamdan kaynaklanabilecek hataların karışmasına neden olabilir. Ayrıca sınav ortamlarının fiziksel olarak yetersizliği de benzer biçimde ölçme sonuçlarına hatanın karışmasına neden olabilir. Bu tür ortamlar, ölçme sonuçlarının hem güvenirliğini hem de geçerliğini etkileyebilir.

3. Ölçmeyi Yapan Kişi Ölçmeyi yapan kişinin ölçme sırasındaki duyarlılığı ölçümlerin güvenirliğini etkileyebilir. Gelişi güzel ölçme yapan birisiyle, daha titiz ve dikkatli davranarak ölçme yapan başka birinin ölçümleri arasında, ölçümlerin güvenirliği bakımından titiz ve dikkatli davranan lehine fark olabilir. Örneğin, yazılı yoklama sınavlarının puanlanması sırasında yeterince titiz davranıp, bütün ayrıntıları gözeterek davranmak puanların nesnelliğini dolayısıyla güvenirliğini artırabilir.

4. Ölçme Yöntemi Ölçme yöntemini ölçülecek özelliğin niteliği ve puanların kullanılış amacı belirler. Örneğin, ölçme kapsamında yer alan beceriler daha çok sözel ifade becerilerinden oluşuyorsa, yöntem olarak yazılı veya test türü sınavlardan yararlanmak ölçme amaçlarıyla yeterince örtüşmez. Bunun yerine sözlü sınav yöntemine başvurulması daha uygun puanların elde edilmesini sağlayabilir.

5. ölçülen Değişken Aşağıda, sistematik hatanın açıklanması amacıyla verilen örnekte olduğu gibi, bir öğrenci sınava yeterince hazır olmasına karşm, dikkatini dağıtabilecek biçimde dışarıdan gelen gürültüden etkileniyorsa ya da o gün rahatsızlanmış bir şeye cam sıkılmış ise, sınavda gerçek gücünü yansıtamaz ve alabileceğinden farklı puan alır. Bu ve benzer nedenlerden dolayı ölçme sonuçlarına karışan hata ölçülen değişken kaynaklı hatalar olarak nitelendirilebilir.

Güvenirliğin Tanımı

Güvenirlik, aynı bireyler üzerinde yapılan, bir niteliğe ait ölçmelerin benzer şartlarda tekrar edilebilirliği olarak tanımlanabilir. Güvenirlik kavramı, geçerlilik kavramında olduğu gibi ölçme araçları için değil, o ölçme araçlarından elde edilen puanlarla veya sonuçlarla ilgili bir kavramdır.

Güvenirlik Tahmin Yöntemleri

•Tutarlılık ve Kararlılık: Test-Tekrar test yöntemi: Bir ölçme aracının aynı bireylere belirli bir zaman aralığı ile iki defa uygulanması ve bu iki uygulamada elde edilen puanlar arasındaki korelasyonun hesaplanması ile bulunan güvenirlik kestirim yöntemleridir.

•İç Tutarlılık ve Homejenlik: İki yarım Güvenirliği, KR-20 ve KR-21 Formülleri, Cronbach Alfa:

•İç tutarlılık anlamında güvenirliğin kestirimi, bir testin bir defa uygulanmasına dayalı olarak, maddelere verilen yanıtlar arasındaki ilişkileri belirlemeye dayanır.

•Eş değerlik:Paralel Formlar Uygulaması: Bu yöntemle güvenirliği kestirilebilmesi için iki eşdeğer veya paralel test formunun geliştirilmesi gerekmektedir. Geliştirilen bu iki test formu test alanlara uygulandıktan sonra, iki uygulamadan elde edilen puan grubu arasındaki korelasyon değeri, paralel-eşdeğer formlar güvenirliği değerini vermektedir.

Güvenirlik Katsayısını Etkileyen Etmenler

•Güvenirlik katsayısı kesin ortaya konulamayan ancak kestirilen bir değerdir. Tahmin edilen bir değer olmasının nedeni ise, ölçme sonuçlarına karışan hatanın, tesadüfi hata olması veya kaynağı, yönü, doğrultusu ve miktarı net olarak ortaya konamamasıdır. Ölçme sonuçlarına karışan her hata güvenirliği de etkilemektedir.

•Güvenirlik katsayısı üzerinde olumsuz etkiye sahip etmenler şunlardır;

•Puanlamanın nesnelliği

•Puanlayıcı güvenirliği

•Test edilen grubun değişkenliği

•Testteki madde sayısı

•Testin güçlük düzeyi

Gömleksiz, M. (2008). Eğitimde ölçme ve değerlendirme. S. Erkan (Ed.). Nobel.

Köse, İ. A. (2014). Ölçmede güvenilirlik. N. Çıkrıkçı-Demirtaşlı. Eğitimde ölçme ve değerlendirme, 29-64.