SESHAT EĞİTİMDE VE PSİKOLOJİDE BİYOMETRİK VE BOYLAMSAL ARAŞTIRMALAR GRUBU
Ders 3.1: Ölçmede Temel İstatistiksel Kavramlar
İstatistikle İlgili Bazı Temel Kavramlar
İstatistik öğrenmelerinde sıklıkla karşılaşılacak olan temel bazı kavramlar, eğitim alanına yönelik örnekleriyle birlikte aşağıda açıklanmaktadır.
1.1. İSTATİSTİK NEDİR?
İstatistik, en genel yaklaşımla, 'sayısal bilgi', 'sayısal veri' ya da 'ham veri' olarak tanımlanmaktadır. Örneğin 'Ayşe, 45kg ağırlığındadır' ifadesindeki 45kg, Ayşe'nin 'ağırlık' olarak tanımlanan bireysel hakkında bir bilgi vermektedir ve bir istatistiktir. Bir diğer yaklaşıma göre istatistik, bir süreç tanımlamaktadır. Bir süreç olarak istatistik, bir veri seti üzerinde yapılan aşamalı işlemleri ifade etmektedir. Veriler üzerinde, temelde betimleme ve çıkarsama işlemleri yapılabilmektedir. Matematiksel temelleri olan bu tür işlemleri içeren süreçler 'istatistik' ya da 'istatistiksel yöntem ve teknikler' olarak ifade edilmektedir. İstatistik, bilimsel araştırma ile istatistik ilişkisi kurularak da tanımlanabilmektedir. Temelde bir problem ya da güçlük durumuna çözüm üretme süreci ve çok yönlü bir etkinlik olan bilimsel araştırmalarda, araştırmacı, bir takım amaçlı gözlemlere bağlı olarak veriler elde etmekte ve bu verileri kullanarak olası çözüm önerilerini test etmektedir. Hipotez olarak bilinen bu olası çözüm önerilerinin test edilmesinde kullanılan yöntem ve teknikler, istatistik ya da istatistiksel yöntem olarak ifade edilmektedir.
1.2. GÖZLEM
İstatistik özelinde gözlem; belli bir özellik hakkında bilgi ya da veri toplamak için yürütülen amaçlı ve iyi tanımlı bir eylemdir. Özellikler, 'doğrudan gözlenebilir özellikler' ve 'dolaylı gözlenebilir özellikler' olmak üzere iki grupta değerlendirilebilmektedir. Birey özellikleri dikkate alındığında, bireyin doğrudan gözlenebilir özellikleri olduğu gibi doğrudan gözlenmesi mümkün olmayan, bu nedenle ancak dolaylı olarak gözlenebilen özellikleri de bulunmaktadır. Örneğin saç rengi, göz rengi, parmakların sayısı, iki kişiden birinin diğerinden uzun ya da kısa olması gibi fiziksel özelliklerin bir çoğu doğrudan gözlenebilir özelliklerdir. Bu özelliklerin gözlenmesinde herhangi bir ölçme aracının kullanılmasına da ihtiyaç duyulmaz. Boy uzunluğu, ağırlık gibi bazı fiziksel özellikler ise üzerinde tahmin yürütülebilse bile doğrudan 'ölçülebilir' değildir. Bu tür 2 özelliklerin gözlenmesinde metre, baskül gibi ölçme araçlarının kullanılmasına ihtiyaç duyulur. Dolayısıyla bu tür özelliklerin de dolaylı gözlenebilen özellikler içerisinde değerlendirilmesi mümkündür. Diğer taraftan, başarı, zeka, ilgi, tutum, kişilik gibi psikolojik özelliklerin tamamı doğrudan gözlenebilir değildir. 'Örtük özellik' olarak da tanımlanabilen bu tür özelliklerin gözlenmesi oldukça güçtür. Bu tür özellikler ancak 'davranış' olarak tanımlanan belirtileri üzerinden dolaylı olarak gözlenebilirdir.
1.3. VERİ TOPLAMA ARACI
Genellikle bireysel bir eylem olan gözlem, gözlemi yapan kişiye özgüdür ve bu yönüyle objektif bir gözlem yapılması güçtür. Gözlemlerin objektifliğini sağlamak için bazı önlemler alınabilmektedir. Araştırmacılar sıklıkla yapacakları gözlemlerin objektifliğini ve ölçmenin duyarlılığını artırmak için bir 'veri toplama aracı' ya da 'ölçme aracı' kullanır. O halde veri toplama aracı ya da 'ölçme aracı (measurement tool)', gözlenen belli bir özelliğe yönelik verilerin toplanmasında kullanılan aracı tanımlamaktadır. Kullanılacak veri toplama aracının türü, gözlenmek istenen özelliğe göre değişebilmektedir. Örneğin öğrenme başarısı gözlenmek istendiğinde bir başarı testi, zeka gözlenmek istendiğinde bir zeka testi, okula karşı tutum gözlenmek istendiğinde bir tutum ölçeği, kişilik özellikleri gözlenmek istendiğinde bir kişilik envanteri, bir konu hakkındaki görüşler gözlenmek istendiğinde bir anket kullanılabilmektedir.
1.4. GÖZLEM BİRİMİ
Belli bir özelliğin üzerinde gözlendiği obje ya da nesnelerden her birine 'gözlem birimi' denir. Örneğin, bir okulda öğrencilerin derse geç kalma ya da devamsızlık durumları üzerine bir gözlem yapıldığını düşünelim. Bu gözlemde gözlem birimi, öğrencidir. Bir diğer örnek olarak belli bir caddede günlük trafik yoğunluğunun gözlendiğini düşünelim. Bu tür bir gözlemde, belli saat aralıklarında caddeden geçen araç sayısı, araç türlerine göre not edilebilir. Bu durumda gözlem birimleri araçlar olacaktır. Gözlem birimleri, canlılardan oluşabileceği gibi cansızlardan yani nesnelerden de oluşabilmektedir. Psikoloji, eğitim bilimleri, davranış bilimleri gibi alanlarda ilgi odağı birey özellikleri ve davranışlarıdır. Bu nedenle bu alanlarda yapılan gözlemlerde gözlem birimleri genellikle bireylerden oluşmaktadır.
1.5. EVREN - ÖRNEKLEM
Evren (population), gözlenmesi amaçlanan belli bir özelliğe sahip gözlem birimlerinin tamamını içeren en geniş gözlem kümesi olarak tanımlanır. Evren, 'ana kitle', 'ana kütle' ya da 'popülasyon' olarak da ifade edilebilmektedir. Örneklem (sample), belli bir özelliğin üzerinde gözlendiği ve evrenin bir alt kümesi olan gözlem birimleri kümesidir. Tanımlanmış bir evrenden bir örneklem belirleme işlemelerini içeren yöntem ve tekniklere 'örnekleme (sampling)' denir. Tanımdan da anlaşılacağı üzere, örneklem büyüklüğü yani örnekleme dahil olan gözlem birimleri sayısı, evrenden küçüktür. Ayrıca bir evrenin içerisinde birden çok sayıda alt küme bulunabileceği için birden çok sayıda da örneklem belirlenebilir. Örneğin Ankara Üniversitesi öğrencilerinin akademik başarı düzeylerinin gözlenmek istendiğini düşünelim. Bu durumda Ankara Üniversitesinde öğrenim görmekte olan tüm öğrenciler, evreni oluşturacaktır. Tüm öğrenciler ulaşmak, tüm öğrencilerin bilgilerini almak ve bu veriler üzerinde istatistiksel işlemler yapmak çoğunlukla ciddi zaman ve emek maliyeti getirecektir. Bu durumda Ankara Üniversitesinde öğrenim gören faka Ankara Üniversitesini 'temsil edebilir (representative)' nitelikte daha küçük bir grup üzerinde gözlem yapılıp, bu daha küçük gruptan elde edilen bulgular, istatistiksel yöntemlerle ve belli bir olasılıkla evrene yani Ankara Üniversitesine genellenebilir. İşte bu daha küçük grup, örneklem olarak tanımlanır. Bir örneklemden elde edilen kestirimler, belli bir olasılıkla evrene genellenebilir. Bu tür bir genellemenin yapılabilmesi için gerekli ön koşul örneklemin evreni temsil edebilir olmasıdır. Temsil edebilir olma, gözlenmesi amaçlanan özelliğin evrendeki çeşitliliği ile örneklemdeki çeşitliliğinin birbirine yakın olmasını gerektirir. Örneğin yukarıda verilen Ankara Üniversitesi örneğinde örneklem Eğitim Bilimleri Fakültesi öğrencileri arasından belli sayıda öğrenciden oluşursa, bu örneklemin temsil edebilirliğinin düşük olacağı söylenebilir. Temsil edebilirliği yüksek olan bir örneklemde, her fakülte, bölüm ve programdan, her sınıf düzeyinden, evrendeki ağırlıklarına paralel olarak belli sayılarda öğrenci bulunması beklenir. Ayrıca cinsiyet, sosyoekonomik düzey gibi ilişkili olabilecek bazı değişkenler düzeyinde de evren ve örneklem dağılımının birbirine yakın olmasına özen göstermek gerekir.
1.6. HOMOJENLİK - HETEROJENLİK
Gözlenen bir özellik açısından birbirine yakın ya da benzer gözlem birimlerinden oluşan gruplara 'homojen grup' denir. Aksi durumda gözlenen özellik açısından birbirinden farklı gözlem birimlerinden oluşan gruplara 'heterojen grup' denir. 'Tam homojen grup' denildiğinde, her bir grup üyelerinin her birinin aynı özellikte olduğunu, 'tam heterojen grup' ise grup üyelerinin her birinin farklı özellikte olduğunu ifade eder. Örneğin, "akademik başarı açısından A şubesi B şubesinden daha homojendir" denildiğinde, ilgilenilen özelliğin akademik başarı olduğu, A şubesindeki öğrencilerin akademik başarı ortalamalarının ya da notlarının B şubesine göre birbirine daha yakın olduğu anlaşılır.
1.7. PARAMETRE - İSTATİSTİK Alana özel kullanımıyla parametre, evrenden doğrudan elde edilen sayısal değerler ya da kestirimlerdir. 'Evren değer' olarak da ifade edilir. İstatistik ise örneklemden elde edilen sayısal değerler ya da kestirimlerdir. 'Örneklem değer' olarak da ifade edilir. Bu tanımlamalara göre istatistiklerle parametrelerin olasılıklı olarak örtüşme düzeylerinin test edilmesinde kullanılan yöntem ve teknikler de istatistiksel yöntem ve teknikler olarak tanımlanabilmektedir. Evren değer yani parametreler ile örnekle değer yani istatistikler, farklı sembollerle gösterilebilmektedir.
1.8. DEĞİŞKEN - SABİT
Durumdan duruma, konumdan konuma, bireyden birime, zamandan zamana, bağlamdan bağlama değişmeyen özelliklere 'sabit (constant) özellik', diğer tarafta değişen ya da farklılaşan özelliklere ise 'değişken (variable) özellik' denir. 5 Örneğin cinsiyet, yaş, ağırlık, eğitim düzeyi, aylık gelir, okula devam ya da devamsızlık süresi gibi özellikler bireyden bireye farklılık gösterebilen bir özelliklerdir. Bu ve benzeri özellikler, amaçlanan bir gözlemde değişkenler olarak tanımlanır.
1.9. DEĞİŞKEN TÜRLERİ
Değişkenler farklı şekillerde sınıflandırılabilmektedir.
1.9.1. Nitel Değişken - Nicel Değişken Bazı değişkenler, sembollerle ya da sözcüklerle ifade edilir. Bazı değişkenler ise sayılarla ifade edilir. Sözcük ya da sembollerle ifade edilen değişkenlere 'nitel (qualitative)', sayılarla ifade edilen değişkenler ise 'nicel (quantitative)' değişken olarak adlandırılır. Örneğin cinsiyet, kadın ve erkek olarak değerler alabilen iki kategorili ve nitel bir değişkendir. Bir başka örnek olarak eğitim düzeyi, okuryazar değil, okuryazar, ilkokul mezunu, ortaokul mezunu gibi değerler alabilen çok kategorili ve nitel bir değişkendir. Yaş, ağırlık, öğrenme başarısı, akademik aşarı, sıcaklık, aylık gelir gibi değişkenler ise sayılarla ifade edilir ve bunlar nicel değişkenlerdir.
1.9.2. Sürekli Değişken - Süreksiz/Kesikli Değişken Matematiksel bir kavram olarak süreklilik, herhangi iki sayının ortasında her zaman bir üçüncü sayının bulunması durumunu ifade etmektedir. Örneğin doğal sayılar ve tamsayılar kümeleri, sürekli sayılar değildir. Rasyonel sayılar kümesi ise süreklidir. Cinsiyet, eğitim düzeyi, doğum yeri, kan grubu, şube gibi değişkenler kesikli, yaş, ağırlık, akademik başarı, öğrenme başarısı, tutum gibi değişkenler süreklidir. Genellikle nitel değişkenler kesikli, nicel değişkenler ise sürekli değişkenlerdir.
1.9.3. Bağımlı Değişken - Bağımsız Değişken
Herhangi bir değişken, tek başına bağımlı ya da bağımsız olarak sınıflandırılamaz. Bu sınıflamanın yapılabilmesi için en az iki değişken ve bu değişkenler arasında tanımlı bir ilişki bulunmalıdır. İki değişkenden biri diğer değişkenle ilişkilendirildiğinde, ilişkinin yönüne göre, bağımlı-bağımsız sınıflaması yapılabilir. 6 İlişkili iki değişkenden biri diğeri aracılığı ile (yani diğerine bağlı olarak) betimlenecek ya da açıklanacak ise açıklanan temel değişken 'bağımlı değişken (dependent variable)', bu değişkenle ilişkilendirilen diğer değişken ise 'bağımsız değişken (independent variable)' olarak adlandırılır. Örneğin, "bir sınıftaki öğrencilerin yazılı notlarının dağılımı" dikkate alındığında, sadece bir tane değişken vardır: Yazılı notları (ya da kısaca not). Bu notların 0 ile 100 arasında verildiğini düşünürsek, öğrenci başarısını ya da öğrenme başarısını temsil eden bir değişken olarak 'not' değişkeni, nicel, sürekli ve eşit aralıklı ölçek düzeyinde bir değişkendir. "Bir sınıftaki öğrencilerin notlarının cinsiyetlerine göre dağılımı" dikkate alındığında ise iki değişken söz konusudur: (1) Not ve (2) cinsiyet. Notların kendi çerisinde dağılımının değil öğrencilerin cinsiyetlerine göre dağılımı betimlenecektir. Yani söz konusu iki değişken birbiri ile ilişkilendirilmektedir. Bu durumda ilgilenilen esas değişken olarak 'not' değişkeni bağımlı değişken, notların ilişkilendirildiği cinsiyet değişkeni ise bağımsız değişken olarak sınıflandırılır.
1.10. ÖLÇEK VE ÖLÇEKLEME
Özel kullanımıyla ölçek, genellikle tutum, ilgi, kişilik gibi duyuşsal özelliklerin gözlenmesinde ya da ölçülmesinde kullanılan özel bir veri toplama aracıdır. Diğer bir tanımlamayla ölçek, belli birimlerle birimlendirilmiş ve yapılandırılmış bir ölçme aracıdır. Bu özel kullanımının yanı sıra bir değişkenin alabileceği olası değerlere de ölçek denilmektedir. Bir değişkenin sayı ya da sembol olarak alabileceği değerler, bir ölçek üzerinde ifade edilmektedir. Bu değerlerin yani bir değişkenin alabileceği değerlerin belirlenmesi, değişkenin seçeneklerinin belirlenmesi işlemlerine de 'ölçekleme' denilmektedir. Bir değişkenin farklı şekillerde ölçeklenmesi mümkündür. Ölçekleme, toplanacak verinin niteliğini de etkilemektedir. Örneğin bir değişken olarak yaş değişkenini dikkate alalım. Bireylerin yaşları hakkındaki bilgileri farklı şekillerde almak mümkündür. Örneğin "Yaşınız:...." şeklinde sorulan açık uçlu bir soruya, 24, 25, 34, 38 gibi verilen yanıtlarla yaş değişkenine yönelik veriler sürekli ve nicel olarak toplanabilir. Aynı değişkene yönelik veriler "Yaşınız: ( ) 20 ve altında, ( ) 21-25 arası, ( ) 26-30 arası, ( ) 31 ve üzeri" şeklinde sorulan bir soru ile de toplanabilir. Bu durumda elde edilen veriler, ilk duruma göre daha sınırlı olacaktır.
1.11. ÖLÇEK TÜRLERİ Dört tür ölçek düzeyi söz konusudur:
1. Sınıflama Ölçeği (Nominal scale)
2. Sıralama Ölçeği (Ordinal scale)
3. Eşit Aralıklı Ölçek (Interval scale)
4. Eşit Oranlı Ölçek (Ratio scale)
Bu ölçek türleri, en az bilgi sağlayan ölçek türünden en çok bilgi sağlayan ölçek türüne doğru sıralı olarak verilmiştir. Aynı şekilde aralarında kapsama ilişkisi de vardır. Yani bir üst dzey, alt düzeyleri kapsamaktadır. Sınıflama ölçeği düzeyindeki bir değişken, sadece grup ya da gruba aidiyet hakkında bilgi verir. Örneğin kan grubu, doğum yeri, cinsiyet, şube, medeni durum gibi değişkenler sınıflama ölçeği düzeyinde değişkenlerdir. Sıralama ölçeği düzeyindeki değişkenler, gruba aidiyet bilgisi yanı sıra kategoriler arasında bir sıra ilişkisi de gösterir. Örneğin anne eğitim düzeyi, sıralama ölçeğinde bir değişkendir. Örneğin lise mezunu olman bir anne, ortaokul mezunu olan bir anneden daha yüksek bir eğitim düzeyine sahiptir. Eşit aralıklı ölçek düzeyindeki bir değişkende değişkenin alabileceği ardışık değerler arasında eşit mesafe vardır. Yani bu değişkenin değerlerinin yer aldığı ölçek, eşit aralıklıdır. Örneğin öğrenme başarısının bir göstergesi olarak 'not' şeklinde tanımlanan değişken, 0 ile 100 arasındaki notlardan oluşuyorsa bu değişken eşit aralık ölçeğindedir. Yani 1 notu ile 2 notu, 2 notu ile 3 notu ve benzeri arasındaki mesafeler birbirine eşittir. Eşit aralıklı ölçek düzeyindeki bir değişkende 'izafi/göreli/yapay sıfır' ya da 'izafi başlangıç noktası' tanımlıdır. Bu nokta mutlak yokluğu ifade etmez. Örneğin notu 0 olan bir öğrencinin öğrenemediği dolayısıyla öğrenme başarısı bulunmadığı söylenemez. Belki yapılan ölçmenin sınırlılığında öğrenme başarısı gözlenememiştir denilebilir. Hava sıcaklığı da benzer şekilde eşit aralıklı ölçek düzeyinde bir değişkendir. 8 Eşit oranlı ölçekte düzeyindeki bir değişkende de ölçekleme, eşit aralıklıdır. Fakat eşit aralık ölçeğinden farkı, 'gerçek/mutlak sıfır' noktasına sahip olmasıdır. Örneğin ağırlık, eşit oranlı ölçek düzeyinde bir değişkendir. 0kg, ağırlığın olmadığını yani mutlak yokluğu ifade eder. Ölçek türleri, bir değişkenin değerleri üzerinde yapılabilecek işlemlerin belirlenmesinde yardımcı olur. Sınıflama ölçeği düzeyindeki değişkenlerde basit sayma ve sınıflama işlemleri yapılabilir. Sıralama ölçeği düzeyindeki değişkenlerde sayma ve sınıflama işlemlerinin yanı sıra medyan, sıra farkları ve korelasyon hesaplamaları yapılabilir. Eşit aralıklı ölçek düzeyindeki değişkenlerde, toplam ve farka dayalı istatistiksel hesaplamaların tamamı kullanılabilir. Eşit oranlı ölçek düzeyinde ise çarpma ve bölme işlemleri dahil tüm işlemleri içeren istatistiksel hesaplamalar kullanılabilir.
1.12. BİRİM
Bir değişkenin alabileceği değerler, bir birim değer ile ifade edilir. Öreğin 3cm denildiğinde santimetre, birim değer olarak 1cm uzunluğu tanımlamaktadır. Buna göre bir değişkenin ölçeklendiği birim değer 'birim' olarak ifade edilir. Birimler, 'doğal birim' ve 'yapay birim' olarak ikiye ayrılır. Metre (m), gram (gr), saniye (sn) gibi birimler, sonradan tanımlanmış birimler olarak yapay birimlerdir. 3 kişi, beş öğrenci, 6 kitap, 8 oda gibi değerlerde kullanılan kişi, öğrenci, kitap, oda, adet gibi birimler ise doğal birimlerdir.
1.13. ÖLÇME - DEĞERLENDİRME
Ölçme ve değerlendirme birbirini tamamlayan ardışık iki süreçtir. Ölçme, bir özelliğe yönelik gözlemlerin yapılması ve bu gözlemlerin sayı ve sembollerle ifade edilmesidir. Bir başka yaklaşımla ölçme, gözlemler kümesi ile sayı ve semboller kümesi arasındaki bir eşleştirme ve bir fonksiyondur. Değerlendirme, ölçme sonuçlarını, bir ölçüte ya da ölçütler takımına göre yorumlama ve anlamlandırma sürecidir. Ölçme sonuçları tek başlarına çok bilgi vermez ve bir anlam ifade etmez. Bir takım ölçütlerle birlikte anlam kazanabilir. Örneğin, yabancı dil yeterliğinin ölçüldüğü bir sınavdan 400 puan aldığınızı düşününüz. Bu puan sizin için ne ifade eder? Bu bilginin yanı sıra "puanlama, 0 ile 500 puan arasında yapılmıştır" bilgisi verilse, 400 puanın anlamlandırılması daha kolay hale gelir. Bir başka bilgi olarak "kesme puanı 300'dür" bilgisi verilse, sonrasında "sınava katılanların puan ortalaması 385'tir" bilgisi verilse. Ancak bu ve benzeri bilgiler, birer ölçüt olarak dikkate alındığında, 400 puanın yorumlanması ve anlamlandırılması mümkün olmaktadır.
MERKEZİ EĞİLİM ÖLÇÜLERİ
Merkezi eğilim ölçüleri, 'merkeze yığılma ölçüleri' olarak da ifade edilebilmektedir. Aritmetik ortalama, mod, medyan, yüzdelik gibi nokta değerler, merkezi eğilim ölçüleridir. Diğer bir deyişle bu ölçüler, tek bir nokta belirtir. Bu nokta değerler verilerin yığılma noktaları olarak ilgilenilen özelliğe dönük betimlemelerin yapılmasında dikkate alınabilir.
Merkezi dağılım ölçüleri, 'merkezden yayılma ölçüleri' olarak da ifade edilebilmektedir. Standart sapma, varyans, ranj, çeyrek sapma gibi değerler, merkezden dağılma ölçüleridir. Bu ölçüler, merkez ya da ölçüt olarak belirlenen noktalara göre verilerin yayılması, çeşitlenmesi ya da farklılaşması hakkında bilgi verir.
Veri setinin karakteristiğine ve verilerin dağılımına göre uygun betimsel istatistiklerin kestirilmesi gerekir. Her betimsel istatistik her veri setinde anlamlı olmayabilir. Bu nedenle her bir betimsel istatistiğin hesaplanmasının yanı sıra hangi durumlarda kullanılabilir olduğunun da bilinmesi önemlidir. Aksi durumda elde edilen sayılar, yanıltıcı olabilir, yanlış ya da eksik yorumların yapılmasına yol açabilir.
Betimsel istatistikler tek başına, ilgilenilen özellik hakkında fazlaca bilgi sağlamaz. Birden fazla betimsel istatistik bir arada değerlendirilerek ya da birden fazla gruba/örnekleme yönelik betimsel istatistikler bir arada değerlendirilerek anlamlı betimsel yorumlar yapmak mümkündür. Bu bölümde betimsel istatistiklerden merkezi eğilim ölçüleri grubunda yer alan 4 istatistik hakkında bilgi verilmektedir.
1. ARİTMETİK ORTALAMA
Aritmetik ortalama (mean); her bir gözleme yönelik ölçme sonuçlarının toplamının gözlem sayısına bölünmesi ile elde edilen bir nokta değerdir. Aynı şekilde hesaplanmakla birlikte evren ortalaması ve örneklem ortalaması farklı sembollerle formülleştirilmektedir. Evrenden elde edilen veriler üzerinde hesaplama yapılıyorsa, ortalama 'evren ortalaması (population mean)' olarak isimlendirilir. Örneklemden elde edilen veriler üzerinde hesaplama yapılıyorsa ortalama, 'örneklem ortalaması (sample mean)' olarak isimlendirilir.
Ortalama, normal dağılım gösteren ve en az eşit aralıklı ölçek düzeyinde olan sürekli verilerde, en 'sağlam' merkezi eğilim ölçüsü olarak bilinir. Bu varsayımları sağlayan verilerde ortalama, verilerin tamamını temsil eden bir sayısal değer olarak dikkate alınabilir. Dikkat edilmesi gereken noktalardan biri, ortalama kestiriminin sürekli yani en az eşit aralıklı ölçek düzeyindeki değişkenler için anlamlı olduğudur. Cinsiyet, eğitim düzeyi, sınıf, şube, doğum yeri gibi kesikli verilerde ortalama, anlamlı bir istatistik değildir. Örneğin cinsiyet değişkeni için kız 1, erkek 2 olarak kodlanıp ortalama 1,63 olarak hesaplansa, bu sayıya karşılık gelen bir cinsiyet kategorisi bulunmadığı için bu sayı da anlamlı olmayacaktır.
Diğer bir önemli nokta ortalamanın, normal dağılım gösteren verilerde daha 'sağlam' bilgi vermesidir. Düşük ya da yüksek değerlere doğru yığılma gösteren yani çarpık dağılımlarda ortalama, yanıltıcı olabilmekte, yanlış ya da eksik yorumların yapılmasına yol açabilmektedir. Ortalama, uç noktalardan aşırı etkilenen bir istatistiktir. Uç nokta, grubun ya da örneklemin genelinden manidar düzeyde ayrışan ölçme sonuçlarını ifade etmektedir. Örneğin bir yazılı yoklamada 2 öğrenci 40'ın altında diğer öğrenciler ise 50'nin üzerinde notlar almışsa, 40'ın altındaki bu notlar uç nokta oluşturur ve sınıf ortalamasını aşağıya çeker. Normal dağılım gösteren veriler, uç noktalardan, manidar düzeyde etkilenmez. Bu nedenle ortalamanın kullanılmasında verilerin dağılımına dikkat edilmesi gerekir.
2. MEDYAN (ORTANCA)
Medyan (median); küçükten büyüğe doğru sıralanmış verilerin tam ortasında kalan değerdir. Medyan, sıralanmış verileri %50 %50 olarak ikiye bölen noktadır ve grubun yarısı hakkında bilgi verir. Medyan, sıralama işlemine dayalı olduğu için en az sıralama ölçeği düzeyindeki değişkenlerde anlamlı bir betimsel istatistiktir. Cinsiyet, şube, doğum yeri, okul türü gibi sınıflama ölçeği düzeyindeki 32 kategorik değişkenlerde medyan anlamlı değildir. Bu tür değişkenlerde kategoriler arasında bir sıra ilişkisi bulunmamaktadır. Sürekli verilerde ortalama, medyana göre daha 'sağlam' bir istatistiktir. Bununla birlikte değişkene yönelik verilerin dağılımı normal dağılımdan sapma gösterdiği ya da uç noktaların etkisinin olduğu durumlarda ortalama yanıltıcı olur. Bu durumda ortalama yerine medyanın dikkate alınması önerilir.
3. MOD (TEPE NOKTASI)
Mod, frekansı yani sıklığı en fazla olan değerdir. Sütun grafiği, histogram ya da çizgi grafiği gibi grafiklerde, dağılımın maksimum noktasını ifade eden frekans değeri, mod olarak belirlenir. Mod, sınıflama ölçeği düzeyindeki değişkenlerde dahil olmak üzere her tür değişkende anlamlı bir betimsel istatistiktir.
Bir veri setinde görülme sıklığı en yüksek olan bir tane değer bulunabileceği gibi birden fazla değer için de görülme sıklığı eşit ve en yüksek olabilir. Mod olarak tek bir değerin belirlenebildiği değişkenlere 'tek modlu değişken' denir ve bu değişkenin değerlerinin dağılımı tek tepeli bir dağılım gösterir. Birden fazla mod değeri olan değişkenlere ise 'çok modlu değişken' denir ve bu değişkenlerin gözlenen değerlerinin dağılımı çok tepeli dağılım gösterir. Örnek olarak aşağıda iki farklı dağılım eğrisi gösterilmektedir.
4. YÜZDELİK VE ÇEYREK SAPMA
Yüzdelik; küçükten büyüğe doğru sıralanmış verilerin belli bir yüzdesini altında bırakan noktadaki gözlenen değerdir.
Çeyreklik (quartile) ise sıralanmış verilerin çeyrek yani %25'lik dilimlerinin başlangıç ve bitiş noktalarında yer alan değerleri ifade eder. Dolayısıyla çeyreklik değerler aynı zamanda yüzdelik değerlerle ifade edilebilir. Çeyreklik, 'Q' sembolü ile ifade edilir. Teorik olarak, sıralanmış bir veri setinde 4 çeyrek bölüm vardır. Dördüncü çeyreklik, verilerin %100'ünün yani tamamının bir üstündeki değeri ifade eder. Bu nedenle pratikte dördüncü çeyreklik kullanılmaz. Birinci çeyreklik Q1, ikinci çeyreklik Q2 üçüncü çeyreklik Q3 sembolleri ile gösterilir.
Yüzdelik ve çeyreklik, en az eşit aralıklı ölçek düzeyindeki değişkenlerde anlamlı bir istatistiktir. Cinsiyet, medeni durum, şube gibi sınıflama ölçeği düzeyindeki değişkenlerde bu istatistik anlamlı değildir. Eğitim düzeyi, sınıf gibi sıralama ölçeği düzeyindeki değişkenlerde ise yüzdelik ve çeyreklik yerine 'sıra farkları (rank)' kullanılmaktadır.
MERKEZDEN DAĞILMA ÖLÇÜLERİ
Merkezi dağılım ölçüleri, 'merkezden yayılma ölçüleri' olarak da ifade edilebilmektedir. Standart sapma, varyans, ranj, çeyrek sapma gibi değerler, merkezden dağılma ölçüleridir. Bu ölçüler, merkez ya da ölçüt olarak belirlenen noktalara göre verilerin yayılması, çeşitlenmesi ya da farklılaşması hakkında bilgi verir. Veri setinin karakteristiğine ve verilerin dağılımına göre uygun betimsel istatistiklerin kestirilmesi ve dikkate alınması gerekir. Her betimsel istatistik her veri setinde anlamlı olmayabilir. Bu nedenle her bir betimsel istatistiğin hesaplanmasının yanı sıra hangi durumlarda kullanılabilir olduğunun da bilinmesi önemlidir. Aksi durumda elde edilen sayılar, yanıltıcı olabilir, yanlış ya da eksik yorumların yapılmasına yol açabilir.
Betimsel istatistikler tek başına, ilgilenilen özellik hakkında fazlaca bilgi sağlamaz. Birden fazla betimsel istatistik bir arada değerlendirilerek ya da birden fazla gruba/örnekleme yönelik betimsel istatistikler bir arada değerlendirilerek anlamlı betimsel yorumlar yapmak mümkündür. Bu bölümde betimsel istatistiklerden merkezden dağılma ölçüleri grubunda yer alan 4 istatistik hakkında bilgi verilmektedir.
1. STANDART SAPMA
'Standart kayma' olarak da ifade edilen standart sapma (standard deviation); bir veri setinde her bir verinin ortalamadan uzaklıklarının standartlaştırılmış bir ölçüsüdür.
Standart sapma, ortalamaya bağlı olarak hesaplanan bir istatistiktir. Ortalamada olduğu gibi standart sapma da sürekli değişkenlerde ve özellikle normal dağılım gösteren değişkenlerde kullanışlıdır. Değişkenin sürekli yani en az eşit aralık ölçeğinde olduğu ve değişkenin gözlenen değerlerinin normal dağılım gösterdiği durumlarda standart sapma en 'sağlam' merkezden dağılma ölçüsü olarak bilinir. 39 Cinsiyet, eğitim düzeyi, doğum yeri, sınıf, şube, okul türü gibi kategorik değişkenlerde yani sınıflama ve sıralama ölçeği düzeyindeki değişkenlerde, ortalama anlamlı olmadığı gibi standart sapma da anlamlı değildir. Verilerin normal dağılımdan sapması ya da uç noktaların etkisinin söz konusu olduğu durumlarda, ortalamada olduğu gibi standart sapma da doğrudan yorumlanabilir değildir. Bu durumlarda standart sapma, yanıltıcı olabilir, eksik ve yanlış betimsel yorumlara yol açabilir.
VARYANS
Varyans, standart sapmanın karesidir. Standart sapma gibi varyans da verilerin ortalamadan uzaklaşma düzeyleri yani verilerin çeşitliliği hakkında bilgi verir.
Evren varyansı ve örneklem varyansı, farklı sembollerle gösterilmenin yanı sıra hesaplama formüller açısından da farklıdır: Evren Varyansı Örneklem Varyansı Standart sapma için yukarıda yapılan açıklama ve uyarılar aynen varyans için de geçerlidir. Yani varyans da sürekli ve normal dağılım gösteren değişkenlerde 'sağlam' bir kestirimdir. Bu varsayımları karşılamayan değişkenlerde varyans, ya anlamsızdır ya da yanıltıcı olabilir.
Varyansın hesaplanmasında takip edilmesi gereken işlem adımları, standart sapma için verilenlerle aynıdır. Sadece varyansı hesaplarken, standart sapma hesaplamasının son adımı olan karekök alma işlemi yapılmaz. Buna göre varyans kestiriminde takip edilecek işlem adımları şu şekildedir:
1. Ortalamanın hesaplanması
2. Her bir gözlem değerinden ortalamanın çıkarılması ve ortalamadan farkların bulunması.
3. Her bir ortalamadan farkın karesinin alınması.
4. Ortalamadan farkların karelerinin toplanması.
5. Elde edilen toplamın N ya da (n-1)'e bölünmesi.
RANJ
Ranj (range); ölçme sonuçlarını gösteren bir veri setindeki alt ve üst değerlerin yani maksimum ve minimum değerlerin farkıdır. Yani bir değişkene yönelik gözlenen değerlerin aralığıdır.
Ranj = Maksimum Gözlenen Değer - Minimum Gözlenen Değer
Ranj, sürekli yani en az eşit aralıklı ölçek düzeyindeki değişkenlerde anlamlı bir istatistiktir. Kesikli yani sınıflama ve sıralama ölçekleri düzeyindeki değişkenlerde anlamlı değildir. Sıralama ölçeği düzeyindeki değişkenlerde, değişkenin gözlenen değerlerinin alt ve üst sınırlarının farkını ifade eden ranj yerine 'sıra farkları (rank)' kullanılabilmektedir. Ranj, standart sapma ve varyans gibi verilerin çeşitliliği ve yayılması hakkında bilgi veren bir merkezden dağılma ölçüsüdür. Bir değişkenin gözlenen değerlerinin ranjının yanı sıra bu değerlerin alt ya da üst sınırı biliniyorsa diğer uç değer de hesaplanabilir. Örneğin, bir sınıfta öğrencilerin akademik başarı notlarının ranjı 40 ve bu sınıfta en yüksek akademik başarı notu 95 ise en düşük akademik başarı notunun 95 - 40 = 55 olduğu belirlenebilir.
ÇEYREK SAPMA
Çeyrek sapma (quartile deviation); birinci çeyreklik ile üçüncü çeyreklik değerlerinin farkının yarısı alınarak hesaplanan bir merkezi dağılım ölçüsüdür. Çeyrek sapma, 25. ve 75. yüzdeliklerin farkının yarısıdır.
Ortalama, standart sapma ve varyansın, özellikle uç noktalardan aşırı etkilendiği yukarıda açıklanmıştı. Çeyrek sapma ilk çeyreklik olan %25'lik düşük ölçme sonuçlarını ve son çeyreklik olan %25'lik yüksek ölçme sonuçlarını dışarıda bırakan bir istatistiktir. BU nedenle çeyrek sapma, uç noktalardan etkilenmez. Bu nedenle uç noktaların etkisinin manidar olduğu veri setlerinde çeyrek sapma daha 'iyi' ve 'yansız' bir kestiricidir.
DEMİR, E. (2017). İSTATİSTİK DERS NOTLARI.