📊 TEMEL İSTATİSTİK VE VERİ ANALİZİ
Hafta 10: Veri Biliminin Temelleri
🎯 Amaç: Bu derste istatistiğin temel kavramları, veri türleri, betimsel ve çıkarımsal istatistik yöntemleri ele alınacaktır.
📊 İstatistik Nedir? Neden Önemlidir?
Günümüz dünyasında, özellikle spor bilimleri gibi veri yoğun alanlarda, istatistiksel düşünme ve analiz becerileri vazgeçilmezdir. İstatistik, sadece sayılarla uğraşmak değil, bu sayılardan anlam çıkarmak ve bilinçli kararlar vermek demektir.
İstatistik, verileri toplama, düzenleme, özetleme, analiz etme, yorumlama ve sunma bilimidir. Sayısal bilgileri anlamlandırmak, belirsizlik altında kararlar vermek ve olgular arasındaki ilişkileri keşfetmek için yöntemler sunar.
-
1. Betimsel İstatistik (Descriptive Statistics):
Veri setinin ana özelliklerini (örn: ortalama, medyan, standart sapma, frekanslar) özetlemek ve tanımlamak için kullanılır. Amacı, verileri anlaşılır bir şekilde sunmaktır.
-
2. Çıkarımsal İstatistik (Inferential Statistics):
Örneklemden elde edilen verileri kullanarak, daha geniş bir evren hakkında çıkarımlar yapmak ve sonuçlar çıkarmak için kullanılır. Hipotez testleri ve güven aralıkları bu alana girer.
- Verileri Anlama: Büyük ve karmaşık veri setlerini özetleyerek ve görselleştirerek anlamayı kolaylaştırır.
- Kanıta Dayalı Karar Verme: Subjektif görüşler yerine, verilere dayalı objektif kararlar almayı sağlar (örn: hangi antrenman programı daha etkili?).
- Belirsizliği Yönetme: Örneklemden evrene genelleme yaparken belirsizliği ölçer ve yönetir.
- Bilimsel İlerleme: Hipotezleri test etme, teorileri geliştirme ve bilimsel bilgi birikimine katkıda bulunma aracıdır.
📊 Veri Türleri ve Ölçüm Düzeyleri
İstatistiksel analizlere başlamadan önce, elimizdeki verinin türünü ve hangi düzeyde ölçüldüğünü anlamak hayati öneme sahiptir. Bu ayrım, hangi istatistiksel testlerin uygun olduğunu belirler.
- Nicel (Quantitative) Veri: Sayısal olarak ifade edilebilen, ölçülebilen veya sayılabilen verilerdir. (Örn: Yaş, boy, kilo, sprint süresi, atılan gol sayısı).
- Nitel (Qualitative) Veri: Kategorileri veya nitelikleri ifade eden, sayısal olmayan verilerdir. (Örn: Cinsiyet, spor branşı, medeni durum, sakatlık türü).
Değişkenlerin ölçüldüğü hassasiyet ve bilgi düzeyine göre dört temel ölçüm düzeyi vardır:
- 1. Nominal (Sınıflayıcı) Düzey: Sadece kategorilere ayırır, sıralama veya büyüklük ilişkisi yoktur. (Örn: Cinsiyet, spor branşı).
- 2. Ordinal (Sıralayıcı) Düzey: Kategoriler arasında bir sıralama vardır, ancak aralıklar eşit değildir. (Örn: Lig sıralaması, Likert ölçeği).
- 3. Aralık (Interval) Düzey: Sayısal, eşit aralıklar var, ancak mutlak sıfır noktası yok. (Örn: Sıcaklık, IQ puanı).
- 4. Oran (Ratio) Düzey: Sayısal, eşit aralıklar var ve mutlak sıfır noktası var. (Örn: Boy, kilo, yaş, zaman).
Veri türü ve ölçüm düzeyi, hangi betimsel istatistiklerin (ortalama, medyan, mod) ve hangi çıkarımsal istatistiklerin (t-testi, ANOVA, korelasyon) kullanılabileceğini doğrudan belirler. Yanlış istatistiksel test seçimi, yanlış sonuçlara ve hatalı yorumlara yol açar.
📍 Betimsel İstatistikler: Merkezi Eğilim Ölçüleri
Betimsel istatistiklerin temel amaçlarından biri, büyük veri setlerini tek bir temsilci değerle özetlemektir. Merkezi eğilim ölçüleri, bu amaca hizmet eder.
Merkezi eğilim ölçüleri, bir veri setindeki değerlerin etrafında toplandığı merkezi noktayı gösteren istatistiklerdir. Veri setinin "ortalama" veya "tipik" değerini temsil ederler.
Bir veri setindeki tüm değerlerin toplamının, veri setindeki değer sayısına bölünmesiyle elde edilen aritmetik ortalamadır. En sık kullanılan merkezi eğilim ölçüsüdür.
- Kullanım: Aralık ve oran düzeyindeki veriler için uygundur.
- Hassasiyet: Veri setindeki tüm değerleri kullanır, bu nedenle aykırı değerlere (outliers) karşı hassastır.
- Formül: Σx / n (Tüm değerlerin toplamı / Değer sayısı)
Bir veri setindeki değerler küçükten büyüğe doğru sıralandığında tam ortada yer alan değerdir. Veri setindeki değer sayısı çift ise, ortadaki iki değerin ortalaması alınır.
- Kullanım: Ordinal, aralık ve oran düzeyindeki veriler için uygundur.
- Hassasiyet: Aykırı değerlere karşı hassas değildir, çünkü sadece sıralamadaki konumuna bakar.
Bir veri setinde en sık tekrar eden değerdir. Bir veri setinde birden fazla mod olabilir (bimodal, multimodal) veya hiç mod olmayabilir.
- Kullanım: Tüm veri türleri (nominal, ordinal, aralık, oran) için kullanılabilir. Nominal veriler için tek uygun merkezi eğilim ölçüsüdür.
📈 Betimsel İstatistikler: Yayılım Ölçüleri
Merkezi eğilim ölçüleri, bir veri setinin "tipik" değerini gösterirken, yayılım ölçüleri bu değerlerin ne kadar birbirine yakın veya uzak olduğunu, yani veri setinin değişkenliğini açıklar. Her iki ölçü türü de bir veri setini tam olarak anlamak için gereklidir.
Yayılım ölçüleri, bir veri setindeki değerlerin ne kadar yayıldığını veya dağıldığını gösteren istatistiklerdir. Veri setinin homojenliğini veya heterojenliğini anlamamızı sağlar.
Bir veri setindeki en yüksek değer ile en düşük değer arasındaki farktır. Hesaplaması kolaydır.
- Kullanım: Tüm veri türleri için kullanılabilir, ancak aykırı değerlere karşı çok hassastır.
- Örnek: Bir takımın maç başına attığı gol sayısı 0 ile 5 arasında değişiyorsa, ranj 5'tir.
Veri setinin %25'lik dilimi (Q1) ile %75'lik dilimi (Q3) arasındaki farktır. Verinin orta %50'lik kısmının yayılımını gösterir.
- Kullanım: Aykırı değerlere karşı ranjdan daha az hassastır, medyan ile birlikte kullanılır.
- Örnek: Bir maraton yarışında bitiş sürelerinin Q1'i 3 saat 30 dakika, Q3'ü 4 saat 15 dakika ise, IQR 45 dakikadır.
Bir veri setindeki her bir değerin ortalamadan ne kadar uzaklaştığının karelerinin ortalamasıdır. Veri setindeki tüm değerleri hesaba katar.
- Kullanım: Aralık ve oran düzeyindeki veriler için uygundur.
- Dezavantajı: Ölçü birimi, orijinal verinin karesi olduğu için yorumlaması zordur.
Varyansın kareköküdür. En sık kullanılan yayılım ölçüsüdür ve verinin orijinal ölçü birimiyle ifade edilir. Değerlerin ortalamadan tipik olarak ne kadar saptığını gösterir.
- Kullanım: Aralık ve oran düzeyindeki veriler için uygundur. Normal dağılım gösteren verilerde özellikle anlamlıdır.
📉 Verilerin Grafiklerle Gösterimi
Tablolar verileri düzenli bir şekilde sunarken, grafikler bu verileri görselleştirerek daha hızlı ve etkili bir şekilde anlamamızı sağlar. Doğru grafik seçimi, mesajın net bir şekilde iletilmesi için kritiktir.
- Görselleştirme: Veri setindeki örüntüleri, eğilimleri ve ilişkileri hızlıca görmeyi sağlar.
- Anlaşılırlık: Karmaşık verileri daha anlaşılır ve akılda kalıcı hale getirir.
- Etki: Bulguları daha etkili ve ikna edici bir şekilde sunar.
- Keşif: Verilerdeki aykırı değerleri veya beklenmedik örüntüleri keşfetmeye yardımcı olur.
-
1. Çubuk Grafikler (Bar Charts):
Kategorik (nominal veya ordinal) verilerin frekanslarını veya yüzdelerini göstermek için kullanılır. Çubuklar arasında boşluk bulunur.
Örnek: Spor branşlarına göre sporcu sayısı. -
2. Pasta Grafikler (Pie Charts):
Bir bütünün parçalarını (oranlarını) göstermek için kullanılır. Toplam %100 olmalıdır.
Örnek: Bir spor kulübünün bütçesinin farklı kalemlere dağılımı. -
3. Histogramlar:
Sürekli nicel verilerin dağılımını göstermek için kullanılır. Çubuklar bitişiktir ve her çubuk bir aralığı temsil eder.
Örnek: Sporcuların yaş dağılımı veya sprint sürelerinin dağılımı. -
4. Çizgi Grafikler (Line Graphs):
Zaman içindeki değişimleri veya iki sürekli değişken arasındaki ilişkiyi göstermek için kullanılır.
Örnek: Bir sporcunun sezon boyunca performansındaki (örn: VO₂max) değişim. -
5. Serpilme Diyagramları (Scatter Plots):
İki sürekli değişken arasındaki ilişkiyi (korelasyonu) göstermek için kullanılır. Her nokta bir gözlemi temsil eder.
Örnek: Antrenman hacmi ile sakatlık riski arasındaki ilişki. -
6. Kutu Grafikler (Box Plots):
Bir değişkenin dağılımını (medyan, çeyrekler, ranj, aykırı değerler) göstermek ve grupları karşılaştırmak için kullanılır.
Örnek: Farklı antrenman gruplarının dikey sıçrama yüksekliklerinin dağılımı.
📋 Normal Dağılım ve Özellikleri
Normal dağılım, spor bilimlerinde ve diğer bilimsel alanlarda çok sık karşılaşılan bir olasilık dağılımıdır. Birçok istatistiksel testin temel varsayımıdır.
- Simetrik: Ortalama etrafında simetrik şekilde dağılır
- Çan Eğrisi: Ortada yüksek, kenarlara doğru düşük
- Ortalama = Medyan = Mod: Hepsi aynı noktada
- 68-95-99.7 Kuralı: Verilerin %68'i ortalama±1SD, %95'i ortalama±2SD, %99.7'si ortalama±3SD arasında
- Antropometrik Ölçümler: Boy, kilo, vücut yağ oranları
- Performans Testleri: VO₂max, kas kuvveti, diranç
- Fizyolojik Parametreler: Kalp atım hızı, kan basinci
- Psikolojik Ölçekler: Motivasyon, kaygi, öz-güven puanları
- Merkezi Limit Teoremi: Büyük örneklemlerde ortalamalar normal dağılır
- İstatistiksel Testler: Birçok test normal dağılım varsayımı gerektirir
- Güven Aralıkları: Normal dağılım kullanılarak hesaplanır
- Standartlaştırma: Z-skorları ve standart normal dağılım
🔍 Çıkarımsal İstatistik Temelleri
Çıkarımsal istatistik, betimsel istatistiğin ötesine geçerek, sınırlı verilerden genel sonuçlar çıkarma imkanı sağlar.
- Evren (Population): Üzerinde çalışılan tüm birimler
- Örneklem (Sample): Evrenden seçilen alt küme
- Parametre: Evrenin özellikleri (μ, σ)
- İstatistik: Örneklemin özellikleri (χ̄, s)
Aynı evrenden alınan farklı örneklemler farklı ortalamalar verir. Bu ortalamaları dağılımına örnekleme dağılımı denir.
- Standart Hata: Örneklem istatistiğinin standart sapması
- Merkezi Limit Teoremi: n≥30 olduğunda örneklem ortalamaları normal dağılır
Bir parametrenin gerçek değerinin bulunma olasılığı yüksek olan aralık.
- %95 Güven Aralığı: En sık kullanılan
- Yorumlama: "100 örneklemden 95'inde gerçek parametre bu aralıkta yer alır"
- Spor Örneği: "Elit sporcuların ortalama VO₂max değeri %95 güvenle 55-65 ml/kg/dk arasındadır"
📝 Hipotez Testleri Giriş
Hipotez testleri, bilimsel araştırmanın kalbidir. Bir iddianın (hipotezin) verilerle desteklenip desteklenmediğini objektif olarak değerlendirmeyi sağlar.
- Null Hipotez (H₀): "Fark yoktur" veya "ilişki yoktur" iddiası
- Alternatif Hipotez (H₁/Hₐ): Araştırmacının kanıtlamak istediği iddia
Spor Bilimlerinden Örnek:
Araştırma Sorusu: "8 haftalık interval antrenman VO₂max'ı artırır mı?"
- H₀: Interval antrenman VO₂max'ı artırmaz (fark = 0)
- H₁: Interval antrenman VO₂max'ı artırır (fark > 0)
- Hipotezleri Kur: H₀ ve H₁'i net şekilde tanımla
- Anlamlılık Seviyesini Seç: Genellikle α = 0.05
- Test İstatistik Seç: t-test, ANOVA, Ki-kare vb.
- Veri Topla ve Hesapla: Test istatistiğini hesapla
- Karar Ver: H₀'ı reddet veya reddetme
- Yorumla: Sonuçları pratik bağlamda değerlendir
- Tip I Hata (α): Doğru H₀'ı yanlışlıkla reddetme
- Tip II Hata (β): Yanlış H₀'ı yanlışlıkla kabul etme
- İstatistiksel Güç (1-β): Doğru H₁'i doğru şekilde tespit etme olasılığı
🎯 P-Değeri ve İstatistiksel Anlamlılık
P-değeri, modern istatistiksel analizin en önemli kavramlarından biridir. Ancak sıkça yanlış anlaşılır ve yorumlanır.
P-değeri, H₀'nin doğru olduğunu varsayarak, gözlemlenen veri kadar veya daha aşırı sonuç elde etme olasılığıdır.
Daha Basit İfade:
"Eğer gerçekten hiçbir fark yoksa, bu kadar büyük (veya daha büyük) bir farkı görme şansımız ne kadar?"
- p < 0.05: "İstatistiksel olarak anlamlı" (geleneksel sınır)
- p < 0.01: "Yüksek anlamlılık"
- p < 0.001: "Çok yüksek anlamlılık"
- p ≥ 0.05: "İstatistiksel olarak anlamlı değil"
Yaygın Yanlış Yorumlar:
- ❌ "p=0.05, hipotezimin doğru olma şansı %95"
- ❌ "p=0.3, farkın pratikte önemsiz olduğu"
- ✅ "p=0.05, bu veri H₀ doğruyken %5 şansla görülür"
Örnek 1: Antrenman Etkisi
Sonuç: p = 0.03
Yorumlama: "Eğer gerçekten antrenmanın hiçbir etkisi yoksa, bu kadar büyük iyileşmeyi görme şansımız sadece %3'tür. Bu düşük olasılık nedeniyle, antrenmanın etkili olduğu sonuçuna varıyoruz."
Örnek 2: Cinsiyet Farkı
Sonuç: p = 0.12
Yorumlama: "Cinsiyetler arasında gerçek bir fark olmasa bile, gözlemlediğimiz farkı %12 şansla görebiliriz. Bu yeterince düşük değil, bu nedenle anlamlı bir fark olduğunu söyleyemeyiz."
🔗 Korelasyon Analizi
Korelasyon analizi, spor bilimlerinde iki değişken arasındaki ilişkiyi incelemek için sık kullanılan temel bir yöntemdir.
Pearson korelasyon katsayısı, iki sürekli değişken arasındaki doğrusal ilişkiyi ölçer:
- Aralık: -1 ≤ r ≤ +1
- r = +1: Mükemmel pozitif ilişki
- r = -1: Mükemmel negatif ilişki
- r = 0: Doğrusal ilişki yok
- 0.00 - 0.30: Zayıf ilişki
- 0.30 - 0.50: Orta ilişki
- 0.50 - 0.70: Güçlü ilişki
- 0.70 - 1.00: Çok güçlü ilişki
Önemli Not: Korelasyon, nedensellik anlamına gelmez!
Pozitif Korelasyonlar:
- Boy ve Kilo: r = +0.65 (güçlü pozitif)
- Antrenman Süresi ve VO₂max: r = +0.45 (orta pozitif)
- Kas Kütlesi ve Güç: r = +0.78 (çok güçlü pozitif)
Negatif Korelasyonlar:
- Yağ Oranı ve Sprint Hızı: r = -0.52 (güçlü negatif)
- Yaş ve Esneklik: r = -0.38 (orta negatif)
- Yorgunluk ve Reaksiyon Süresi: r = -0.41 (orta negatif)
- Nedensellik ≠ Korelasyon: "A ile B ilişkili" ≠ "A, B'ye neden olur"
- Doğrusal İlişki: Sadece doğrusal ilişkileri yakalıyor
- Aykırı Değerler: Korelasyonu çok etkileyebilir
- Örneklem Büyüklüğü: Küçük örneklemlerde güvenilmez olabilir
💻 SPSS ile Temel Analizler
SPSS (Statistical Package for the Social Sciences), spor bilimlerinde en yaygın kullanılan kullanıcı dostu istatistik yazılımlarından biridir. Menu tabanlı arayüzü sayesinde kod yazmadan karmaşık analizler yapılabilir.
📊 1. Betimsel İstatistikler (Descriptives)
Menu Yolu:
Analyze → Descriptive Statistics → Descriptives
Adım Adım:
- Değişkenleri seç ve sağdaki kutucuğa taşı
- "Options" butonuna tıkla
- İstediğin istatistikleri seç: Mean, Std. Deviation, Minimum, Maximum, Range
- "Continue" ve "OK"
Çıktı Tablosu Yorumlama:
| Sütun | Anlamı |
|---|---|
| N | Örneklem büyüklüğü (geçerli vaka sayısı) |
| Mean | Aritmetik ortalama |
| Std. Deviation | Standart sapma (varyasyonun ölçüsü) |
| Minimum / Maximum | En düşük ve en yüksek değer |
🏃 Spor Bilimlerinde Örnek
Araştırma: 50 elit basketbolcunun dikey sıçrama performansı
SPSS Çıktısı:
• N = 50
• Mean = 68.5 cm
• Std. Deviation = 8.2 cm
• Minimum = 52 cm, Maximum = 84 cm
Yorumlama: "Elit basketbolcuların ortalama dikey sıçraması 68.5±8.2 cm olup, 52 cm ile 84 cm arasında değişmektedir."
📏 2. Frekans Analizleri (Frequencies)
Menu Yolu:
Analyze → Descriptive Statistics → Frequencies
Ne Zaman Kullanılır?
- Kategorik veriler (cinsiyet, spor dalı, pozisyon)
- Likert ölçekleri (1-5 arası memnuniyet)
- Demografik bilgiler
Çıktı Sütunları:
- Frequency: Ham frekans (kaç kişi)
- Percent: Tüm verilere göre yüzde (eksik veriler dahil)
- Valid Percent: Geçerli verilere göre yüzde (eksik veriler hariç) → Raporlamada bunu kullan!
- Cumulative Percent: Biriken yüzde
💡 Pratik İpucu
Frekans tablosunu göstermek istemiyorsan ama merkezi eğilim istatistiklerini istiyorsan:
→ "Display frequency tables" kutucuğunun işaretini kaldır
→ "Statistics" butonuna tıklayarak istediğin istatistikleri seç (medyan, mod, vb.)
📐 3. Normallik Testi (Normality Tests)
Neden Önemli?
Birçok parametrik test (t-test, ANOVA) normal dağılım varsayımı gerektirir. Önce normalliği kontrol etmeliyiz!
Menu Yolu:
Analyze → Descriptive Statistics → Explore
→ Değişkeni seç → "Plots" butonuna tıkla → "Normality plots with tests" işaretle
Normallik Testleri:
- Shapiro-Wilk: n < 50 için tercih edilir (daha güçlü)
- Kolmogorov-Smirnov: n > 50 için kullanılır
Çıktı Yorumlama:
- p > 0.05: Normal dağılıyor → Parametrik test kullan (t-test, ANOVA)
- p < 0.05: Normal dağılmıyor → Non-parametrik test kullan (Mann-Whitney, Kruskal-Wallis)
⚠️ Dikkat!
Büyük örneklemlerde (n > 200) normallik testleri çok hassas olur, küçük sapmalar bile anlamlı çıkar.
→ Histogram ve Q-Q plotlarına da bakın!
→ Merkezi Limit Teoremi: n > 30 olduğunda parametrik testler genelde güvenlidir.
📊 4. Bağımsız Örneklem t-Testi (Independent Samples t-Test)
Ne Zaman Kullanılır?
İki bağımsız grubun ortalamalarını karşılaştırmak için (örn: Erkek vs Kadın sporcuların performansı)
Menu Yolu:
Analyze → Compare Means → Independent-Samples T Test
Adım Adım:
- Test Variable: Bağımlı değişkeni (örn: dikey sıçrama) seç
- Grouping Variable: Grup değişkenini (örn: cinsiyet) seç
- Define Groups: Grup kodlarını tanımla (örn: 1=Erkek, 2=Kadın)
- "OK" tıkla
Çıktı Yorumlama:
1. Levene's Test (Varyans Homojenliği):
- p > 0.05 → Varyanslar eşit → "Equal variances assumed" satırına bak
- p < 0.05 → Varyanslar eşit değil → "Equal variances not assumed" satırına bak
2. t-Test Sonucu:
- Sig. (2-tailed) > 0.05: Gruplar arasında anlamlı fark YOK
- Sig. (2-tailed) < 0.05: Gruplar arasında anlamlı fark VAR
🏃 Spor Örneği
Araştırma: Erkek ve kadın voleybolcuların dikey sıçrama yüksekliği
SPSS Çıktısı:
• Levene's Test: p = 0.342 (varyanslar eşit)
• t = 3.45, df = 48, p = 0.001
• Mean difference = 8.5 cm
Yorumlama: "Erkek voleybolcuların dikey sıçrama ortalaması (M=62.5 cm), kadın voleybolculardan (M=54.0 cm) anlamlı derecede yüksektir, t(48)=3.45, p=0.001."
- Veri Girişi: Her satır bir vaka (sporcu), her sütun bir değişken olmalı
- Değişken İsimleri: Kısa, boşluksuz, Türkçe karakter kullanma (ornek: "yasgrubu" değil "yas_grubu")
- Kaydetme: Hem veri dosyasını (.sav) hem output dosyasını (.spv) kaydet
- Syntax: Tekrarlanan analizler için syntax penceresi kullan (Paste butonu)
- Tablolar: Output tablolarını Word/Excel'e sağ tıklayıp "Copy" ile kopyala
- Grafikler: Graphs menüsünden Chart Builder kullan
⚠️ İstatistiksel Hata Türleri ve Önleme
İstatistiksel analizlerde doğru sonuçlar elde etmek, sadece doğru teknikleri bilmekle kalmaz, aynı zamanda yaygın hatalardan kaçınmayı da gerektirir. American Statistical Association (2019) ve Wasserstein & Lazar (2016) p-değeri yanlış kullanımının bilimde yaygın olduğunu vurgulamıştır.
🎲 Tip I ve Tip II Hatalar
| Hata Türü | Tanım | Spor Örneği |
|---|---|---|
| Tip I Hata (α) Yanlış Pozitif |
H₀ doğruyken reddetme (Gerçekte fark yokken fark var demek) |
Kreatin etkisiz olmasına rağmen "performansı artırıyor" demek |
| Tip II Hata (β) Yanlış Negatif |
H₀ yanlışken kabul etme (Gerçekte fark varken fark yok demek) |
Pliometrik antrenman etkili olmasına rağmen "etkisiz" demek |
Alpha (α) ve Power (1-β):
- α (Anlamlılık düzeyi): Genelde 0.05 (Tip I hata yapma olasılığı %5)
- β (Tip II hata olasılığı): Genelde 0.20 kabul edilir
- Power (Güç) = 1 - β: Genelde 0.80 hedeflenir (gerçek etkiyi tespit etme olasılığı %80)
⚖️ Tip I vs Tip II Hata Dengesi
Sorun: α'yı düşürürsen (örn: 0.01) Tip I hata azalır AMA β artar (Tip II hata artar)
Çözüm: Örneklem büyüklüğünü artır → Hem Tip I hem Tip II hata azalır
G*Power yazılımı: Uygun örneklem büyüklüğünü hesaplamak için kullan
🎣 P-Hacking ve Questionable Research Practices (QRPs)
P-Hacking Nedir?
Anlamlı (p < 0.05) sonuç elde etmek için verileri ve analizleri manipüle etme. John et al. (2012) araştırmacıların %63'ünün en az bir QRP yaptığını buldu.
Yaygın P-Hacking Taktikleri:
- Seçici Raporlama (Cherry Picking): Sadece anlamlı sonuçları raporlama, anlamlı olmayanları saklama
- Aykırı Değer Manipülasyonu: p > 0.05 olunca "outlier var mı" diye bakıp çıkarma
- Değişken Transformasyonu: Farklı transformasyonlar deneyip anlamlı olan birini seçme
- Optional Stopping: Veri toplarken p-değerine bakıp, p < 0.05 olunca durmak
- HARKing: Hypothesizing After Results are Known - Sonuçları gördükten sonra hipotez kurmak
- Çoklu Test: Çok sayıda test yapıp sadece anlamlı olanları raporlama
❌ P-Hacking Örneği (YANLIŞ)
Senaryo: Yeni bir antrenman programının etkisini test ediyorsun.
1. Önce bağımsız t-test → p = 0.08 (anlamlı değil)
2. Aykırı değer var mı bak, 2 veriyi çıkar → p = 0.06 (hala değil)
3. Mann-Whitney U test dene → p = 0.049 (işte bu!) ✓
4. Sadece Mann-Whitney sonucunu raporla
Sonuç: Yanlış pozitif! Gerçekte etkisiz olmasına rağmen etkili gösterdin.
✅ Doğru Yaklaşım (Ön-Kayıt & Şeffaflık)
- Pre-registration: Veri toplamadan önce hipotez, yöntem ve analiz planını kaydet (OSF.io, AsPredicted.org)
- Tüm analizleri raporla: Anlamlı olmayanlar dahil
- Aykırı değer kararını önceden belirle: "±3 SD dışındaki değerler çıkarılacak" gibi
- Bonferroni düzeltmesi: Çoklu test yapacaksan α'yı test sayısına böl (α_düzeltilmiş = 0.05/k)
- Açık Bilim: Verilerini ve kodunu paylaş (Open Science Framework)
🔍 Veri Kalitesi Sorunları
1. Eksik Veri (Missing Data)
| Tip | Açıklama | Çözüm |
|---|---|---|
| MCAR (Tamamen Rastgele) |
Eksiklik hiçbir değişkenle ilişkili değil | Listwise deletion, Mean imputation |
| MAR (Rastgele) |
Eksiklik gözlenen değişkenlerle ilişkili | Multiple Imputation, FIML |
| MNAR (Rastgele Olmayan) |
Eksiklik eksik olan değişkenin kendisiyle ilişkili | En zor! Pattern-mixture models, Sensitivity analysis |
SPSS'te Eksik Veri: Analyze → Missing Value Analysis → Little's MCAR test
2. Aykırı Değerler (Outliers)
Tespit Yöntemleri:
- Z-Skoru: |Z| > 3 → univariate outlier
- IQR Yöntemi: Q1 - 1.5×IQR veya Q3 + 1.5×IQR dışında kalanlar
- Mahalanobis Distance: Multivariate outlier tespiti (χ² dağılımı p < 0.001)
- Boxplot: Görsel tespit
Ne Yapmalı?
- Önce neden olduğunu anla: Veri giriş hatası mı? Gerçek bir değer mi?
- Veri hatası ise: Düzelt veya eksik veri olarak işaretle
- Gerçek değer ise:
- Çıkarma (justification gerekli)
- Transformation (log, sqrt)
- Robust yöntemler kullan (Median, Trimmed Mean)
- Winsorization (uç değerleri kırp)
3. Örneklem Büyüklüğü Sorunları
- Çok Küçük: Düşük power → Tip II hata riski yüksek
- Çok Büyük: Küçük etkiler bile "anlamlı" çıkar → Pratik anlamlılık yok
- Çözüm: A priori power analizi yap (G*Power: medium effect için genelde n ≈ 60-80)
- ✓ Araştırma sorusu ve hipotezleri önceden net tanımla
- ✓ Power analizi yap, yeterli örneklem topla
- ✓ Analiz planını önceden belirle (pre-registration)
- ✓ Varsayımları kontrol et (normallik, homojenlik, vb.)
- ✓ Etki büyüklüğü (effect size) hesapla ve raporla (Cohen's d, η², r)
- ✓ Güven aralıklarını ver (sadece p-değeri değil!)
- ✓ Tüm analizleri raporla (anlamlı olmayanlar dahil)
- ✓ Sınırlılıkları şeffaf şekilde belirt
- ✓ Verilerini ve analiz kodunu paylaş (Open Data)
- ✓ p = 0.051'i "marginally significant" diye raporlama!
📚 Önerilen Kaynaklar
- Wasserstein & Lazar (2016). The ASA Statement on p-Values. The American Statistician, 70(2), 129-133.
- Cumming (2014). The New Statistics: Why and How. Psychological Science, 25(1), 7-29.
- Simmons et al. (2011). False-Positive Psychology. Psychological Science, 22(11), 1359-1366.
- Open Science Collaboration (2015). Estimating the Reproducibility of Psychological Science. Science, 349(6251).