📈 İLERİ İSTATİSTİK VE ARAŞTIRMA RAPORU

Hafta 11: Çıkarımsal İstatistik ve Hipotez Testleri

Ankara Yıldırım Beyazıt Üniversitesi
Spor Bilimleri Fakültesi
Antrenörlük Eğitimi Bölümü
Doç. Dr. İzzet İNCE
Akademik Yıl: 2025 - 2026

🎯 Amaç: Bu derste çıkarımsal istatistik mantığı, hipotez testleri, gruplar arası fark ve ilişki testleri incelenecektir.

🧠 Çıkarımsal İstatistik Mantığı

🎯 Ana Konu: Örneklem verilerinden yola çıkarak daha geniş bir evren hakkında sonuçlar çıkarmayı amaçlayan istatistiksel yaklaşım.

Betimsel istatistikler verileri özetlerken, çıkarımsal istatistikler bu özetlenmiş verilerden yola çıkarak daha büyük bir resim hakkında sonuçlar çıkarmamızı sağlar. Bu, bilimsel araştırmanın temel hedeflerinden biridir.

🔍Çıkarımsal İstatistik Nedir?

Çıkarımsal istatistik, bir örneklemden elde edilen verileri kullanarak, bu örneklemin alındığı daha geniş evren hakkında çıkarımlar yapmak, hipotezleri test etmek ve tahminlerde bulunmak için kullanılan istatistik dalıdır.

🔄Örneklemden Evrene Çıkarım

Çıkarımsal istatistiğin kalbinde, küçük bir grubu (örneklem) inceleyerek büyük bir grup (evren) hakkında bilgi edinme fikri yatar. Bu süreç, her zaman belirli bir belirsizlik ve olasılık içerir.

  • Örnek: 100 sporcu üzerinde yapılan bir antrenman programının etkilerini inceleyerek, bu programın tüm benzer sporcular üzerindeki potansiyel etkileri hakkında çıkarım yapmak.
📝Hipotez Testinin Temel Adımları

Çıkarımsal istatistiğin en yaygın uygulamalarından biri hipotez testidir. Temel adımları şunlardır:

  1. Hipotezleri Belirleme: Null (H₀) ve Alternatif (H₁) hipotezleri açıkça ifade etme.
  2. Anlamlılık Düzeyini (α) Belirleme: Tip I hata yapma riskini belirleme (genellikle 0.05).
  3. Uygun İstatistiksel Testi Seçme: Veri türü, ölçüm düzeyi, araştırma deseni ve hipoteze göre uygun testi seçme.
  4. Veri Toplama ve Analiz: Verileri toplama, test istatistiğini ve p-değerini hesaplama.
  5. Karar Verme: Hesaplanan p-değerini belirlenen α düzeyi ile karşılaştırarak null hipotez hakkında karar verme (reddetme veya reddedememe).

🧪 Hipotez Testi ve p-değeri

🎯 Ana Konu: Örneklem verilerinden yola çıkarak evren hakkında hipotezleri test etme süreci ve bu süreçteki kritik bir değer olan p-değeri.

Hipotez testi, çıkarımsal istatistiğin temelini oluşturur. Araştırma sorularımıza objektif ve bilimsel bir şekilde cevap bulmamızı sağlar.

🧪Hipotez Testi Nedir?

Hipotez testi, bir örneklemden elde edilen verilerde gözlemlenen bir etkinin veya farkın, şans eseri mi yoksa gerçekten evrende var olan bir durumdan mı kaynaklandığını belirlemek için kullanılan istatistiksel bir yöntemdir. Null hipotezi (H₀) test etme sürecidir.

📊p-değeri (p-value) Nedir?

p-değeri, null hipotezin doğru olduğu varsayımı altında, gözlemlenen sonuçların (veya daha uç sonuçların) elde edilme olasılığıdır. Null hipoteze karşı kanıtın gücünü nicel olarak ifade eder.

  • Küçük p-değeri: Null hipotezin doğru olma olasılığı düşüktür. Null hipotezi reddetmek için güçlü kanıt.
  • Büyük p-değeri: Null hipotezin doğru olma olasılığı yüksektir. Null hipotezi reddetmek için yeterli kanıt yok.
⚖️Anlamlılık Düzeyi (α)

Anlamlılık düzeyi (alfa), null hipotezi reddetmek için önceden belirlenmiş bir eşik değeridir. Tip I hata (null hipotez doğru olduğu halde reddetme) yapma olasılığının maksimum kabul edilebilir riskini temsil eder.

  • Yaygın Değerler: α = 0.05 (%5), α = 0.01 (%1), α = 0.10 (%10).
Karar Verme
  • Eğer p-değeri < α ise: Null hipotez reddedilir. Gözlemlenen fark veya ilişki istatistiksel olarak anlamlıdır.
  • Eğer p-değeri ≥ α ise: Null hipotez reddedilemez. Gözlemlenen fark veya ilişki istatistiksel olarak anlamlı değildir.

⚖️ Gruplar Arası Fark Testleri

🎯 Ana Konu: İki veya daha fazla grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için kullanılan temel testler.

Deneysel ve yarı deneysel araştırmalarda, müdahalenin gruplar arasında bir fark yaratıp yaratmadığını anlamak için gruplar arası fark testleri kullanılır. En yaygın olanları t-testi ve ANOVA'dır.

🆚1. t-Testi

t-Testi, iki grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark olup olmadığını karşılaştırmak için kullanılır.

  • Bağımsız Örneklemler t-Testi: İki bağımsız grubun (örn: deney ve kontrol grubu) ortalamalarını karşılaştırır. Örnek: "Yeni antrenman programı uygulayan grup ile standart program uygulayan grubun dikey sıçrama yükseklikleri arasında fark var mıdır?"
  • Bağımlı Örneklemler t-Testi (Eşleştirilmiş t-Testi): Aynı grubun iki farklı zamandaki (örn: ön test-son test) veya eşleştirilmiş iki grubun ortalamalarını karşılaştırır. Örnek: "Yeni antrenman programı uygulayan grubun antrenman öncesi ve sonrası dikey sıçrama yükseklikleri arasında fark var mıdır?"
  • Varsayımlar: Verilerin normal dağılması, varyansların homojenliği (bağımsız t-testi için).
📊2. Tek Yönlü Varyans Analizi (One-Way ANOVA)

ANOVA (Analysis of Variance), üç veya daha fazla bağımsız grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark olup olmadığını karşılaştırmak için kullanılır. t-testinin çoklu grup karşılaştırmaları için bir uzantısıdır.

  • Amacı: Gruplar arasında genel bir fark olup olmadığını belirler. Eğer anlamlı bir fark bulunursa, hangi gruplar arasında fark olduğunu belirlemek için ek analizler (post-hoc testler) gerekir.
  • Varsayımlar: Verilerin normal dağılması, varyansların homojenliği.
  • Post-Hoc Testler: ANOVA sonucunda anlamlı bir fark bulunduğunda, hangi grup çiftleri arasında bu farkın olduğunu belirlemek için (örn: Tukey, Bonferroni).

🔗 İlişki Testleri

🎯 Ana Konu: İki veya daha fazla değişken arasındaki ilişkinin varlığını, yönünü ve gücünü belirlemek için kullanılan istatistiksel testler.

Gruplar arası farkları incelemenin yanı sıra, çıkarımsal istatistikler değişkenler arasındaki ilişkileri de analiz etmemizi sağlar. Korelasyon ve regresyon analizleri bu alandaki temel araçlardır.

🔗1. Korelasyon Analizi

Korelasyon analizi, iki sürekli değişken arasındaki doğrusal ilişkinin gücünü ve yönünü ölçer. Değişkenlerin birlikte ne kadar ve hangi yönde değiştiğini gösterir.

  • Katsayılar:
    • Pearson r: İki sürekli değişken arasındaki doğrusal ilişki için.
    • Spearman rho (ρ): Sıralı değişkenler veya normal dağılmayan sürekli değişkenler arasındaki monotonik ilişki için.
  • Yorum: Katsayı -1.0 ile +1.0 arasında değişir. Yönü (pozitif/negatif) ve gücü (0'dan uzaklaştıkça güçlenir) gösterir.
📈2. Regresyon Analizi

Regresyon analizi, bir bağımlı değişkenin değerini, bir veya daha fazla bağımsız değişkenin değerlerine dayanarak tahmin etmek için kullanılır. Aynı zamanda değişkenler arasındaki ilişkinin doğasını da açıklar.

  • Basit Doğrusal Regresyon: Bir bağımsız değişkenin bir bağımlı değişken üzerindeki etkisini inceler. Denklem: Y = a + bX (Y: bağımlı, X: bağımsız, a: sabit, b: regresyon katsayısı)
  • Çoklu Doğrusal Regresyon: Birden fazla bağımsız değişkenin bir bağımlı değişken üzerindeki birleşik etkisini inceler.
  • Çıktı: Regresyon denklemi, R-kare (bağımsız değişkenlerin bağımlı değişkendeki varyansı açıklama oranı).

📊 Parametrik ve Non-parametrik Testler

🎯 Ana Konu: Verilerin dağılımı ve ölçüm düzeyine ilişkin varsayımlara göre istatistiksel testlerin sınıflandırılması: parametrik ve non-parametrik testler.

İstatistiksel testler, verilerin belirli özelliklere sahip olup olmadığına dair varsayımlar temelinde iki ana kategoriye ayrılır: parametrik ve non-parametrik testler. Doğru testi seçmek, analizlerinizin geçerliliği için kritiktir.

📈Parametrik Testler Nedir?

Parametrik testler, incelenen evrenin parametreleri (örn: ortalama, varyans) hakkında belirli varsayımlarda bulunan istatistiksel testlerdir. Genellikle verilerin normal dağıldığı ve varyansların homojen olduğu varsayılır.

  • Kullanım: Aralık veya oran düzeyinde ölçülmüş nicel veriler için uygundur.
  • Örnekler: t-testi, ANOVA, Pearson korelasyon katsayısı.
  • Avantajı: Varsayımlar karşılandığında, non-parametrik testlere göre daha güçlüdürler (gerçek bir etkiyi tespit etme olasılıkları daha yüksektir).
⚠️Parametrik Test Varsayımları
  • 1. Verilerin Normal Dağılımı: Bağımlı değişkenin evrende normal dağıldığı varsayılır.
  • 2. Varyansların Homojenliği: Karşılaştırılan grupların varyanslarının eşit olduğu varsayılır (ANOVA ve bağımsız t-testi için).
  • 3. Bağımsız Gözlemler: Katılımcıların birbirinden bağımsız olduğu varsayılır.
  • 4. Aralık veya Oran Düzeyinde Ölçüm: Bağımlı değişkenin en az aralık düzeyinde ölçülmüş olması.
📉Non-parametrik Testler Nedir?

Non-parametrik testler, evrenin parametreleri veya verilerin dağılımı hakkında herhangi bir varsayımda bulunmayan istatistiksel testlerdir. "Dağılımdan bağımsız" testler olarak da bilinirler.

  • Kullanım: Nominal veya ordinal düzeyde ölçülmüş veriler için veya parametrik varsayımların (örn: normal dağılım) ihlal edildiği durumlarda (örn: küçük örneklem büyüklüğü, çarpık dağılım) kullanılır.
  • Örnekler: Mann-Whitney U testi, Wilcoxon işaretli sıralar testi, Kruskal-Wallis testi, Spearman korelasyon katsayısı.
  • Dezavantajı: Parametrik testlere göre daha az güçlüdürler (gerçek bir etkiyi tespit etme olasılıkları daha düşüktür).

🤔 Hangi Testi Seçmeli?

🎯 Ana Konu: Araştırma sorusuna, veri türüne ve varsayımlara göre uygun istatistiksel testin nasıl seçileceği.

Bir araştırmanın en kritik adımlarından biri, toplanan verileri analiz etmek için doğru istatistiksel testi seçmektir. Yanlış test seçimi, yanlış sonuçlara ve hatalı yorumlara yol açabilir.

🤔Test Seçimini Etkileyen Faktörler
  • 1. Araştırma Sorusu/Hipotez: Fark mı arıyorsunuz, ilişki mi? Kaç grup var?
  • 2. Veri Türü ve Ölçüm Düzeyi: Bağımlı değişken nicel mi, nitel mi? Nominal, ordinal, aralık veya oran?
  • 3. Veri Dağılımı: Veriler normal dağılım gösteriyor mu? Aykırı değerler var mı?
  • 4. Örneklem Büyüklüğü: Küçük örneklemler non-parametrik testlere yönlendirebilir.
  • 5. Bağımsızlık: Gözlemler birbirinden bağımsız mı, yoksa eşleştirilmiş mi?
🌳Test Seçim Karar Ağacı (Basit)
  • Adım 1: Araştırma Sorusu Ne Tür Bir İlişkiyi İnceliyor?
    • Fark: Gruplar arasında bir fark var mı?
      • 2 Bağımsız Grup: Bağımsız t-testi (Parametrik) / Mann-Whitney U (Non-parametrik)
      • 2 Bağımlı Grup: Bağımlı t-testi (Parametrik) / Wilcoxon İşaretli Sıralar Testi (Non-parametrik)
      • ≥3 Bağımsız Grup: Tek Yönlü ANOVA (Parametrik) / Kruskal-Wallis Testi (Non-parametrik)
      • ≥3 Bağımlı Grup: Tekrarlı Ölçümler ANOVA (Parametrik) / Friedman Testi (Non-parametrik)
    • İlişki: Değişkenler arasında bir ilişki var mı?
      • 2 Sürekli Değişken: Pearson Korelasyon (Parametrik) / Spearman Korelasyon (Non-parametrik)
      • Tahmin: Regresyon Analizi
  • Adım 2: Veri Türü ve Varsayımlar: Seçilen testin parametrik varsayımları (normal dağılım, varyans homojenliği vb.) karşılanıyor mu? Karşılanmıyorsa non-parametrik alternatife yönelin.

📏 İstatistiksel Anlamlılık vs. Pratik Anlamlılık

🎯 Ana Konu: Bir bulgunun şans eseri olup olmadığını gösteren istatistiksel anlamlılık ile, bulgunun gerçek dünyadaki önemini gösteren pratik anlamlılık arasındaki kritik ayrım.

Bir araştırma sonucunu yorumlarken, sadece istatistiksel anlamlılığa bakmak yeterli değildir. Aynı zamanda bulgunun pratik olarak ne kadar önemli olduğunu da değerlendirmek gerekir.

📈İstatistiksel Anlamlılık Nedir?

İstatistiksel anlamlılık, bir araştırma sonucunun veya değişkenler arasındaki bir ilişkinin, sadece şans eseri ortaya çıkma olasılığının ne kadar düşük olduğunu ifade eder. p-değeri ile belirlenir.

  • Yorum: Eğer p-değeri, önceden belirlenen anlamlılık düzeyinden (α) küçükse (p < α), sonuç istatistiksel olarak anlamlıdır. Bu, null hipotezi reddetmek için yeterli kanıt olduğu anlamına gelir.
  • Sınırlılık: İstatistiksel anlamlılık, etkinin büyüklüğü veya pratik önemi hakkında bilgi vermez.
💡Pratik Anlamlılık Nedir?

Pratik anlamlılık, gözlemlenen bir etkinin veya farkın gerçek dünyada ne kadar önemli, faydalı veya uygulanabilir olduğunu ifade eder. "Bu bulgu ne kadar büyük?", "Bu farkın gerçek hayatta bir karşılığı var mı?" sorularına cevap arar.

  • Ölçüm: Genellikle etki büyüklüğü (effect size) ölçüleri (örn: Cohen's d, Eta-kare) ile değerlendirilir.
  • Önem: Özellikle büyük örneklem büyüklüklerinde, çok küçük ve pratik olarak önemsiz bir etki bile istatistiksel olarak anlamlı çıkabilir. Bu nedenle pratik anlamlılık, bulguların yorumlanmasında vazgeçilmezdir.
⚖️Neden Her İkisi de Önemlidir?

Sağlam bir bilimsel bulgu, hem istatistiksel olarak anlamlı (şans eseri olmadığını göstermek için) hem de pratik olarak anlamlı (gerçek dünyada bir değeri olduğunu göstermek için) olmalıdır. Araştırmacılar, bulgularını raporlarken hem p-değerlerini hem de etki büyüklüklerini sunmalıdır.