📊 NİCEL ARAŞTIRMA: TARAMA VE KORELASYON
Betimsel Araştırmalar ve İlişkisel Analizler
🎯 Amaç: Bu derste betimsel (tarama) araştırmaları, anket geliştirme süreci, korelasyonel araştırmalar ve ilişki analizi yöntemleri ele alınacaktır.
Video Özet
Bu dersin özet videosunu izleyerek konuyu hızlıca kavrayabilirsiniz.
📊 Betimsel Araştırma Nedir?
Bilimsel araştırmalar, sadece neden-sonuç ilişkileri kurmakla kalmaz, aynı zamanda mevcut durumları anlamak ve tanımlamak için de kullanılır. Betimsel araştırma, bu amaca hizmet eden temel bir yaklaşımdır.
Betimsel araştırma, bir popülasyonun, durumun veya olgunun özelliklerini sistematik ve doğru bir şekilde tanımlamayı amaçlar. "Ne?", "Nerede?", "Ne zaman?" ve "Nasıl?" gibi sorulara cevap arar, ancak "Neden?" sorusuna doğrudan cevap vermez.
- Gözlem ve Tanımlama: Değişkenleri manipüle etmeden, mevcut durumu veya olguyu olduğu gibi gözlemler ve tanımlar.
- Sistematik: Belirli bir plan ve yapıya sahiptir, rastgele değildir.
- Nicel veya Nitel Olabilir: Hem sayısal verilerle (örn: anketler) hem de kategorik verilerle (örn: gözlemler) yapılabilir. Bu hafta nicel betimsel araştırmalara odaklanacağız.
- Neden-Sonuç İlişkisi Kurmaz: Sadece değişkenler arasındaki ilişkileri veya bir olgunun özelliklerini tanımlar, aralarındaki neden-sonuç bağını açıklamaz.
- Bir popülasyonun belirli özelliklerini belirleme (örn: sporcuların demografik yapısı, antrenman geçmişi).
- Bir olgunun sıklığını veya dağılımını ölçme (örn: sporcularda görülen sakatlık türleri ve oranları).
- Bir tutum veya görüşü belirleme (örn: antrenman programına yönelik sporcu memnuniyeti).
- Daha sonraki, daha derinlemesine araştırmalar için temel bilgi sağlama.
📋 Betimsel Araştırma Türleri: Anket Araştırmaları
Anket araştırmaları, betimsel araştırmaların en yaygın ve etkili türlerinden biridir. Geniş kitlelerden sistematik bir şekilde veri toplamayı ve belirli bir konuya ilişkin genel eğilimleri veya özellikleri belirlemeyi amaçlar.
Anket araştırması, önceden belirlenmiş bir grup katılımcıdan (örneklem) belirli bir konu hakkında bilgi ve görüş toplamak için kullanılan bir araştırma yöntemi. Genellikle yapılandırılmış sorular aracılığıyla veri toplanır.
-
1. Kesitsel (Cross-sectional) Anketler:
Veriler, belirli bir zaman noktasında, farklı bireylerden veya gruplardan toplanır. Mevcut durumu anlık olarak betimler.
Örnek: "Sporcuların mevcut beslenme alışkanlıkları ve antrenman yoğunlukları arasındaki ilişki." -
2. Boylamsal (Longitudinal) Anketler:
Aynı örneklemden, farklı zaman noktalarında tekrar tekrar veri toplanır. Zaman içindeki değişimleri veya gelişimleri izlemeyi sağlar.
Örnek: "Sporcuların kariyerleri boyunca motivasyon düzeylerindeki değişim ve performansla ilişkisi."
- Amaç Belirleme: Anketle hangi bilgilere ulaşmak istediğinizi netleştirin.
- Soru Tasarımı: Açık, net, tarafsız, anlaşılır ve ölçmek istediğiniz şeyi ölçen sorular oluşturun.
- Anket Formatı: Veri toplama yöntemini seçin (kağıt-kalem, online, yüz yüze görüşme, telefon).
- Pilot Çalışma: Anketi küçük bir grupla test ederek olası sorunları (anlaşılmayan sorular, süre) tespit edin ve revize edin.
- Veri Toplama ve Analiz: Verileri toplayın ve uygun istatistiksel yöntemlerle analiz edin.
👁️ Betimsel Araştırma Türleri: Gözlemsel Çalışmalar
Gözlemsel çalışmalar, betimsel araştırmaların bir diğer önemli türüdür. Araştırmacının, müdahale etmeden, ilgilendiği olguyu veya davranışı doğal ortamında sistematik bir şekilde izlemesi ve kaydetmesi esasına dayanır.
Gözlemsel çalışma, araştırmacının herhangi bir değişkeni manipüle etmeden, belirli bir davranışı, etkileşimi veya olguyu doğal ortamında sistematik olarak gözlemleyip kaydettiği bir araştırma yöntemidir. Amacı, olguyu olduğu gibi betimlemektir.
-
1. Doğal Gözlem (Naturalistic Observation):
Katılımcıların doğal ortamlarında, araştırmacının herhangi bir müdahalesi olmadan gözlemlenmesidir. Katılımcılar genellikle gözlemlendiklerinin farkında değildir.
Örnek: "Bir futbol maçında oyuncuların top sürme tekniklerini gizlice gözlemleme." -
2. Katılımcı Gözlem (Participant Observation):
Araştırmacının, gözlemlediği grubun bir parçası haline gelerek, içeriden bilgi toplamasıdır. Genellikle nitel araştırmalarda kullanılır.
Örnek: "Bir spor takımına katılarak takım dinamiklerini ve iletişimini içeriden gözlemleme." -
3. Yapılandırılmış Gözlem (Structured Observation):
Önceden belirlenmiş bir kontrol listesi veya kodlama şeması kullanarak belirli davranışların sistematik olarak kaydedilmesidir. Genellikle nicel veriler üretir.
Örnek: "Bir basketbol maçında her oyuncunun yaptığı pas, şut, top kaybı sayısını kaydetme."
- Avantajlar: Doğal ortamda gerçekçi davranışlar, yeni hipotezler üretme potansiyeli, karmaşık sosyal etkileşimleri anlama.
- Dezavantajlar: Gözlemci yanlılığı riski, zaman alıcı, neden-sonuç ilişkisi kuramama, etik sorunlar (gizlilik, bilgilendirilmiş onam).
🔗 Korelasyon ve Nedensellik: Temel Fark
Korelasyonel araştırmaların en sık yanlış yorumlanan yönü, korelasyonun nedensellik olarak algılanmasıdır. Bilimsel düşüncede bu ayrım hayati öneme sahiptir.
İki değişken arasında istatistiksel olarak anlamlı bir ilişki (korelasyon) bulunması, bir değişkenin diğerine neden olduğu anlamına gelmez. Bu, bilimsel araştırmanın temel prensiplerinden biridir.
Bir değişkenin diğerine neden olduğunu iddia edebilmek için üç temel koşulun sağlanması gerekir:
- 1. İlişki (Association): Neden olduğu varsayılan değişken (X) ile sonuç olduğu varsayılan değişken (Y) arasında istatistiksel olarak anlamlı bir ilişki olmalıdır.
- 2. Zaman Önceliği (Temporal Precedence): Neden olduğu varsayılan değişken (X), sonuç olduğu varsayılan değişkenden (Y) zaman olarak önce gelmelidir.
- 3. Üçüncü Değişkenlerin Eliminasyonu (Elimination of Confounding Variables): X ve Y arasındaki ilişkiyi açıklayabilecek diğer tüm olası değişkenler kontrol edilmeli veya elenmelidir.
- Yön Sorunu (Directionality Problem): İki değişken ilişkili olduğunda, hangisinin neden, hangisinin sonuç olduğunu belirlemek zordur. X, Y'ye mi neden oluyor, yoksa Y, X'e mi? (Örn: Kaygı performansı mı düşürür, yoksa düşük performans mı kaygıya neden olur?).
- Üçüncü Değişken Sorunu (Third Variable Problem): İki değişken arasındaki ilişki, aslında üçüncü, gizli bir değişken tarafından açıklanıyor olabilir. Bu üçüncü değişken, her iki değişkeni de etkileyerek aralarında sahte bir ilişki yaratır. Örn: Dondurma satışları ile boğulma vakaları arasında pozitif korelasyon vardır. Ancak dondurma boğulmaya neden olmaz; her ikisi de yaz ayları nda artan sıcaklıklar (üçüncü değişken) tarafından etkilenir.
📈 Korelasyon Katsayısı ve Yorumlanması
Korelasyonel araştırmaların temel çıktısı, değişkenler arasındaki ilişkinin gücünü ve yönünü gösteren korelasyon katsayısıdır. Bu katsayı, istatistiksel analizlerin önemli bir parçasıdır.
Korelasyon katsayısı, iki değişkenin birlikte ne kadar ve hangi yönde değiştiğini gösteren standartlaştırılmış bir ölçüdür. Değeri -1.0 ile +1.0 arasında değişir.
- Yön (Direction):
- Pozitif Korelasyon (+): Katsayı pozitifse, değişkenler aynı yönde hareket eder. Bir değişkenin değeri arttıkça, diğerinin değeri de artar (veya biri azaldıkça diğeri de azalır).
- Negatif Korelasyon (-): Katsayı negatifse, değişkenler zıt yönde hareket eder. Bir değişkenin değeri arttıkça, diğerinin değeri azalır.
- Sıfır Korelasyon (0): Değişkenler arasında doğrusal bir ilişki yoktur.
- Güç (Strength):
- Katsayının mutlak değeri 0'dan 1'e yaklaştıkça ilişkinin gücü artar.
- 0.00 - 0.20: Çok zayıf ilişki
- 0.21 - 0.40: Zayıf ilişki
- 0.41 - 0.60: Orta düzeyde ilişki
- 0.61 - 0.80: Güçlü ilişki
- 0.81 - 1.00: Çok güçlü ilişki
- Pearson r: İki sürekli (aralık veya oran) değişken arasındaki doğrusal ilişkiyi ölçer. En sık kullanılan katsayıdır.
- Spearman rho (ρ): İki sıralı (ordinal) değişken veya bir sıralı ve bir sürekli değişken arasındaki monotonik (sürekli artan veya azalan) ilişkiyi ölçer. Veriler normal dağılmadığında da kullanılabilir.
- Phi (φ): İki nominal (iki kategorili) değişken arasındaki ilişkiyi ölçer.
📚 6. Örnek Tarama Araştırması İncelemesi
Tarama araştırmaları, geniş popülasyonlardan sistematik veri toplayarak genel eğilimleri, görüşleri ve davranış kalıplarını belirlemeyi amaçlar. Spor bilimlerinde yaygın kullanılan bu yöntemin başarılı örneklerini inceleyelim.
- Araştırma Problemi: Geniş kapsamlı, tanımlayıcı sorular (Kim? Ne? Ne kadar? Nasıl?)
- Örneklem Seçimi: Temsili örneklem, rastgele veya tabakalı örnekleme teknikleri
- Veri Toplama Araçları: Yapılandırılmış anketler, standart ölçekler, online formlar
- Zaman Boyutu: Kesitsel (tek nokta) veya boylamsal (zaman içinde tekrarlı)
- Analiz Yaklaşımı: Tanımlayıcı istatistikler, frekans dağılımları, merkezi eğilim ölçüleri
-
Araştırma Sorusu:
"Türkiye'deki genç sporcuların (14-18 yaş) spor motivasyonu düzeyleri ve etkileyen faktörler nelerdir?"
-
Metodoloji:
• Örneklem: 5 farklı bölgeden 1500 sporcu
• Araç: Sport Motivation Scale (SMS-28) Türkçe versiyonu
• Veri Toplama: Online anket platformu (3 hafta)
• Demografik Değişkenler: Yaş, cinsiyet, spor dalı, deneyim yılı -
Beklenen Bulgular:
• İçsel ve dışsal motivasyon düzeyleri
• Spor dalına göre motivasyon farklılıkları
• Cinsiyet ve yaş faktörlerinin etkisi
• Bölgesel farklılıklar ve sosyo-ekonomik ilişkiler
| Güçlü Yönler | Sınırlılıklar |
|---|---|
|
• Geniş örneklemlerden veri toplama • Genelleme yapabilme • Maliyet etkinliği • Standartlaştırılmış veri |
• Yüzeysel bilgi • Düşük yanıt oranları • Sosyal beğenirlik yanlılığı • Nedensellik kuramamak |
- ✓ Araştırma soruları açık ve spesifik mi?
- ✓ Örneklem hedef popülasyonu temsil ediyor mu?
- ✓ Veri toplama aracı geçerli ve güvenilir mi?
- ✓ Pilot çalışma yapıldı mı?
- ✓ Etik onay alındı mı?
- ✓ Yanıt oranını artırmak için stratejiler var mı?
- ✓ Veri analiz planı önceden belirlendi mi?
📝 7. Anket Geliştirme: Detaylı Süreç
Anket geliştirme, bilimsel araştırmalarda veri toplama sürecinin en kritik aşamalarından biridir. Güvenilir ve geçerli bir anket, araştırma sonuçlarının kalitesini doğrudan etkiler.
| Aşama | İçerik | Spor Bilimleri Örneği |
|---|---|---|
| 1. Planlama | Araştırma amacı, hedef kitle, kaynaklar | Genç sporcularda başarı motivasyonunu ölçme |
| 2. Literatür | Mevcut ölçekleri inceleme | Sport Motivation Scale (SMS-28) adaptasyon |
| 3. Madde Havuzu | 3-4 kat fazla madde yazma | 30 maddelik ölçek için 100+ madde |
| 4. Uzman Görüşü | İçerik geçerliliği sağlama | 5-10 spor psikoloğu değerlendirmesi |
| 5. Pilot Test | 30-50 kişilik ön uygulama | Genç sporcularla bilişsel mülakat |
| 6. Revizyon | Sorunlu maddeleri düzeltme | Anlaşılmayan terimleri sadeleştirme |
| 7. Ana Uygulama | Geniş örneklemde test | 300+ sporcu ile güvenirlik/geçerlik |
- Açık ve Net İfadeler: Herkesin anlayabileceği basit dil kullanımı
- Tek Boyutlu Sorular: Her madde sadece bir özelliği ölçmeli
- Uygun Uzunluk: 15-20 kelimeyi geçmeyen cümleler
- Yansız İfadeler: Yönlendirici kelimelerden kaçınma
- Pozitif Formülasyon: Çift olumsuz ifadelerden kaçınma
- Kültürel Uygunluk: Hedef kitlenin dilini kullanma
Problem: Çift yüklü soru (destek + motivasyon)
Çözüm: İki ayrı madde olarak sorma
Problem: Olumsuz ifade, ters kodlama gerektirir
Çözüm: Pozitif formülasyon
- Güvenirlik (Cronbach Alpha): İç tutarlılık için α > 0.70
- Test-Tekrar Test: Zaman içi kararlılık için r > 0.80
- Yapı Geçerliliği: Faktör analizi ile boyutları doğrulama
- Kriter Geçerliliği: Benzer ölçeklerle korelasyon
- Madde-Toplam Korelasyonu: r > 0.30 olması beklenir
❓ 8. Soru Türleri ve Tasarım İlkeleri
Anket kalitesi, sorulan soruların kalitesiyle doğrudan ilişkilidir. Spor bilimlerinde kullanılan farklı soru türleri ve tasarım ilkelerini anlamak, veri kalitesini önemli ölçüde etkiler.
-
Kapalı Uçlu Sorular:
Önceden belirlenmiş yanıt seçenekleri sunan sorular. İstatistiksel analiz için uygun.
Spor Örneği - Likert Tipi:
"Antrenörüm bana yeterli motivasyon sağlıyor."
1 = Kesinlikle Katılmıyorum → 5 = Kesinlikle KatılıyorumSpor Örneği - Çoktan Seçmeli:
"Haftada kaç gün antrenman yapıyorsunuz?"
a) 1-2 gün b) 3-4 gün c) 5-6 gün d) Her gün -
Açık Uçlu Sorular:
Katılımcıların kendi kelimelerini kullanarak cevap verdiği sorular. Derinlemesine bilgi sağlar.
Spor Örneği:
"Spor yapmaya başlama nedeninizi kısaca açıklayınız."
Avantaj: Zengin, beklenmeyen bilgiler
Dezavantaj: Analiz zorluğu, kategorik kodlama gerekliliği -
Karma (Hibrit) Sorular:
Çoktan seçmeliye "Diğer" seçeneği eklenerek açıklama isteme.
Spor Örneği: "Yaralanma nedeniniz: a) Aşırı yüklenme b) Temas c) Teknik hata d) Diğer: _______"
-
Nominal (Sınıflandırma) Veri:
Kategorilerin adlandırılması, sıralama yok.
Spor Örneği: "Spor dalınız: Futbol/Basketbol/Voleybol/Yüzme" -
Ordinal (Sıralı) Veri:
Kategoriler arasında sıralama var, eşit aralıklar yok.
Spor Örneği: "Performans seviyeniz: Acemi < Orta < İleri < Elit" -
Aralık (Interval) Veri:
Eşit aralıklarla sıralama, mutlak sıfır noktası yok.
Likert skalaları genellikle aralık veri olarak işlenir -
Oran (Ratio) Veri:
Eşit aralıklar ve mutlak sıfır noktası mevcut.
Spor Örneği: "Yaşınız: __ yıl", "Boy uzunluğunuz: __ cm"
-
Çift Yüklü Sorular:
Yanlış: "Antrenörüm yardımsever ve motivasyon sağlaycıdır."
Doğru: İki ayrı soru: "Antrenörüm yardımserverdir." + "Antrenörüm motivasyon sağlar."
-
Yönlendirici Sorular:
Yanlış: "Düzenli spor yapmanın sağlık için önemli olduğuna katılıyor musunuz?"
Doğru: "Düzenli spor yapmanın sağlık üzerindeki etkisi hakkında ne düşünüyorsunuz?"
-
Olumsuz İfadeler:
Zor: "Antrenman yapmaktan hiç sıkılmam." (Ters kodlama gerekecek)
Kolay: "Antrenman yapmaktan hoşlanırım."
-
Teknik Terimler:
Yanlış: "VO2max seviyenizi değerlendirin." (Herkes bilmez)
Doğru: "Korşu sırasındaki nefes alma kabiliyetinizi değerlendirin."
- Sosyal Beğenirlik Etkisi: Anonimlik garantisi, gizlilik bildirimi, hassas konularda dolaylı sorular
- Hatırlama Yanlılığı: Kısa zaman dilimi soruları ("Son 1 hafta" vs "Genellikle")
- Orta Nokta Eğilimi: Çift sayılı skala kullanımı (4 veya 6 noktalı zorla seçim)
- Aşırı Uyma Eğilimi: Ters kodlanmış maddeler karma, farbı yanıt formatları
💻 9. Veri Toplama Yöntemleri ve Teknolojileri
Veri toplama yöntemlerindeki teknolojik ilerlemeler, araştırmacılara hem fırsatlar hem de yeni zorluklar sunmaktadır. Spor bilimlerinde modern yaklaşımları anlamak kritiktir.
-
Web Tabanlı Anket Platformları:
Google Forms, Qualtrics, SurveyMonkey, LimeSurvey gibi araçların özellikleri ve kullanım alanları.
Avantajlar:
• Geniş coğrafi ulaşım
• Otomatik veri kodlama
• Koşul 분기 mantığı (şartlı sorular)
• Düşük maliyet
• Hızlı veri toplamaDezavantajlar:
• Dijital uçurum riski
• Düşük yanıt oranları
• Teknik sorunlar
• Örneklem yanlılığı (internet erişimi) -
Mobil Uygulama Tabanlı Veri Toplama:
Anlık veri toplama (EMA - Ecological Momentary Assessment) ve giyilebilir teknoloji entegrasyonu.
Spor Örneği: Sporcuların günlük enerji seviyesi, ruh hali ve performans değerlendirmelerini uygulama ile kaydetmesi
-
Yüz Yüze Görüşme:
En yüksek yanıt oranı, karmaşık soruları açıklama imkanı, nonverbal ipucları gözlemleme.
Spor Uygulamaları: Elit sporcularla performans analizi, emekli sporcularla karfiyer değerlendirmesi -
Telefon Görüşmeleri:
Maliyet etkinliği ve hız arasında denge, geniş coğrafi kapsam.
Sınırlılıklar: Görsel malzeme kullanamama, kısıtlı sür üst sınırı -
Kağıt-Kalem Anketleri:
Kontrollü ortam, yüksek tamamlama oranları, teknoloji bağımsızlığı.
Spor Örneği: Antrenman alanında toplu uygulama, takım toplantılarında veri toplama
-
Giyilebilir Sensörler ve IoT Entegrasyonu:
Gerçek zamanlı fizyolojik veriler (kalp atışı, adım sayısı, uyku kalitesi) ile anket verilerinin kombinasyonu.
Uygulama Örneği: Smartş-watch verisi + günlük stress anketi birleştirmesi ile objektif/sübjektif veri karma kararlaşıtırmasi -
Sanal Gerçeklik (VR) ve Artırılmış Gerçeklik (AR):
Sportif senaryolarda immersive veri toplama, gerçekçi ortam simülasyonları.
Spor Uygulaması: VR futbol ortamında karar verme süreçleri, stress yanıtları analizi -
Yapay Zeka destekli Veri Toplama:
Doğal dil işleme ile açık ức soru analizi, chatbot destekli anket tamamlama.
-
Blok Zincir (Blockchain) Tabanlı Veri Güvenliği:
Hassas sporcu verileri için şifrelenmiş, değiştirilemez veri saklama.
-
Çoklu Yöntem Entegrasyonu:
Farklı veri toplama yöntemlerini aynı çalışmada kullanarak güçlü veri seti oluşturma.
Örn: Ana anket (online) + Derinlemesine mülakatlar (yüz yüze) + Performans verileri (wearables) -
Longitudinal Multi-Modal Yaklaşım:
Zaman içinde farklı veri tipleri toplama ve entegre analiz.
-
Adaptive Survey Design:
Yanıtlara göre dinamik olarak değişen soru sırası ve içerik.
- GDPR ve Veri Koruma: Avrupa ve Türk veri koruma mevzuatına uyum
- Bilgilendirilmiş Onam: Dijital onay süreçleri ve geri çekilme hakkı
- Veri Minimizasyonu: Sadece gerekli verilerin toplanması ilkesi
- Anonimleştirme ve Pseudonimleştirme: Kişi tanımlayıcı bilgilerin korunması
📊 10. Korelasyon Analizi: İstatistiksel Yöntemler
Korelasyon analizi, iki veya daha fazla değişken arasındaki ilişkinin gücünü ve yönünü sayısal olarak ifade etmenin sistematik yöntemidir. Spor bilimlerinde en sık kullanılan istatistiksel analizlerden biridir.
-
Kullanım Şartları:
İki sürekli değişken arasındaki doğrusal ilişkiyi ölçer. Normal dağılım varsayımı gerektirir.
Varsayımlar:
• Sürekli değişkenler
• Normal dağılım
• Doğrusal ilişki
• Homostedastisite (varyans homojenliği)
• Aykırı değerlerin azlığı -
Hesaplama ve Yorumlama:
Formül: r = Σ(xi - x̄)(yi - ȳ) / √[Σ(xi - x̄)²Σ(yi - ȳ)²]
- r = +1.0: Mükemmel pozitif doğrusal ilişki
- r = -1.0: Mükemmel negatif doğrusal ilişki
- r = 0.0: Doğrusal ilişki yok
- 0.70 < |r| < 1.0: Güçlü ilişki
- 0.30 < |r| < 0.70: Orta düzeyde ilişki
- 0.0 < |r| < 0.30: Zayıf ilişki
-
Spor Bilimlerinden Örnek:
Araştırma: "Yaş ve dikey sıçrama performansı arasındaki ilişki"
Bulgu: r = -0.58, p < 0.001
Yorum: Yaş arttıkça dikey sıçrama performansı istatistiksel olarak anlamlı bir şekilde azalmaktadır (orta düzeyde negatif ilişki)
-
Kullanım Durumları:
Normal dağılmayan verilerde, aykırı değerlerin çok olduğu durumlarda, sıralı verilerle kullanılır.
-
Hesaplama Yöntemi:
Verilerin rankları (sıraları) üzerinden Pearson korelasyonu hesaplanır.
ρ = 1 - (6Σd²)/(n(n²-1)) — basitşeştirilmiş formül -
Spor Örneği:
Senaryo: Antrenör düşüklüğü sırası ile takim performans sırası arasındaki ilişki
Veri Örneği:
Takım A: Antrenör düzeyi 1. - Performans 2.
Takım B: Antrenör düzeyi 3. - Performans 1.
Analiz: Spearman ρ ile sıra korelasyonu hesaplama
-
Hipotez Testleri:
H₀: ρ = 0 (ilişki yok) vs H₁: ρ ≠ 0 (ilişki var)
Test İstatistiği: t = r√(n-2)/√(1-r²) -
Örneklem Büyüklüğü ve Güç:
- Zayıf korelasyon (r=0.3) tespit etmek için: n ≥ 84 (α=0.05, güç=0.80)
- Orta korelasyon (r=0.5) tespit etmek için: n ≥ 28
- Güçlü korelasyon (r=0.7) tespit etmek için: n ≥ 13
-
Güven Aralığı Hesaplama:
Fisher's z-transform kullanımı ile korelasyon katsayısı için %95 güven aralığı hesaplama.
-
Nedensellik Yanılğısı:
"Yüksek korelasyon neden-sonuç demektir" hatası. Korelasyon sadece ilişkiyi gösterir.
-
Aykırı Değer Sorunu:
Tek bir ekstrem değer tüm korelasyonu etkiler. Outliers'ın analiz edilmesi şart.
-
Doğrusal Olmayan İlişkileri Kaçırma:
Pearson r sadece doğrusal ilişkiler. Eğrisel ilişkiler görülemez.
Örnek: Yaş-performans ilişkisi çoğu sporda U-şeklinde eğrisel olabilir -
Subgrup Analizi Yanlışı:
Homojen alt gruplarda korelasyon azalır (restriction of range). Karma gruplarda yanlış yüksek korelasyon.
📈 11. Kovaryans ve Regresyon Analizi Temelleri
Korelasyonel analizlerin geliştirilmiş forma, kovaryans ve regresyon analizleri değişkenler arası ilişkileri daha derinlemesine anlamamızı sağlar. Bu yöntemler, spor bilimlerinde tahmin ve açıklama amaçlı kullanılır.
-
Kovaryans Nedir?
İki değişkenin birlikte nasıl değiştiğini gösteren istatistiksel ölçü. Korelasyonun standardize edilmemiş hali.
Formül: Cov(X,Y) = Σ(xi - x̄)(yi - ȳ) / (n-1)
İlişki: r = Cov(X,Y) / (sx × sy) -
Kovaryans Yorumlaması:
- Pozitif Kovaryans: Değişkenler aynı yönde hareket eder
- Negatif Kovaryans: Değişkenler zıt yönde hareket eder
- Sıfır Kovaryans: Değişkenler arasında doğrusal ilişki yok
- Sınırlılık: Büyüklük birimi vardır, standartlaştırılmamış
-
Spor Uygulaması:
Örnek: Antrenman süresi (dakika) ve kalori yakımı (kcal) arasındaki kovaryans
Hesaplama: Cov(süre, kalori) = +45.8 dk×kcal
Yorum: Antrenman süresi arttıkça kalori yakımı artıyor (pozitif kovaryans)
-
Regresyon Modeli:
Bir değişkenin (bağımsız/açıklayıcı) diğer değişkeni (bağımlı/yanıt) ne kadar açıkladığını bulma.
Model: Y = a + bX + ε
Açıklama:
• Y = Bağımlı değişken (tahmin edilen)
• X = Bağımsız değişken (açıklayıcı)
• a = Sabit (intercept)
• b = Eğim (slope)
• ε = Hata terimi -
En Küçük Kareler Yöntemi:
Gözlenen değerler ile tahmin edilen değerler arasındaki farkların karelerinin toplamını minimize eden doğruyu bulma.
Amaç: Σ(yi - ŷi)² → minimum -
Hesaplama Formülleri:
- Eğim: b = Σ(xi - x̄)(yi - ȳ) / Σ(xi - x̄)²
- Sabit: a = ȳ - b × x̄
- Tahmin: ŷ = a + bx
-
Belirleme Katsayısı (R²):
Bağımsız değişkenin, bağımlı değişkendeki varyansın ne kadarını açıkladığını gösterir.
Formül: R² = 1 - (SSE/SST)
Yorumlama:
• R² = 0.25 → %25 varyans açıklanıyor
• R² = 0.70 → %70 varyans açıklanıyor
Spor Örneği: "Antrenman yoğunluğu, performans varyansının %45'ini açıklıyor" (R² = 0.45) -
Standart Hata (SE):
Tahminlerin ne kadar kesin olduğunu gösteren ölçü.
SE = √(SSE/(n-2)) -
F-istatistiği ve Anlamlılık:
Regresyon modelinin genel olarak anlamlı olup olmadığını test eder.
H₀: Model anlamlı değil (β = 0) vs H₁: Model anlamlı (β ≠ 0)
Değişkenler:
• X (Bağımsız): Haftalık antrenman sayısı (gün)
• Y (Bağımlı): VO₂max (ml/kg/dk)
Örnek Veri: 50 dayanıklılık sporcusu
Analiz Sonuçları:
• Regresyon denklemi: VO₂max = 35.2 + 3.8 × (antrenman günü)
• R² = 0.52 (Model %52 varyans açıklıyor)
• F(1,48) = 52.3, p < 0.001 (Model anlamlı)
Yorumlama:
• Her ek antrenman günü VO₂max'ı ortalama 3.8 ml/kg/dk artırıyor
• Antrenman sıklığı aerobik kapasitenin yarısından fazlasını açıklıyor
• İlişki istatistiksel olarak çok anlamlı
- Doğrusallık: X ve Y arasında doğrusal ilişki olmalı
- Bağımsızlık: Gözlemler birbirinden bağımsız olmalı
- Homostedastisite: Hata terimlerinin varyansı sabit olmalı
- Normallik: Hata terimleri normal dağılmalı
- Aykırı değerler: Regresyon doğrusunu büken ekstrem değerlerden kaçınma
🔍 12. Spor Bilimlerinde Tarama Çalışmaları Eleştirisi
Spor bilimlerindeki tarama çalışmalarının kalitesini değerlendirmek ve geliştirmek, alanın bilimsel ilerlemesi için kritiktir. Bu derste yaygın sorunları ve çözüm yollarını sistematik olarak inceleyeceğiz.
-
Örneklem Yanlılığı (Selection Bias):
Sadece belirli grup/kulüp/bölgeden katılımcı alma, gönüllü katılımcı problemi.
Yaygın Hata: "İstanbul'daki 3 özel kulüpten 150 sporcu" ile "Türkiye'deki sporcular" genellemesi
Sorun: Sosyoekonomik durum, coğrafi farklılık, kulüp kültürü etkisi
Çözüm: Çok merkezli, tabakalı örnekleme, ulusal veri tabanı kullanımı -
Ölçüm Araçları Sorunları:
Standardize edilmemiş anketler, geçerlilik/güvenilirlik gösterilmeyen araçlar.
Problem örneği: "Kendi geliştirdiğimiz 5 soruluk motivasyon ölçeği" psikometrik analiz olmadan -
Zaman Aralığı ve Mevsimsellik Göz Ardı:
Sporcuların performans ve psikolojik durumlarının sezonsal değişkenliği.
Örnek: Tüm veriyi yarışma sezonunda toplama, preparation dönemini ihmal etme -
Demografik Homojenlik:
Sadece erkek, sadece belirli yaş grubu, sadece elit seviye ile sınırlı kalma.
-
Uygunsuz İstatistiksel Test Seçimi:
Veri özelliklerine uygun olmayan testlerin kullanılması.
Yaygın Hatalar:
• Normal dağılmayan verilerde parametrik test
• Küçük örneklemlerde güç analizi yapmama
• Çoklu karşılaştırmalarda alfa düzeltmesi yapmama
• Ordinal verileri sürekli veri gibi işleme -
P-Hacking ve Cherry Picking:
İstenen sonucu elde etmek için multiple analiz yapma, sadece anlamlı sonuçları raporlama.
-
Etki Büyüklüğü Göz Ardı:
Sadece p değeri raporlama, pratik anlamlılığı değerlendirmeme.
Örnek: "p<0.05 anlamlı" demek yeterli değil, "Cohen's d = 0.12 (küçük etki)" de raporlanmalı
-
Yöntem Detaylarında Eksiklik:
Örnekleme prosedürü, ölçüm koşulları, veri toplama zaman çizelgesi belirsizliği.
-
Kısıtlılıklar Bölümü Eksikliği:
Çalışmanın sınırlılıklarını belirtmeme, genelleme alanını net tanımlamama.
-
Çıkar Çatışması Bildirmeme:
Sponsorluk, antrenör-sporcu ilişkisi, kurumsal bağlılık gibi potansiyel yanlılık kaynaklarını saklama.
-
Veri Paylaşım Eksikliği:
Ham verileri paylaşmama, analiz kodlarını gizleme (replikasyon önleme).
-
Ön Kayıt (Pre-registration):
Veri toplama öncesi hipotez, yöntem ve analiz planını kayıt altına alma.
Platform önerileri: OSF (Open Science Framework), ClinicalTrials.gov -
Açık Bilim Uygulamaları:
- Ham veri paylaşımı (GDPR uyumlu)
- Analiz kodlarının GitHub'da paylaşımı
- Materyal ve prosedürlerin detaylı dokumentasyonu
- Negatif sonuçların da raporlanması
-
Çok Merkezli İşbirlikleri:
Farklı coğrafi bölge, kulüp türü, sosyoekonomik durumdan örneklem dahil etme.
-
Uzunlamasına Tasarımlar:
Kesitsel yerine longitudinal çalışmalara öncelik verme, sezonsal değişkenliği yakalama.
✅ Örneklem: Temsili mi? Örneklem büyüklüğü yeterli mi?
✅ Ölçüm: Geçerli ve güvenilir araçlar kullanılmış mı?
✅ Analiz: Veri özelliklerine uygun testler seçilmiş mi?
✅ Genelleme: Bulgular hangi popülasyona genellenebilir?
✅ Praktik Anlamlılık: Etki büyüklükleri raporlanmış mı?
✅ Şeffaflık: Yöntem yeterince detaylı anlatılmış mı?
✅ Yanlılık: Potansiyel yanlılık kaynakları ele alınmış mı?
✅ Kısıtlılıklar: Çalışmanın sınırları dürüstçe belirtilmiş mi?
- Big Data Entegrasyonu: Wearable teknoloji verileri ile anket verilerini birleştirme
- Makine Öğrenmesi: Karmaşık ilişki desenlerini keşfetme
- Kültürlerarası Uyum: Çok kültürlü sporcu popülasyonları için araç geliştirme
- Real-time Assessment: Anlik değerlendirmeler ile daha ekolojik geçerli veriler
🔄 13. Çok Değişkenli Korelasyonel Analizler
Gerçek yaşam durumlarında, spor performansı ve davranışları multiple faktörlerden etkilenir. Çok değişkenli analizler, bu karmaşık ilişki ağlarını anlamamızı sağlar.
-
Tanım ve Amaç:
İki değişken arasındaki ilişkiyi, üçüncü bir değişkenin etkisini kontrol ederek inceleme.
Spor Örneği:
Soru: "Antrenman süresi ile performans arasındaki ilişki, yaş kontrol edildiğinde nasıl değişir?"
Analiz: r(performans, antrenman.yaş) = 0.45
Yorum: Yaş etkisi çıkarıldıktan sonra da orta düzeyde pozitif ilişki devam ediyor -
Hesaplama Formülü:
r(xy.z) = (rxy - rxz × ryz) / √((1-rxz²)(1-ryz²))
xy.z: x ve y arasındaki ilişki, z kontrol edildiğinde -
Çoklu Kısmi Korelasyon:
Birden fazla değişkenin etkisini aynı anda kontrol etme.
Örnek: r(performans, teknik.yaş,deneyim,motivasyon)
-
Model Yapısı:
Y = β₀ + β₁X₁ + β₂X₂ + β₃X₃ + ... + βkXk + ε
Spor Performansı Tahmin Modeli:
Performans = b₀ + b₁(Yaş) + b₂(Antrenman_süresi) + b₃(Beslenme_kalitesi) + b₄(Uyku_kalitesi) + ε
Örnek Sonuç:
Performans = 45.2 + 0.3(Yaş) + 1.8(Antrenman) + 2.1(Beslenme) + 1.5(Uyku)
R² = 0.67 (Model %67 varyans açıklıyor) -
Katsayı Yorumlaması:
Her βi katsayısı: "Diğer değişkenler sabit tutulduğunda, Xi'deki 1 birimlik artışın Y üzerindeki etkisi"
-
Standardize Edilmiş Katsayılar (Beta):
Farklı ölçü birimindeki değişkenlerin etkilerini karşılaştırma imkanı.
Hangi değişken daha önemli? En yüksek |β| değerine sahip olan
-
Korelasyon Matrisi Oluşturma:
Tüm değişken çiftleri arasındaki korelasyonları sistematik tablo halinde düzenleme.
Örnek Spor Değişkenleri Matrisi:
- Yaş Antrenman Performans Yaş 1.00 -0.15 -0.32 Antrenman -0.15 1.00 0.68 Performans -0.32 0.68 1.00 -
Görsel Sunum (Heatmap):
Renk kodlaması ile korelasyon gücünü görselleştirme. Kırmızı=negatif, Mavi=pozitif, Koyu=güçlü.
-
Multicollinearity Tespiti:
Bağımsız değişkenler arasında yüksek korelasyon (|r| > 0.80) sorunu.
Çözüm: Ridge regresyon, değişken seçimi, ana bileşen analizi
-
Açıklayıcı Faktör Analizi (EFA):
Çok sayıda değişken arasındaki ilişki yapısını keşfederek, az sayıda faktöre indirgeme.
Spor Motivasyonu Örneği:
20 motivasyon maddesi → 3 faktöre indirgenebilir:
• Faktör 1: İçsel motivasyon (maddeler 1,5,9,12,18)
• Faktör 2: Dışsal motivasyon (maddeler 2,6,10,15,19)
• Faktör 3: Amotivasyon (maddeler 3,7,11,14,20) -
Ana Bileşen Analizi (PCA):
Varyansı maksimize eden bileşenler oluşturarak boyut indirgeme.
Kullanım: Çok sayıda performans göstergesi → Ana performans bileşenleri -
Faktör Skorları:
Her katılımcı için faktörlerdeki konumunu gösteren birleşik skorlar hesaplama.
-
Değişken Seçimi Kriterleri:
- Teorik gerekçe (literatür desteği)
- Pratik önem (etki büyüklüğü)
- Ölçüm güvenilirliği
- Çoklu bağıntı yokluğu
-
Model Karmaşıklığı Dengesi:
Örneklem büyüklüğü başına değişken sayısı oranı: minimum 10:1, ideal 15:1
Örnek: 150 katılımcı ile maximum 10-15 değişken kullanımı -
Model Validasyonu:
Çapraz validasyon, bootstrap yöntemleri ile sonuçların kararlılığını test etme.
Değişkenler:
• Fiziksel: VO₂max, kuvvet, hız, çeviklik
• Teknik: beceri skoru, teknik tutarlılık
• Mental: özgüven, koncentrasyon, kaygı
• Sosyal: takım uyumu, antrenör desteği
• Çevresel: antrenman kalitesi, sosyal destek
Analiz Süreci:
1. Korelasyon matrisi incelemesi
2. EFA ile boyut indirgeme
3. Çoklu regresyon modeli
4. Model validasyonu
Sonuç: Final model R² = 0.78, en önemli yordayıcılar: VO₂max (β=0.34), özgüven (β=0.28), takım uyumu (β=0.22)