Örneklem büyüklüğü nasıl belirlenir? Örneklem için kaç kişi yeterlidir?
Kaç Kişiyle Çalışmalıyım?
Örneklem Büyüklüğü ve Güç Analizi
“30 kişi yeter mi?” sorusunun arkasında yatan mantığı anlayın ve G*Power ile doğru örneklem büyüklüğünü hesaplayın.
“Kaç kişi yeter?” sorusu neden bu kadar zor?
Araştırmacıların en sık sorduğu sorulardan biridir bu. Ve cevap çoğunlukla beklentinin aksine basit bir sayı değildir.
“En az 30 kişi olsun”, “soru sayısının en az 3 katı kadar kişi”, “her grup için 30”, “toplam 100 yeterli” gibi sezgisel kurallar araştırma literatüründe dolaşıp durur. Bunların bir kısmı tamamen temelsizdir, bir kısmı ise çok dar bağlamlarda geçerlidir. Sorun şu: örneklem büyüklüğü tek başına anlam taşımaz. Neyi tespit etmek istediğinize ve ne kadar hata yapmaya razı olduğunuza bağlıdır.
Küçük bir farkı tespit etmek istiyorsanız çok sayıda katılımcıya ihtiyacınız var. Büyük bir fark bekliyorsanız daha azıyla da yetinebilirsiniz. Ama bunu bilmeden “yeterli” diye bir sayı söylemek anlamsızdır.
Örneklem büyüklüğü bir araştırma kararıdır, şans eseri ortaya çıkan bir şey değildir. Veri toplamadan önce hesaplanmalıdır — sonradan “yeterli miydi?” diye sorgulamak çok daha maliyetlidir.
Dört temel kavram: Güç, etki büyüklüğü, alfa, n
Örneklem büyüklüğü hesabı dört büyüklüğün birbirine bağlandığı bir denklemdir. Birini sabitleyip diğerlerini bilirseniz, dördüncüsü otomatik olarak hesaplanır.
Gerçekten var olan bir etkiyi tespit edebilme olasılığı. Genellikle 0.80 hedeflenir — yani gerçek bir etki varsa bunu %80 ihtimalle yakalayabilmelisiniz.
Tespit etmek istediğiniz farkın veya ilişkinin büyüklüğü. Küçük etkiler için çok daha fazla katılımcı gerekir. Araştırmanızın en kritik parametresidir.
Etki yokken “etki var” deme olasılığı. Sosyal bilimlerde genellikle 0.05 olarak belirlenir. Bu, yanılma payınızın %5 olduğu anlamına gelir.
Diğer üç değer belirlendikten sonra hesaplanan büyüklük. Ya da n’yi sabitleyip güç hesaplanabilir — elde ettiğiniz gücü görmek için.
Bu dört kavramın ilişkisini şöyle düşünebilirsiniz: güç, etki büyüklüğü ve alfa sabitken örneklem büyüdükçe güç artar. Ya da örneklem sabitteyken daha küçük bir etkiyi tespit etmek istiyorsanız gücünüz düşer.
İki tür hata: Yanlış alarm ve gözden kaçırma
İstatistiksel karar verme, iki tür hata arasında bir denge kurmaktır.
Yanlış alarm: Gerçekte hiçbir etki yokken “etki var” demek. Alfa düzeyini (0.05) kontrol ederek bu hatayı sınırlarsınız. “Yokken var dedim” hatasıdır.
Gözden kaçırma: Gerçekte bir etki varken “yok” demek. Güç (1−β) bu hatayı kontrol eder. “Varken yok dedim” hatasıdır. Düşük güçlü çalışmalarda sık görülür.
İstatistiksel karar matrisi: dört olası durum
Örneklem küçüldükçe Tip II hata olasılığı artar — yani gerçek bir etkiyi kaçırma ihtimaliniz yükselir. Bu, düşük güçlü çalışmaların en büyük sorunudur: etki yoktur sonucuna varırsınız ama aslında etki vardı, sadece yeterince katılımcınız yoktu.
Anlamlı sonuç çıkmaması, “etki yok” anlamına gelmez. Düşük güçlü bir çalışmada etki var ama siz onu tespit edememiş olabilirsiniz. “Anlamlı değil” ile “etki yok” aynı şey değildir.
Etki büyüklüğü nedir, nasıl belirlenir?
Etki büyüklüğü, örneklem büyüklüğü hesabının en kritik ve aynı zamanda en zor parçasıdır. Tespit etmek istediğiniz farkı standartlaştırılmış bir birimle ifade eder.
Her test için farklı etki büyüklüğü ölçütleri kullanılır. En yaygın olanları:
| Test / Analiz | Ölçüt | Küçük | Orta | Büyük |
|---|---|---|---|---|
| t-testi | Cohen’s d | d = 0.20 | d = 0.50 | d = 0.80 |
| ANOVA | Cohen’s f | f = 0.10 | f = 0.25 | f = 0.40 |
| Korelasyon | r | r = 0.10 | r = 0.30 | r = 0.50 |
| Ki-kare | Cohen’s w | w = 0.10 | w = 0.30 | w = 0.50 |
| Regresyon (R²) | Cohen’s f² | f² = 0.02 | f² = 0.15 | f² = 0.35 |
Etki büyüklüğünü nasıl belirlersiniz?
Üç yol vardır:
Aynı veya benzer konuda yapılmış önceki çalışmalarda bildirilen etki büyüklüklerini kullanın. Bu en sağlam yoldur.
Küçük bir örneklemle ön çalışma yapın, elde ettiğiniz etki büyüklüğünü esas araştırmanız için kullanın.
Literatürde bilgi yoksa Cohen’in küçük/orta/büyük sınıflamasını kullanabilirsiniz. Ancak “orta etki” varsayımı sizi yanıltabilir — alanınızın gerçeklerine dikkat edin.
Sosyal bilimlerde etkiler çoğunlukla küçüktür. “Orta etki varsayıyorum” diyerek hesaplanan örneklem büyüklükleri, gerçekte küçük etkilerle çalışan araştırmalarda yetersiz kalır. Kendi alanınızın meta-analizlerine bakın.
G*Power ile adım adım hesaplama
G*Power, ücretsiz, güvenilir ve yaygın kullanılan bir güç analizi programıdır. psychologie.hhu.de adresinden indirilebilir. Windows ve Mac sürümleri mevcuttur.
Örnek senaryo: Bağımsız örneklem t-testi
İki grup arasında orta büyüklükte bir fark (d = 0.50) olduğunu bekliyorsunuz. Güç 0.80, alfa 0.05 olsun. Kaç katılımcıya ihtiyacınız var?
Üst menüden Test family → t tests seçin.
Means: Difference between two independent groups seçeneğini tıklayın.
A priori seçin — yani önceden planlama yapıyorsunuz, n’yi hesaplatmak istiyorsunuz.
Effect size d = 0.50 · α err prob = 0.05 · Power (1-β) = 0.80 · Allocation ratio = 1 (gruplar eşit)
G*Power size toplam ve her grup için gereken n’yi verir.
Sonuç: Orta büyüklükte bir etkiyi %80 güçle tespit etmek için her grupta 51, toplamda 102 katılımcıya ihtiyaç var. “Her gruptan 30 yeter” diyenler bu durumda gücü yaklaşık %54’e düşürüyor — yani gerçek bir etki olsa bile bunu ancak yarı yarıya tespit edebilecekler.
Diğer analizler için G*Power menüleri
| Analiz | Test Family | Statistical Test |
|---|---|---|
| Eşleştirilmiş t-testi | t tests | Means: Difference between two dependent groups |
| Tek yönlü ANOVA | F tests | ANOVA: Fixed effects, omnibus, one-way |
| Korelasyon | t tests | Correlation: Point biserial model |
| Çoklu regresyon | F tests | Linear multiple regression: Fixed model, R² deviation from zero |
| Ki-kare | Chi-square tests | Goodness-of-fit tests / Contingency tables |
| Lojistik regresyon | z tests | Logistic regression |
Pratik öneriler ve sık yapılan hatalar
Ne zaman güç analizi yapılmalı?
İdeal olan veri toplamadan önce — buna a priori güç analizi denir. Bu, araştırmanızı gereksiz yere küçük ya da büyük tutmaktan kaçınmanızı sağlar.
Veri toplandıktan sonra yapılan post-hoc güç analizi ise çok daha sınırlı bilgi verir ve çoğunlukla yanıltıcıdır. “Anlamlı çıkmadı, gücüm ne kadardı?” sorusu post-hoc analizle yanıtlanmaya çalışılır ama bu hesap büyük ölçüde gereksizdir — anlamlı çıkmayan sonuçtan düşük güç zaten anlaşılır.
Araştırma önerinizi yazarken veya etik kurula başvururken güç analizinizi yapın ve kullandığınız etki büyüklüğünün kaynağını belirtin. “Literatürdeki benzer çalışmalardan elde edilen ortalama d = 0.45 temel alınmıştır” gibi bir ifade, çalışmanıza güvenilirlik katar.
Sık yapılan hatalar
“Büyük etki bekliyorum” deyip az katılımcıyla çalışmak, gerçek etki küçük çıkınca anlamlı sonuç vermeyen bir çalışmaya yol açar.
Uygulama sırasında katılımcılar çekilebilir, veriler eksik kalabilir. Hesaplanan n’ye %10–20 ekleme yapmak yaygın bir uygulamadır.
G*Power’ın verdiği sonuç bazen her grup için, bazen toplamadır. Çıktıyı dikkatlice okuyun.
Güç artırmanın tek yolu n değildir. Daha iyi ölçüm araçları, daha homojen örneklem veya tekrarlı ölçüm deseni de gücü artırır.
Güç analizi bir garanti değildir. Belirlediğiniz koşullar altında, o etki büyüklüğünü tespit etme olasılığını size verir. Gerçek dünya her zaman biraz farklı işler — ama planlı çalışmak planlamadan çok daha iyi sonuçlar doğurur.
Bu yazı hakkında sorularınız varsa yorum bırakabilirsiniz.
istatistik.gen.tr