R’ye Başlangıç:
R ile İstatistik
Vektör nedir, data frame nedir bunları unutun. Önce gerçek bir analiz yapın.
Bu yazıda neler var?
- Neden çoğu R kursu sizi kaybediyor?
- R ve RStudio kurulumu (5 dakika)
- Hemen bir analiz yapalım — t-testi
- Kodu çalıştırmak
- Grafiği çizmek
- Sonuçları yorumlamak
- Perde arkasında neler oldu?
- Sıradaki adımlar
Neden çoğu R kursu sizi kaybediyor?
R öğrenmeye çalışan çoğu kişi aynı noktada takılır. Kurs başlar, ilk ders “vektör nedir”, ikinci ders “liste nedir”, üçüncü ders “data frame nedir”… Bir süre sonra şu soru kafanıza takılır: “Bunları neden öğreniyorum?”
Bu, aslında zihnin doğal bir tepkisi. İnsan beyni anlam bağlamı oluşturmadan parçaları birbirine bağlayamaz. Önce bütünü görmeniz gerekir. Bütünü görmeyen zihin, parçaları bir yere koyamaz ve bunları kısa sürede unutur.
Gestalt ilkesi
Algı psikolojisinde Gestalt yaklaşımı şunu söyler: insan zihni parçaları önce değil, bütünü önce algılar. Bir bisiklet gördüğünüzde önce “bisiklet” görürsünüz, “iki tekerlek + sele + gidon” görmezsiniz. Öğrenmede de bu böyledir.
Bu yazıda sizi doğrudan çalışan bir analizin içine atacağım. Birkaç satır kod yazacaksınız, gerçek bir istatistiksel sonuç elde edeceksiniz, grafiği göreceksiniz. Analiz nasıl yapılır sorusunun cevabı kendiliğinden anlam kazanacak.
R ve RStudio kurulumu
İki şey kurmanız gerekiyor. Birincisi R’nin kendisi, ikincisi R’yi rahat kullanmanızı sağlayan arayüz olan RStudio.
1 R’yi kurun
cran.r-project.org adresine gidin. İşletim sisteminize (Windows / Mac / Linux) göre indirip kurun. Kurulum sihirbazı adım adım yönlendirir, hiçbir ayarı değiştirmenize gerek yok.
2 RStudio’yu kurun
posit.co/download/rstudio-desktop adresinden ücretsiz “RStudio Desktop” sürümünü indirin. Kurun ve açın.
R mi açıyorum, RStudio mu?
Her zaman RStudio‘yu açın. R arka planda çalışır, siz RStudio üzerinden onunla konuşursunuz. R’yi doğrudan açmanıza gerek yok.
RStudio ekranını tanımak
RStudio’yu ilk açtığınızda 3 bölge görürsünüz:
| Bölge | Ne işe yarar? |
|---|---|
| Sol alt — Console | Sonuçlar burada çıkar. |
| Sağ üst — Environment | Oluşturduğunuz veriler burada listelenir. |
| Sağ alt — Plots/Files | Grafikler, dosyalar, yardım sayfası buradadır. |
Sol üstte File yazan yere tıklayıp New File -> New Script tıklayarak yeni bir kod yazma defteri açın. Böylece ekran 4’e bölünecektir.
| Bölge | Ne işe yarar? |
|---|---|
| Sol üst — Script | Kodunuzu buraya yazarsınız. Kayıt altına alınır. |
| Sol alt — Console | Sonuçlar burada çıkar. |
| Sağ üst — Environment | Oluşturduğunuz veriler burada listelenir. |
| Sağ alt — Plots/Files | Grafikler, dosyalar, yardım sayfası buradadır. |
RStudio’da sol üst tarafa kodlar yazılır, çalıştırılması istenen kodlar seçili hale getirilir ve kodların sağ üstündeki Run tuşuna basılarak çalıştırılır.
Hemen bir analiz yapalım
Sizi teknik detaylara boğmadan doğrudan bir analize atlıyoruz. Senaryo şu:
Senaryo
Bir araştırmacı iki farklı öğretim yöntemi uygulayan iki grup öğrencinin akademik başarı puanlarını karşılaştırmak istiyor. Grup A geleneksel anlatım yöntemiyle, Grup B aktif öğrenme yöntemiyle ders gördü. Her iki grupta da 15 öğrenci var. Gruplar arasında anlamlı bir fark var mı?
Bu soruyu cevaplamak için kullanacağımız analiz: bağımsız örneklem t-testi.
Şimdi RStudio’yu açın, sol üstteki Script bölmesine tıklayın ve aşağıdaki kodu yazın (ya da kopyalayıp yapıştırın). Henüz hiçbir şeyi anlamak zorunda değilsiniz — sadece kodu çalıştırın, ne olduğunu birlikte göreceğiz.
Kodun tamamı — tek seferde çalıştırın
Tüm kodu kopyalayıp RStudio’ya sağ üstteki yeni açtığımız kod yazma defterine yapıştırın
# ── Adım 1: Verileri girin ───────────────────────────────
grup_A <- c(72, 68, 75, 70, 65, 73, 69, 71, 67, 74,
70, 66, 72, 68, 71)
grup_B <- c(78, 82, 79, 85, 80, 77, 83, 81, 76, 84,
79, 82, 80, 78, 83)
# ── Adım 2: Grup ortalamalarını görün ────────────────────
cat("Grup A ortalaması:", mean(grup_A), "\n")
cat("Grup B ortalaması:", mean(grup_B), "\n")
# ── Adım 3: t-testini uygulayın ──────────────────────────
sonuc <- t.test(grup_A, grup_B)
print(sonuc)
# ── Adım 4: Grafiği çizin ────────────────────────────────
veriler <- c(grup_A, grup_B)
gruplar <- rep(c("Grup A\nGeleneksel", "Grup B\nAktif Öğrenme"), each = 15)
boxplot(veriler ~ gruplar,
col = c("#a8d5ba", "#1d6b4a"),
main = "Öğretim Yöntemi ve Başarı Puanları",
ylab = "Başarı Puanı",
border = "#1d6b4a")
Kodu nasıl çalıştırırsınız?
Tüm kodu seçin (Ctrl+A), ardından Ctrl+Enter tuşlarına basın veya kod defterinin sağ üstündeki Run tuşuna basın. Sol alttaki Console bölmesinde sonuçlar, sağ alttaki Plots bölmesinde grafik belirecek.
Ekranınızda ne çıkması gerekiyor?
Console bölmesinde şuna benzer bir çıktı göreceksiniz:
Grup A ortalaması: 70.07
Grup B ortalaması: 80.47
Welch Two Sample t-test
data: grup_A and grup_B
t = -10.832, df = 27.999, p-value = 4.44e-11
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-12.42 -8.39
sample estimates:
mean of x mean of y
70.07 80.47
Ve Plots bölmesinde şöyle bir kutu grafiği (boxplot) göreceksiniz:
Grafik çıkmadı mı?
Sağ alt köşedeki “Plots” sekmesine tıklayın. Eğer hâlâ yoksa kodu tam seçmeden çalıştırmış olabilirsiniz — tüm satırları seçip tekrar deneyin.
Peki bu sonuçlar ne anlama geliyor?
Çıktıyı birlikte okuyalım. Karmaşık görünüyor ama aslında çok az bilgiye bakmanız yeterli:
Grup A Ortalaması
70.07
Grup B Ortalaması
80.47
p değeri
0.000
| Çıktıda ne yazıyor? | Ne anlama geliyor? |
|---|---|
t = -10.832 | t istatistiği. Farkın ne kadar büyük olduğunu standart sapma cinsinden söyler. Negatif olması Grup A’nın daha düşük olduğunu gösterir — yönün önemi yok, büyüklüğüne bakın. |
df = 27.999 | Serbestlik derecesi. Örneklem büyüklüğüyle ilgili teknik bir değer. |
p-value = 4.44e-11 | Bu çok küçük bir sayı: 0.0000000000444. Yani bu farkın tesadüften kaynaklanma olasılığı yüzde milyarda birden az. Fark istatistiksel olarak anlamlı. |
95 percent confidence interval: -12.42, -8.39 | Gerçek farkın yüzde 95 olasılıkla 8.39 ile 12.42 puan arasında olduğunu söyler. Sıfırı kapsamaması farkın anlamlı olduğunu destekler. |
mean of x = 70.07 / mean of y = 80.47 | İki grubun ortalamaları. Grup B yaklaşık 10 puan daha yüksek. |
Sonucu tek cümleyle nasıl yazarsınız?
“Aktif öğrenme yöntemiyle ders gören öğrencilerin başarı puanları (M = 80.47), geleneksel yöntemle ders gören öğrencilere (M = 70.07) kıyasla istatistiksel olarak anlamlı biçimde daha yüksektir, t(28) = -10.83, p < .001.”
Grafiği okumak
Boxplot (kutu-bıyık grafiği) beş şeyi gösterir:
| Grafikte ne var? | Anlamı |
|---|---|
| Kutunun ortasındaki çizgi | Medyan (ortanca değer) |
| Kutunun alt ve üst kenarları | Değerlerin orta %50’si (1. ve 3. çeyrek) |
| Bıyıklar (çizgiler) | Uç değerlerin dışındaki geniş aralık |
| Tek noktalar | Aykırı değerler (varsa) |
Grafikte Grup B kutusunun tamamının Grup A’nın üzerinde olduğunu göreceksiniz. İki grup arasındaki fark gözle bile bellidir.
Perde arkasında neler oldu? (Merak edenler için)
Şimdiye kadar hiçbir teknik açıklama yapmadan analizi bitirdik. Ama artık bütünü gördüğünüze göre parçaları açıklayabiliriz.
c() neydi?
c() fonksiyonu sayıları bir araya toplar. R’de buna “vektör” denir. Ama bunu bilmeden de kullandınız — çünkü ne işe yaradığını bağlamdan gördünüz.
Rc() nedir?
puanlar <- c(72, 68, 75)
# Bunu şu şekilde okuyun:
# "puanlar adında bir şey oluştur, içine 72, 68, 75 koy"
<- neydi?
R’deki atama operatörü. “Sol taraftaki isme, sağ taraftaki değeri ver” demek. puanlar <- c(72, 68, 75) dediğinizde “puanlar” adlı bir nesne oluşturdunuz. Sağ üstteki Environment bölmesinde görebilirsiniz.
t.test() otomatik olarak ne yaptı?
R’de t.test() fonksiyonu iki grubu alır, aralarındaki farkı hesaplar, t istatistiğini bulur, serbestlik derecesini hesaplar, p değerini hesaplar ve güven aralığını hesaplar. Bunu elle yapmak saatler alır. R tek satırda yapar.
rep() neydi?
Grafik için grup etiketleri oluşturuyorduk. rep("Grup A", each = 15) “Grup A” yazısını 15 kez tekrarlıyor demektir. 15 puanın 15 etikete ihtiyacı var.
Artık “vektör nedir?” sorusunun cevabı anlamlı
Bir kurs “vektör, aynı türden elemanların sıralı bir koleksiyonudur” dediğinde bunu soyut bulurdunuz. Ama artık grup_A‘yı kendiniz oluşturdunuz. Vektör, işte o — puanların toplandığı liste. Bundan sonra bu kavramı unutmazsınız.
Sıradaki adımlar
Bu analizi yaptıysanız artık R konusunda şunları biliyorsunuz:
- Veri nasıl üretilir
- Ortalama nasıl hesaplanır
- t-testi nasıl yapılır ve yorumlanır
- Grafik nasıl çizilir
Bunlar küçük şeyler değil. Bir araştırma makalesi yazmak için ihtiyacınız olanların büyük bölümü bunlar.
Buradan sonra öğrenebileceğiniz konular:
| Konu | Ne zaman işinize yarar? |
|---|---|
| Eşleştirilmiş t-testi | Aynı kişilerden ön-test ve son-test aldığınızda |
| Tek yönlü ANOVA | İkiden fazla grubu karşılaştırmak istediğinizde |
| Korelasyon | İki sayısal değişken arasındaki ilişkiyi incelediğinizde |
| Regresyon | Bir değişkeni bir veya birden fazla değişkenle tahmin etmek istediğinizde |
| Faktör analizi | Anket maddelerini gruplayan gizil yapıları keşfetmek istediğinizde |
Kendi verinizle deneyin
Bu yazıdaki grup_A ve grup_B içindeki sayıları silip kendi araştırmanızdaki puanları yazın. Kodun geri kalanı değişmeden çalışır. Gerçek veriyle analiz yapmak öğrenmeyi çok daha hızlı pekiştirir.
Sorularınız mı var? Aşağıya yorum bırakabilirsiniz.
istatistik.gen.tr — Türkçe istatistik kaynağı
Bu yazı istatistik.gen.tr için otomatize edilmiş yapay zeka tarafından hazırlanmıştır.