R’ye Başlangıç:

R ile İstatistik

Vektör nedir, data frame nedir bunları unutun. Önce gerçek bir analiz yapın.

Bu yazıda neler var?

  1. Neden çoğu R kursu sizi kaybediyor?
  2. R ve RStudio kurulumu (5 dakika)
  3. Hemen bir analiz yapalım — t-testi
  4. Kodu çalıştırmak
  5. Grafiği çizmek
  6. Sonuçları yorumlamak
  7. Perde arkasında neler oldu?
  8. Sıradaki adımlar

Neden çoğu R kursu sizi kaybediyor?

R öğrenmeye çalışan çoğu kişi aynı noktada takılır. Kurs başlar, ilk ders “vektör nedir”, ikinci ders “liste nedir”, üçüncü ders “data frame nedir”… Bir süre sonra şu soru kafanıza takılır: “Bunları neden öğreniyorum?”

Bu, aslında zihnin doğal bir tepkisi. İnsan beyni anlam bağlamı oluşturmadan parçaları birbirine bağlayamaz. Önce bütünü görmeniz gerekir. Bütünü görmeyen zihin, parçaları bir yere koyamaz ve bunları kısa sürede unutur.

Gestalt ilkesi

Algı psikolojisinde Gestalt yaklaşımı şunu söyler: insan zihni parçaları önce değil, bütünü önce algılar. Bir bisiklet gördüğünüzde önce “bisiklet” görürsünüz, “iki tekerlek + sele + gidon” görmezsiniz. Öğrenmede de bu böyledir.

Bu yazıda sizi doğrudan çalışan bir analizin içine atacağım. Birkaç satır kod yazacaksınız, gerçek bir istatistiksel sonuç elde edeceksiniz, grafiği göreceksiniz. Analiz nasıl yapılır sorusunun cevabı kendiliğinden anlam kazanacak.


R ve RStudio kurulumu

İki şey kurmanız gerekiyor. Birincisi R’nin kendisi, ikincisi R’yi rahat kullanmanızı sağlayan arayüz olan RStudio.

1 R’yi kurun

cran.r-project.org adresine gidin. İşletim sisteminize (Windows / Mac / Linux) göre indirip kurun. Kurulum sihirbazı adım adım yönlendirir, hiçbir ayarı değiştirmenize gerek yok.

2 RStudio’yu kurun

posit.co/download/rstudio-desktop adresinden ücretsiz “RStudio Desktop” sürümünü indirin. Kurun ve açın.

R mi açıyorum, RStudio mu?

Her zaman RStudio‘yu açın. R arka planda çalışır, siz RStudio üzerinden onunla konuşursunuz. R’yi doğrudan açmanıza gerek yok.

RStudio ekranını tanımak

RStudio’yu ilk açtığınızda 3 bölge görürsünüz:

BölgeNe işe yarar?
Sol alt — ConsoleSonuçlar burada çıkar.
Sağ üst — EnvironmentOluşturduğunuz veriler burada listelenir.
Sağ alt — Plots/FilesGrafikler, dosyalar, yardım sayfası buradadır.

Sol üstte File yazan yere tıklayıp New File -> New Script tıklayarak yeni bir kod yazma defteri açın. Böylece ekran 4’e bölünecektir.

BölgeNe işe yarar?
Sol üst — ScriptKodunuzu buraya yazarsınız. Kayıt altına alınır.
Sol alt — ConsoleSonuçlar burada çıkar.
Sağ üst — EnvironmentOluşturduğunuz veriler burada listelenir.
Sağ alt — Plots/FilesGrafikler, dosyalar, yardım sayfası buradadır.

RStudio’da sol üst tarafa kodlar yazılır, çalıştırılması istenen kodlar seçili hale getirilir ve kodların sağ üstündeki Run tuşuna basılarak çalıştırılır.


Hemen bir analiz yapalım

Sizi teknik detaylara boğmadan doğrudan bir analize atlıyoruz. Senaryo şu:

Senaryo

Bir araştırmacı iki farklı öğretim yöntemi uygulayan iki grup öğrencinin akademik başarı puanlarını karşılaştırmak istiyor. Grup A geleneksel anlatım yöntemiyle, Grup B aktif öğrenme yöntemiyle ders gördü. Her iki grupta da 15 öğrenci var. Gruplar arasında anlamlı bir fark var mı?

Bu soruyu cevaplamak için kullanacağımız analiz: bağımsız örneklem t-testi.

Şimdi RStudio’yu açın, sol üstteki Script bölmesine tıklayın ve aşağıdaki kodu yazın (ya da kopyalayıp yapıştırın). Henüz hiçbir şeyi anlamak zorunda değilsiniz — sadece kodu çalıştırın, ne olduğunu birlikte göreceğiz.

Kodun tamamı — tek seferde çalıştırın

Tüm kodu kopyalayıp RStudio’ya sağ üstteki yeni açtığımız kod yazma defterine yapıştırın

# ── Adım 1: Verileri girin ───────────────────────────────
grup_A <- c(72, 68, 75, 70, 65, 73, 69, 71, 67, 74,
            70, 66, 72, 68, 71)

grup_B <- c(78, 82, 79, 85, 80, 77, 83, 81, 76, 84,
            79, 82, 80, 78, 83)

# ── Adım 2: Grup ortalamalarını görün ────────────────────
cat("Grup A ortalaması:", mean(grup_A), "\n")
cat("Grup B ortalaması:", mean(grup_B), "\n")

# ── Adım 3: t-testini uygulayın ──────────────────────────
sonuc <- t.test(grup_A, grup_B)
print(sonuc)

# ── Adım 4: Grafiği çizin ────────────────────────────────
veriler    <- c(grup_A, grup_B)
gruplar    <- rep(c("Grup A\nGeleneksel", "Grup B\nAktif Öğrenme"), each = 15)

boxplot(veriler ~ gruplar,
        col    = c("#a8d5ba", "#1d6b4a"),
        main   = "Öğretim Yöntemi ve Başarı Puanları",
        ylab   = "Başarı Puanı",
        border = "#1d6b4a")

Kodu nasıl çalıştırırsınız?

Tüm kodu seçin (Ctrl+A), ardından Ctrl+Enter tuşlarına basın veya kod defterinin sağ üstündeki Run tuşuna basın. Sol alttaki Console bölmesinde sonuçlar, sağ alttaki Plots bölmesinde grafik belirecek.


Ekranınızda ne çıkması gerekiyor?

Console bölmesinde şuna benzer bir çıktı göreceksiniz:

Grup A ortalaması: 70.07
Grup B ortalaması: 80.47

	Welch Two Sample t-test

data:  grup_A and grup_B
t = -10.832, df = 27.999, p-value = 4.44e-11
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -12.42  -8.39
sample estimates:
mean of x mean of y 
    70.07     80.47

Ve Plots bölmesinde şöyle bir kutu grafiği (boxplot) göreceksiniz:

Grafik çıkmadı mı?

Sağ alt köşedeki “Plots” sekmesine tıklayın. Eğer hâlâ yoksa kodu tam seçmeden çalıştırmış olabilirsiniz — tüm satırları seçip tekrar deneyin.

Peki bu sonuçlar ne anlama geliyor?

Çıktıyı birlikte okuyalım. Karmaşık görünüyor ama aslında çok az bilgiye bakmanız yeterli:

Grup A Ortalaması

70.07

Grup B Ortalaması

80.47

p değeri

0.000

Çıktıda ne yazıyor?Ne anlama geliyor?
t = -10.832t istatistiği. Farkın ne kadar büyük olduğunu standart sapma cinsinden söyler. Negatif olması Grup A’nın daha düşük olduğunu gösterir — yönün önemi yok, büyüklüğüne bakın.
df = 27.999Serbestlik derecesi. Örneklem büyüklüğüyle ilgili teknik bir değer.
p-value = 4.44e-11Bu çok küçük bir sayı: 0.0000000000444. Yani bu farkın tesadüften kaynaklanma olasılığı yüzde milyarda birden az. Fark istatistiksel olarak anlamlı.
95 percent confidence interval: -12.42, -8.39Gerçek farkın yüzde 95 olasılıkla 8.39 ile 12.42 puan arasında olduğunu söyler. Sıfırı kapsamaması farkın anlamlı olduğunu destekler.
mean of x = 70.07 / mean of y = 80.47İki grubun ortalamaları. Grup B yaklaşık 10 puan daha yüksek.

Sonucu tek cümleyle nasıl yazarsınız?

“Aktif öğrenme yöntemiyle ders gören öğrencilerin başarı puanları (M = 80.47), geleneksel yöntemle ders gören öğrencilere (M = 70.07) kıyasla istatistiksel olarak anlamlı biçimde daha yüksektir, t(28) = -10.83, p < .001.”

Grafiği okumak

Boxplot (kutu-bıyık grafiği) beş şeyi gösterir:

Grafikte ne var?Anlamı
Kutunun ortasındaki çizgiMedyan (ortanca değer)
Kutunun alt ve üst kenarlarıDeğerlerin orta %50’si (1. ve 3. çeyrek)
Bıyıklar (çizgiler)Uç değerlerin dışındaki geniş aralık
Tek noktalarAykırı değerler (varsa)

Grafikte Grup B kutusunun tamamının Grup A’nın üzerinde olduğunu göreceksiniz. İki grup arasındaki fark gözle bile bellidir.


Perde arkasında neler oldu? (Merak edenler için)

Şimdiye kadar hiçbir teknik açıklama yapmadan analizi bitirdik. Ama artık bütünü gördüğünüze göre parçaları açıklayabiliriz.

c() neydi?

c() fonksiyonu sayıları bir araya toplar. R’de buna “vektör” denir. Ama bunu bilmeden de kullandınız — çünkü ne işe yaradığını bağlamdan gördünüz.

Rc() nedir?

puanlar <- c(72, 68, 75)
# Bunu şu şekilde okuyun:
# "puanlar adında bir şey oluştur, içine 72, 68, 75 koy"

<- neydi?

R’deki atama operatörü. “Sol taraftaki isme, sağ taraftaki değeri ver” demek. puanlar <- c(72, 68, 75) dediğinizde “puanlar” adlı bir nesne oluşturdunuz. Sağ üstteki Environment bölmesinde görebilirsiniz.

t.test() otomatik olarak ne yaptı?

R’de t.test() fonksiyonu iki grubu alır, aralarındaki farkı hesaplar, t istatistiğini bulur, serbestlik derecesini hesaplar, p değerini hesaplar ve güven aralığını hesaplar. Bunu elle yapmak saatler alır. R tek satırda yapar.

rep() neydi?

Grafik için grup etiketleri oluşturuyorduk. rep("Grup A", each = 15) “Grup A” yazısını 15 kez tekrarlıyor demektir. 15 puanın 15 etikete ihtiyacı var.

Artık “vektör nedir?” sorusunun cevabı anlamlı

Bir kurs “vektör, aynı türden elemanların sıralı bir koleksiyonudur” dediğinde bunu soyut bulurdunuz. Ama artık grup_A‘yı kendiniz oluşturdunuz. Vektör, işte o — puanların toplandığı liste. Bundan sonra bu kavramı unutmazsınız.


Sıradaki adımlar

Bu analizi yaptıysanız artık R konusunda şunları biliyorsunuz:

  • Veri nasıl üretilir
  • Ortalama nasıl hesaplanır
  • t-testi nasıl yapılır ve yorumlanır
  • Grafik nasıl çizilir

Bunlar küçük şeyler değil. Bir araştırma makalesi yazmak için ihtiyacınız olanların büyük bölümü bunlar.

Buradan sonra öğrenebileceğiniz konular:

KonuNe zaman işinize yarar?
Eşleştirilmiş t-testiAynı kişilerden ön-test ve son-test aldığınızda
Tek yönlü ANOVAİkiden fazla grubu karşılaştırmak istediğinizde
Korelasyonİki sayısal değişken arasındaki ilişkiyi incelediğinizde
RegresyonBir değişkeni bir veya birden fazla değişkenle tahmin etmek istediğinizde
Faktör analiziAnket maddelerini gruplayan gizil yapıları keşfetmek istediğinizde

Kendi verinizle deneyin

Bu yazıdaki grup_A ve grup_B içindeki sayıları silip kendi araştırmanızdaki puanları yazın. Kodun geri kalanı değişmeden çalışır. Gerçek veriyle analiz yapmak öğrenmeyi çok daha hızlı pekiştirir.


Sorularınız mı var? Aşağıya yorum bırakabilirsiniz.
istatistik.gen.tr — Türkçe istatistik kaynağı

Bu yazı istatistik.gen.tr için otomatize edilmiş yapay zeka tarafından hazırlanmıştır.

Similar Posts

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir