R Veri Türleri Nelerdir Konu Anlatımı

R programlama diline girişte en temel ve en önemli konulardan biri veri türleridir. RStudio’da çalışırken verileri doğru tanımlamak, analizin sağlığı için kritiktir. Eğer sayısal bir işlemi metin gibi tanıtırsanız, R size hata verecektir. Bu yüzden, değişkenlerimizi (variables) oluştururken hangi “kutunun” içine koyduğumuzu iyi bilmeliyiz.

Bu dersimizde, derste kullandığımız örnekler üzerinden R’daki temel veri tiplerini inceleyeceğiz.

Atama Operatörü: Veriyi Kaydetmek

Öncelikle bir veriyi R’a nasıl tanıttığımızı hatırlayalım. R dilinde bir değeri bir isme atamak için <- işaretini kullanırız. Mantık şudur: degiskenAdı <- deger

Şimdi gelin, bu değerlerin türlerine bakalım.

1. Karakter Veri Tipi (Character – String)

Eğer R’a bir metin, isim veya yazı girmek istiyorsak bu veri tipini kullanırız. Burada en önemli kural tırnak işaretleridir. R, tırnak içindeki her şeyi yazı olarak algılar.

Örneğin bir isim soyisim değişkeni oluşturalım: adSoyad <- "Barış Melisa"

Burada R, “Barış Melisa” ifadesini bir metin (character) olarak hafızasına alır.

Dikkat Edilmesi Gereken Nokta: Bazen sayılar da karakter olarak kaydedilebilir. Eğer bir sayıyı tırnak içine alırsanız, R onunla matematiksel işlem yapamaz. listeFiyati <- "5"
emailAdress <- "abc@abc.com"

Yukarıdaki listeFiyati örneğinde “5” yazsak bile tırnak olduğu için bu artık sayısal bir 5 değil, yazı olan “5”tir.

2. Sayısal Veri Tipi (Numeric)

Matematiksel işlemler yapacağımız sayılar bu gruba girer. R’da sayılar genellikle iki alt başlıkta incelenir ama genel olarak “numeric” olarak bilinirler.

Genel Sayılar (Numeric/Double): Ondalıklı veya tam sayı fark etmeksizin standart sayı atamasıdır. arabaFiyati <- 500

Eğer ondalıklı (küsüratlı) bir sayı gireceksek nokta kullanırız: arabaFiyati2 <- 500.75

Burada arabaFiyati2 değişkeni “double” (çift hassasiyetli sayı) olarak tutulur. typeof(arabaFiyati2) koduyla kontrol ettiğimizde R bize bunun tipini söyleyecektir. Ayrıca as.double() gibi fonksiyonlarla bir veriyi zorla ondalıklı sayıya dönüştürebiliriz.

Tam Sayılar (Integer): Eğer bir sayının kesinlikle tam sayı (integer) olduğunu belirtmek istiyorsak, sayının sonuna büyük “L” harfi koyarız. Bu, R’a “bunu ondalıklı olarak değil, tam sayı olarak sakla” demektir. evFiyati <- 400L

3. Mantıksal Veri Tipi (Logical – Boolean)

Bilgisayar dilinde durumlar genellikle siyah veya beyazdır; yani ya Doğru’dur ya da Yanlış. R’da bunu TRUE (Doğru) ve FALSE (Yanlış) ifadeleriyle belirtiriz.

Örneğin, bir kişinin arabası olup olmadığını sorguladığımızı düşünelim: arabanVarmi <- TRUE

Bunu kısaltarak sadece baş harfiyle de yazabiliriz, R bunu da anlar: arabanVarmi3 <- T

Eğer durum olumsuzsa: arabanVarmi2 <- FALSE

Bu veri tipi, ileride “Eğer bu doğruysa şunu yap” (if-else) gibi koşullu ifadeler kurarken çok işimize yarayacak.

4. Eksik ve Boş Veri Tipleri (NA ve NULL)

Bu iki kavram sıkça karıştırılır ancak aralarında önemli bir fark vardır.

NA (Not Available – Eksik Veri): Veri setinde o hücrenin yeri vardır ama içi boştur. Yani bir anket düşünün, kişi o soruyu cevapsız bırakmış. Veri kayıp ama yer tutuyor. hizKontrol <- NA

NULL (Yokluk): NULL ise tam anlamıyla “hiçlik”tir. O veri veya o alan hiç var olmamış gibi davranılır. Genellikle bir veri setinden bir sütunu tamamen silmek veya yok etmek için kullanılır. data$kolon1 <- NULL

Bu kod çalıştığında kolon1 içindeki veriler boşalmaz, kolon1 tamamen veri setinden silinir.

Özetle

RStudio’da kod yazarken adSoyad gibi metinleri tırnak içinde, arabaFiyati gibi sayıları tırnaksız, TRUE/FALSE gibi mantıksal sorguları ise büyük harflerle yazmaya özen gösterin. NA verinin eksik olduğunu, NULL ise o yapının tamamen yok edildiğini ifade eder.

Make with R olarak, takıldığınız noktalarda size yardımcı olmak için buradayız. Bizimle iletişime geçmekten ve bire bir online derslerimizden yararlanmak için mesaj atmaktan çekinmeyin.