Veri Alt Kümeleri(Subset) Oluşturmak, Düzenlemek ve Listelemek
#Uygulama yapacağımız ilk veriseti hsb2
hsb2<-read.table("http://www.ats.ucla.edu/stat/data/hsb2.csv", sep=",", header=T)
#write kolonundaki 60'dan büyük değerleri listeler
yazma <- subset(hsb2, write > 60)
#write kolunundaki 60'a eşit ve büyük değerler, read kolonunda 70'e eşit ve büyük değerleri listeler
# race, prog, write, read kolonlarını da beraber listeler
yazma_okuma <- subset(hsb2, write >= 60 & read >= 70, select = c("race", "prog", "write", "read"))
#airquality veriseti uygulamaları
attach(airquality)
#Ozone kolonundaki boş değerleri (missing values) listelemek ve kaç tane olduğunu görmek
sum(is.na(Ozone)) #Ozone kolonundaki NA değerlerinin sayısını gösterir.
summary(airquality$Ozone) #Buradan da NA değerlerini görebiliriz.
#Ozone kolonundaki değerlerin ortalamasını bulmak
mean(airquality$Ozone, na.rm=T)
#Temp kolonundaki 90'dan büyük değerleri listelemek
temp_90lar <- subset(airquality, Temp > 90)
#Ozone kolonundaki 31'den büyük ve Temp kolonundaki 90dan büyük değerleri hesaplayıp ve Ozone, Temp, Solar.R kolonlarını listelemek
ozon_30_temp90lar<- subset(airquality, Ozone >31 & Temp > 90, select = c(Ozone, Temp, Solar.R))
#Bu alt kümenin Solar.R kolunundaki değerler ortalaması
mean(ozon_30_temp90lar$Solar.R, na.rm=T)
#Yalnızca, Haziran Ayındaki (6.Ay) verileri listelemek (Month kolonu)
haziran_degerleri <- subset(airquality, Month == 6)
#Yalnızca, Mayıs Ayını(5.Ay) verilerini listeleyip, Ozone kolonundaki max değeri bulmak
mayis_hava <- subset(airquality, Month == 5)
max(mayis_hava$Ozone, na.rm=T)
mean(mayis_hava$Ozone, na.rm=T) #Aynı alt kümdeki Ozone kolonunun ortalamasını almak
hava_kalitesi <- airquality
#Yalnızca Eylül Ayının(9.Ay) Verilerini seçip, Ozone kolonunu listelemek
alt_kume1 <- subset(hava_kalitesi, Month==9, select = c("Ozone"))
alt_kume2 <- is.na(alt_kume1) #NA değerlerini tanımlama
alt_kume3 <- alt_kume1[!alt_kume2] #NA dışındaki verileri seçme
mean(alt_kume3 ) #Yeni alt kümenin ortalamasını
Sefa Şahin Blog