Single Pages

Monday, 10 August 2015

Veri Altkümeleri(Subset) Düzenleme ve Listeleme (R&RStudio)

Veri Alt Kümeleri(Subset) Oluşturmak, Düzenlemek ve Listelemek 


R programlama dilinde, elimizdeki verileri alt kümeler halinde listelemek için aşağıdaki adımları kullanabiliriz.


#Uygulama yapacağımız ilk veriseti hsb2

hsb2<-read.table("http://www.ats.ucla.edu/stat/data/hsb2.csv", sep=",", header=T)

#write kolonundaki 60'dan büyük değerleri listeler
yazma <- subset(hsb2, write > 60) 


#write kolunundaki 60'a eşit ve büyük değerler, read kolonunda 70'e eşit ve büyük değerleri listeler
# race, prog, write, read kolonlarını da beraber listeler
yazma_okuma <- subset(hsb2, write >= 60 & read >= 70, select = c("race", "prog", "write", "read"))



#airquality veriseti uygulamaları
attach(airquality)


#Ozone kolonundaki boş değerleri (missing values) listelemek ve kaç tane olduğunu görmek

sum(is.na(Ozone)) #Ozone kolonundaki NA değerlerinin sayısını gösterir.
summary(airquality$Ozone) #Buradan da NA değerlerini görebiliriz.

#Ozone kolonundaki değerlerin ortalamasını bulmak
mean(airquality$Ozone, na.rm=T)

#Temp kolonundaki 90'dan büyük değerleri listelemek
temp_90lar <- subset(airquality, Temp > 90)


#Ozone kolonundaki 31'den büyük ve Temp kolonundaki 90dan büyük değerleri hesaplayıp ve Ozone, Temp, Solar.R kolonlarını listelemek
ozon_30_temp90lar<- subset(airquality, Ozone >31 & Temp > 90, select = c(Ozone, Temp, Solar.R))

#Bu alt kümenin Solar.R kolunundaki değerler ortalaması 
mean(ozon_30_temp90lar$Solar.R, na.rm=T)

#Yalnızca, Haziran Ayındaki (6.Ay) verileri listelemek (Month kolonu)

haziran_degerleri <- subset(airquality, Month == 6)


#Yalnızca, Mayıs Ayını(5.Ay) verilerini listeleyip, Ozone kolonundaki max değeri bulmak
mayis_hava <- subset(airquality, Month == 5)
max(mayis_hava$Ozone, na.rm=T)
mean(mayis_hava$Ozone, na.rm=T) #Aynı alt kümdeki Ozone kolonunun ortalamasını almak

hava_kalitesi <- airquality

#Yalnızca Eylül Ayının(9.Ay) Verilerini seçip, Ozone kolonunu listelemek
alt_kume1 <- subset(hava_kalitesi, Month==9, select = c("Ozone"))
alt_kume2 <- is.na(alt_kume1)  #NA değerlerini tanımlama
alt_kume3 <- alt_kume1[!alt_kume2] #NA dışındaki verileri seçme 
mean(alt_kume3 ) #Yeni alt kümenin ortalamasını


Sefa Şahin Blog

Comments

No comments:

Post a Comment

Related Posts Plugin for WordPress, Blogger...