Single Pages

Wednesday 29 October 2014

R ve RStudio' da Regresyon Analizi Yapmak

R ve RStudio' da Regresyon Analizi Yapmak



R programlama dili aracılığıyla, gözlem değerlerimiz arasında doğrusal regresyon analizi yapmak


getwd()   #Çalışma dizinimizi görmek için bu komutu kullanıyoruz
setwd   ("C:/Users/SEFA/Documents/Veri")   #Çalışma dizinini değiştiriyoruz

rm(list=ls())     #rm "remove" manasinda kullaniliyor ve degiskenleri temizliyor.
list.files()     #Çalışma dizinindeki dosyaları listeliyoruz

hava_kalitesi <- read.csv("airquality_2014.csv",header=TRUE,sep=",")    
#dosya adı kullanmak yerine kendi belirlediğimiz bir değişken adını dosyayı okuması için atıyoruz.

#değişken adını istediğimiz gibi belirleyebiliriz bu çalışmadaki değişken adı hava_kalites olarak düzenlendi

#bu noktadan itibaren "hava_kalitesi" yazdığımızda, direkt olarak airquality_2014.csv dosyasındaki değerler listelenir.

names(hava_kalitesi) #bu komut sayesinde dosyamızdaki HEADER etiketleri listelenir.
hava_kalitesi$Temp #komutu Temp sütunundaki tüm gözlem değerlerini listeler.
mean(hava_kalitesi$Temp) #Temp sütunundaki gözlem değerlerinin ortalamasını verir.
sd(hava_kalitesi$Temp) #Temp sütunundaki gözlem değerlerinin Standart Sapmasını verir.
var(hava_kalitesi$Temp) #Temp sütunundaki gözlem değerlerinin Varyasını verir.

#Regresyon analizi yapmak icin lm komutunu kullanacağız. lm anlam olarak linear model manasına gelmektedir.

regresyon <- lm(Temp~Wind) 

Error in eval(expr, envir, enclos) : object 'Temp' not found

Hata oluştu: eval(expr, envir, enclos) : 'Temp' nesnesi bulunamadı

#yukardaki hatanın nedeni bağımsız değişkeni tanımlamadığımızdan kaynaklanıyor.
#kullanacağımız değişken dosyasında 4 farklı gözlem verileri mevcut. Temp, Ozone, Solar.R ve Wind
#Bu nedenle değişkenleri tek tek tanımlayalım.


y <- hava_kalitesi$Temp   #bağımlı değişken olarak seçelim
x1 <- hava_kalitesi$Ozone   #bağımsız değişken I
x2 <- hava_kalitesi$Solar.R   #bağımsız değişken II
x3 <- hava_kalitesi$Wind    #bağımsız değişken III

#değişkenleri ataması tamamlandı.

regresyon <- lm(y~x1+x2+x3) #modeli çalıştırmak için bu komutu kullanıyoruz.

regresyon #regresyon analizi sonuçlarını görmek için


Call:
  lm(formula = y ~ x1 + x2 + x3)

Coefficients:
  (Intercept)           x1           x2           x3 
72.418579     0.171966     0.007276    -0.322945 



summary(regresyon)  # t degelerini P degeleri ve F istatistik degelerini gormek icin

Call:
  lm(formula = y ~ x1 + x2 + x3)

Residuals:
  Min      1Q  Median      3Q     Max
-20.942  -4.996   1.283   4.434  13.168

Coefficients:
  Estimate Std. Error t value Pr(&gt;|t|)   
(Intercept) 72.418579   3.215525  22.522  &lt; 2e-16 ***
  x1           0.171966   0.026390   6.516 2.42e-09 ***
  x2           0.007276   0.007678   0.948    0.345   
x3          -0.322945   0.233264  -1.384    0.169   
---
  Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 6.834 on 107 degrees of freedom
Multiple R-squared:  0.4999, Adjusted R-squared:  0.4858
F-statistic: 35.65 on 3 and 107 DF,  p-value: 4.729e-16



hata_terimleri <- regresyon$residuals  #hata terimlerini görmek için

hata_terimleri  

hata_terimleri <- cbind(hata_terimleri) #hataları tek sütunda görmek için

hata_terimleri 

par(mar=c(4,4,2,0.5),mfrow=c(2,2)) #RStudio 'nun hata vermemesi için grafik düzenlemek için

plot(regresyon) #komutu sayesinde 4lü grafik çizelim.




Blog Format Code: http://formatmysourcecode.blogspot.co.uk

R (programming language): https://www.r-project.org/about.html
 http://en.wikipedia.org/wiki/R_(programming_language)

Comments

No comments:

Post a Comment

Related Posts Plugin for WordPress, Blogger...