R ve RStudio' da Regresyon Analizi Yapmak
R programlama dili aracılığıyla, gözlem değerlerimiz arasında doğrusal regresyon analizi yapmak
getwd() #Çalışma dizinimizi görmek için bu komutu kullanıyoruz
setwd ("C:/Users/SEFA/Documents/Veri") #Çalışma dizinini değiştiriyoruz
rm(list=ls()) #rm "remove" manasinda kullaniliyor ve degiskenleri temizliyor.
list.files() #Çalışma dizinindeki dosyaları listeliyoruz
hava_kalitesi <- read.csv("airquality_2014.csv",header=TRUE,sep=",")
#dosya adı kullanmak yerine kendi belirlediğimiz bir değişken adını dosyayı okuması için atıyoruz.
#değişken adını istediğimiz gibi belirleyebiliriz bu çalışmadaki değişken adı hava_kalites olarak düzenlendi
#bu noktadan itibaren "hava_kalitesi" yazdığımızda, direkt olarak airquality_2014.csv dosyasındaki değerler listelenir.
names(hava_kalitesi) #bu komut sayesinde dosyamızdaki HEADER etiketleri listelenir.
hava_kalitesi$Temp #komutu Temp sütunundaki tüm gözlem değerlerini listeler.
mean(hava_kalitesi$Temp) #Temp sütunundaki gözlem değerlerinin ortalamasını verir.
sd(hava_kalitesi$Temp) #Temp sütunundaki gözlem değerlerinin Standart Sapmasını verir.
var(hava_kalitesi$Temp) #Temp sütunundaki gözlem değerlerinin Varyasını verir.
#Regresyon analizi yapmak icin lm komutunu kullanacağız. lm anlam olarak linear model manasına gelmektedir.
regresyon <- lm(Temp~Wind)
Error in eval(expr, envir, enclos) : object 'Temp' not found
Hata oluştu: eval(expr, envir, enclos) : 'Temp' nesnesi bulunamadı
#yukardaki hatanın nedeni bağımsız değişkeni tanımlamadığımızdan kaynaklanıyor.
#kullanacağımız değişken dosyasında 4 farklı gözlem verileri mevcut. Temp, Ozone, Solar.R ve Wind
#Bu nedenle değişkenleri tek tek tanımlayalım.
y <- hava_kalitesi$Temp #bağımlı değişken olarak seçelim
x1 <- hava_kalitesi$Ozone #bağımsız değişken I
x2 <- hava_kalitesi$Solar.R #bağımsız değişken II
x3 <- hava_kalitesi$Wind #bağımsız değişken III
#değişkenleri ataması tamamlandı.
regresyon <- lm(y~x1+x2+x3) #modeli çalıştırmak için bu komutu kullanıyoruz.
regresyon #regresyon analizi sonuçlarını görmek için
Call:
lm(formula = y ~ x1 + x2 + x3)
Coefficients:
(Intercept) x1 x2 x3
72.418579 0.171966 0.007276 -0.322945
summary(regresyon) # t degelerini P degeleri ve F istatistik degelerini gormek icin
Call:
lm(formula = y ~ x1 + x2 + x3)
Residuals:
Min 1Q Median 3Q Max
-20.942 -4.996 1.283 4.434 13.168
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 72.418579 3.215525 22.522 < 2e-16 ***
x1 0.171966 0.026390 6.516 2.42e-09 ***
x2 0.007276 0.007678 0.948 0.345
x3 -0.322945 0.233264 -1.384 0.169
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 6.834 on 107 degrees of freedom
Multiple R-squared: 0.4999, Adjusted R-squared: 0.4858
F-statistic: 35.65 on 3 and 107 DF, p-value: 4.729e-16
hata_terimleri <- regresyon$residuals #hata terimlerini görmek için
hata_terimleri
hata_terimleri <- cbind(hata_terimleri) #hataları tek sütunda görmek için
hata_terimleri
par(mar=c(4,4,2,0.5),mfrow=c(2,2)) #RStudio 'nun hata vermemesi için grafik düzenlemek için
plot(regresyon) #komutu sayesinde 4lü grafik çizelim.
Blog Format Code: http://formatmysourcecode.blogspot.co.uk
R (programming language): https://www.r-project.org/about.html
http://en.wikipedia.org/wiki/R_(programming_language)