Başka birinin R koduna bakarak doğrusal regresyon modelleri oluşturmayı öğreniyorum. İşte kullandığım örnek veriler:
v1 v2 v3 response0.417655013 -0.012026453 -0.528416414 48.55555556-0.018445979 -0.460809371 0.054017873 47.76666667-0.246110341 0.054017873 47.76666667-0.246110341 0.09223015944.5333968 0,224215856 -0,153917427 48.977777780.41522316 0,050609412 -0,642394965 48.5-0.07349941 0,547128578 -0,539018121 53.95555556-0.313950353 0,207853678 0,713903994 48.166666670.404643796 -0,326782199 -0,785848428 47.70.028246796 -0,424323318 0,289313911 49.344444440.720822953 -0,166712488 0,323246062 50.78888889-0.430825851 -0,308119827 0,543823856 52.65555556-0.964175294 0,661700584 - 0.11905972 51.03333333-0.178955757 -0.11148414 -0.151179885 48.288888890.488388035 0.515903257 -0.087738159 48.68888889-0.097527627 0.188292773 0.207321888 -0.097527627 0.1885502773 0.20732279375 5560.104077762 0.16075114 -0.131124443 48.61111111
Verileri okudum ve bir model oluşturmak için lm ()
çağrısı yapıyorum:
> my_data<- read.table ("data.csv", header = T, sep = ",") > my_lm <- lm (yanıt ~ v1 + v2 + v3 + v1: v2 + v1: v3 + v2: v3, data = my_data) > özeti (my_lm) Çağrı: lm (formül = yanıt ~ v1 + v2 + v3 + v1: v2 + v1: v3 + v2: v3, data = my_data) Kalıntılar: Min 1Q Medyan 3Q Maks -2.0603 -0.6615 -0.1891 1.0395 1.8280 Katsayılar: Tahmin Std. Hata t değeri Pr (> | t |) (Kesişme) 49.33944 0.42089 117.226 < 2e-16 *** v1 0.06611 0.82320 0.080 0.93732 v2 -0.36725 1.06359 -0.345 0.73585 v3 0.72741 1.00973 0.720 0.48508 v1: v2.532.148
v1: v3 0.80641 2.77603 0.290 0.77640 v2: v3 -12.16017 3.62473 -3.355 0.00573 ** --- Signif. kodlar: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1 Kalan standart hata: 12 serbestlik derecesinde 1.375 Çoklu R-kare: 0.697, Düzeltilmiş R-kare: 0.5455 F-istatistiği: 6 ve 12 DF'de 4.6, p-değeri: 0.01191
Kodlarının ardından anova ()
için bir çağrı kullanıyorum:
> my_lm_anova <- anova (my_lm) > my_lm_anova Varyans Analizi Tablosu Yanıt: yanıt Df Sum Sq Ortalama Sq F değeri Pr (>F) v1 1 0,0010 0,0010 080 0,75 v1: v2 1 4.3653 4.3653 2.3084 0.154573 v1: v3 1 16.4582 16.4582 8.7034 0.012141 * v2: v3 1 21.2824 21.2824 11.2545 0.005729 ** Kalıntılar 12 22.6921 1.8910 --- Signif. kodlar: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1
Yine de emin değilim:
- Bu durumda neden ANOVA çağrısını kullanmalıyım ve
- ANOVA tablosu bana tahmin değişkenleri hakkında ne söylüyor?
Koddan ANOVA tablosunu aşağıdaki gibi kullanıyor görünmektedir. Öngörücü değişkeni v1 için,
- v1 için 'Sum Sq' girişini v1: v2 için 'Sum Sq' girişinin yarısı ve 'Sum Sq' girişinin yarısı ile birlikte ekleme v1: v3 için,
- Tüm 'Sum Sq' sütununun toplamına bölünmesi ve
- 100 ile çarpılması
yüzdeyi verir lm ()
modelinde tahmin değişkeni v1 ile açıklanan yanıt değişkeninin varyansı. Neden bunun neden olduğunu ve v1: v2 için 'Sum Sq' girişinin yarısının v1'e ve yarısının v2'ye atfedildiğini anlamıyorum. Bu sadece kolaylık mı?