Soru:
Doğrusal regresyonda, bağımsız ve bağımlı değişken arasındaki ilişkinin doğrusal olup olmadığını değerlendirmek için $ R ^ 2 $ değeri yeterli midir?
question
2011-10-05 02:54:21 UTC
view on stackexchange narkive permalink

Doğrusal regresyonda, bağımsız ve bağımlı değişken arasındaki ilişkinin doğrusal olup olmadığını değerlendirmek için $ R ^ 2 $ değeri yeterli midir? Bağımsız değişken tarafından açıklanan bağımlı değişkendeki değişkenlik miktarını verir. Artıkları x değerine veya artıkları y değerine karşı çizebileceğinizi ve bir model olup olmadığına bakabileceğinizi biliyorum (bir model varsa, ilişki doğrusal değildir). Ancak korelasyon katsayısı doğrusallık hakkında yeterli bilgi vermiyor mu?

üç yanıtlar:
#1
+15
Henry
2011-10-05 03:58:07 UTC
view on stackexchange narkive permalink

Anscombe'un dörtlüsüne bakarsanız, aynı $ r ^ 2 $, ortalamalara ve varyanslara sahip gürültülü doğrusal, aykırı değerlerle doğrusal ve doğrusal olmayan veri kümeleri örneklerini görebilirsiniz.

Bu resim enter image description here

Wikipedia makalesindendir
+1 To be contrary or irksome, one might argue that in some sense the last three are all "equally" non-linear, but the contrast with the first one (which is a classic linear scatterplot) speaks volumes.
#2
+6
whuber
2011-10-05 03:07:16 UTC
view on stackexchange narkive permalink

Genellikle hayır. Model

$$ y_i = \ beta + \ varepsilon_i, $$

$ \ varepsilon \ sim \ text {iid} $, $ \ mathbb {E} [\ varepsilon] = $ (Y_i) $ ve $ (x_i) $ arasındaki ilişki için = 0 $ tamamen doğrusaldır, ancak $ r ^ 2 $ sıfır vardır.

Diğer örnekler için $ r ^ 2 $ 'ın doğrusallık hakkında söylemediği şeyler için $ R ^ 2 $ yararlı mı yoksa tehlikeli mi? adresindeki cevabımdaki resimlere bakın.

Doğrusallık genellikle şu şekilde değerlendirilir: uyum testinin iyiliği; örneğin, bir sonraki regresyona ek terimler ekleyerek ve bunların uygulamada hem önemli hem de önemli olup olmadıklarını test ederek. Bir kişinin doğrusal olmaması, yalnızca başka bir kişinin rastlantısallığıdır, dolayısıyla çok amaçlı bir yöntem yoktur. Yine de, genellikle $ r ^ 2 $ çok kabadır.

Öyleyse bir dağılım grafiğine bakmak iyi mi (veya bir artık grafiğe bakmak)?
@question Evet, bir kalıntı * vs * uyum grafiği size çok şey anlatabilir.
Kalan ve uyum grafiğinde bir model varsa ..... doğrusal olmama mı?
AilikaksxsCMT If it (a) is a pattern in which the *mean* residual varies and (b) it would be unacceptable to treat that pattern as random, then--practically by definition--there is nonlinearity. Some patterns do *not* indicate lack of linearity but suggest other phenomena such as heteroscedasticity, outliers, or high-leverage points, so we shouldn't assume *all* deviations from randomness are evidence of nonlinearity.
#3
+4
StasK
2011-10-05 04:30:01 UTC
view on stackexchange narkive permalink

Yukarıdaki cevaplara ek olarak, genel regresyon doğrusal olmama testi için yaygın olarak kullanılan (ekonometride) bir test Ramsey RESET testidir. Ana regresyonunuzu çalıştırdığınızı ve içinde $ \ hat \ epsilon_i $ artıkları ve buna uyan $ \ hat y_i $ değerleri elde ettiğinizi varsayalım. O halde RESET testi, $ \ hat y_i $ 'ın üsleri üzerinde $ \ hat \ epsilon_i $ yardımcı regresyonunun genel öneminin testidir. Regresyon geometrisinden, $ \ hat \ epsilon_i $ değerinin sıfırıncı ve $ \ hat y_i $ değerinin ilk kuvvetinin ortogonal olduğunu zaten biliyoruz, bu yüzden onu $ \ hat \ epsilon_i \ sim \ hat y_i ^ 2 olarak çalıştırmak mantıklıdır + \ hat y_i ^ 3 + \ ldots $, R benzeri sözde kodda. Test, R'de lmtest paketinde resettest olarak ve gerileme sonrasında estat ovtest olarak Stata'da uygulanır.



Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...