Evet, detaylandırmama izin verin.
Bazı sonuç için $ y_i \ in \ mathbb {R}, \ forall i = 1,2, .., n $ için MSE ve $ \ textrm {R} ^ 2 $ 'ı
olarak tanımladığımızı hatırlayın
\ {denklem} başla
\ textrm {MSE} (y, \ hat {y}) = \ frac {1} {n} \ sum_ {i = 1} ^ {n} (y_i - \ hat {y}) ^ {2}
\ end {denklem}
\ {denklem} başla
\ textrm {R} ^ 2 (y, \ hat {y}) = 1 - \ frac {\ sum_ {i = 1} ^ {n} (y_i - \ hat {y}) ^ {2}} {\ sum_ {i = 1} ^ {n} (y_i - \ bar {y}) ^ {2}}
\ end {denklem}
Sizin de belirttiğiniz gibi, $ \ textrm {R} ^ 2 $ MSE'nin normalleştirilmiş bir sürümüdür, raporlama için MSE kullanıyoruz çünkü bunun basit bir ölçü olduğunu ve teknik olarak en aza indirdiğimizde en aza indirdiğimiz kayıp fonksiyonu olduğunu düşünüyorum. normal denklemleri çözer.
$ \ textrm {R} ^ 2 $, verilerin ölçeğine bağlı olmadığı için yorumlanması genellikle daha kolay olduğu için kullanışlıdır.
Somut bir örnek olarak, iki model düşünün: biri geliri, diğeri yaşı tahmin eden $ \ textrm {R} ^ 2 $, hangi modelin daha iyi performans gösterdiğini belirtmeyi kolaylaştıracak *.
* Genel olarak, bu harika bir fikir değildir ve bu tür iddialarda bulunmak için farklı modellerde $ \ textrm {R} ^ 2 $ gibi ölçümleri karşılaştırmamalısınız çünkü bazı şeyler temelde tahmin edilmesi diğerleri (örneğin, borsalar ve Titanik'ten sağ kurtulanlar).