Soru:
kovaryans -150 ise, iki değişken arasındaki ilişki türü nedir?
Sameera
2017-07-27 13:36:22 UTC
view on stackexchange narkive permalink

İki değişkenin kovaryansı -150 olarak hesaplandı.İstatistikler iki değişken arasındaki ilişki hakkında ne anlatıyor?

Kovaryanslar birimden bağımsız değildir, bu nedenle ham sayısal değer kendi başına anlam ifade etmez.0'dan küçük olmasının yanı sıra söylenecek pek bir şey yok.
Değişkenimin ortalama değeri 317 $.Büyük mü küçük mü?
Iki yanıtlar:
Stephan Kolassa
2017-07-27 14:33:16 UTC
view on stackexchange narkive permalink

Łukasz Deryło'nun cevabına eklemek için: yazarken, -150'lik bir kovaryans negatif bir ilişkiye işaret ediyor. Bunun güçlü bir ilişki mi yoksa zayıf bir ilişki mi olduğu değişkenlerin varyanslarına bağlıdır. Aşağıda, güçlü bir ilişki için örnekler çiziyorum (her ayrı değişkenin varyansı 200'dür, dolayısıyla kovaryans, varyansa kıyasla mutlak terimlerle büyüktür) ve zayıf bir ilişki için (her varyans 2000'dir, dolayısıyla kovaryans küçüktür) , mutlak terimlerle, varyansa kıyasla).

Güçlü ilişki, varyans <- 200 :

strong relationship

Zayıf ilişki, varyans <- 2000 :

enter image description here

R kodu:

  kitaplığı (MASS)

nn <- 100
epsilon <- 0.1
varyans <- 2000 # zayıf ilişki

opar <- par (mfrow = c (2,2))
    için (1: 4'te ii) {
        while (TRUE) {
            veri kümesi <- mvrnorm (n = 100, mu = c (0,0), Sigma = rbind (c (2000, -150), c (-150,2000)))
            eğer (abs (cov (veri kümesi) [1,2] - (- 150)) < epsilon) kırılır
        }
        plot (veri kümesi, pch = 19, xlab = "", ylab = "", ana = yapıştır ("Kovaryans:", cov (veri kümesi) [1,2]))
    }
par (opar)
 

DÜZENLE: Anscombe'un dörtlüsü

Whuber'ın belirttiği gibi, kovaryansın kendisi bize bir veri kümesi hakkında pek bir şey söylemiyor. Örnek olarak, Anscombe'un dörtlüsünü alıp biraz değiştireceğim. Çok farklı dağılım grafiklerinin hepsinin -150'lik aynı (yuvarlanmış) kovaryansa sahip olabileceğine dikkat edin:

Anscombe

  anscombe.mod <- anscombe
anscombe.mod [, c ("x1", "x2", "x3", "x4")] <- sqrt (150 / 5.5) * anscombe [, c ("x1", "x2", "x3", "x4")]
anscombe.mod [, c ("y1", "y2", "y3", "y4")] <- -sqrt (150 / 5.5) * anscombe [, c ("y1", "y2", "y3" , "y4")]
opar <- par (mfrow = c (2,2))
    ile (anscombe.mod, plot (x1, y1, pch = 19, ana = yapıştır ("Kovaryans:", yuvarlak (cov (x1, y1), 0))))
    ile (anscombe.mod, plot (x2, y2, pch = 19, ana = yapıştır ("Kovaryans:", yuvarlak (cov (x2, y2), 0))))
ile (anscombe.mod, plot (x3, y3, pch = 19, ana = yapıştır ("Kovaryans:", yuvarlak (cov (x3, y3), 0))))
    ile (anscombe.mod, plot (x4, y4, pch = 19, ana = yapıştır ("Kovaryans:", yuvarlak (cov (x4, y4), 0))))
par (opar)
 

SON DÜZENLEME (Söz veriyorum!)

Son olarak, düşünülebilecek x $ ve y $ arasında belki de en zayıf "negatif ilişkiye" sahip -150'lik bir kovaryans:

final

  xx <- yy <- seq (0,100, by = 10)
yy [9] <- -336,7
plot (xx, yy, pch = 19, ana = yapıştır ("Kovaryans:", cov (xx, yy)))
 
Konuları görmek güzel.İki öneri: (1) daha geniş bir olası davranış aralığı gösterir.Kovaryans bize genel ilişki hakkında * kesinlikle hiçbir şey * söylemediğinden, ilişkinin nasıl güçlü ve tutarlı bir şekilde * pozitif * olabileceğini, ancak kovaryansın negatif olabileceğini göstermek için etkili bir aykırı değer atarak bunu gösterebilirsiniz.(2) Daha verimli olun: Örnek verileri oluşturduktan sonra, istenen kovaryansı elde etmek için onları yeniden ölçeklendirin.Bu, bir eşik karşılanana kadar tekrarlanan veri üretimini engeller;* tam * bir değer sağlar;ve "-150" nin ne kadar küçük bir anlam taşıdığını gösterir.
@whuber: Dürüst olacağım - Verilen bir kovaryansı elde etmek için belirli bir veri setini nasıl değiştireceğimi anlayamayacak kadar aptaldım.Googling ve [CV üzerinde arama] (https://stats.stackexchange.com/questions/tagged/random-generation%2bcovariance) yardımcı olmadı, bu yüzden sonunda kaba kuvvet reddi örneklemesine gittim.Kendime biraz sinirliyim;herhangi bir ipucu takdir edilecektir.
Eklemek gereken bir şey var, Datasaurus Düzine'yi gördünüz mü?Bu yılın başlarında yayınlanan Anscombe dörtlüsünün daha da abartılı bir versiyonu.Orijinal çevrimiçi yayını [burada] bulabilirsiniz (https://www.autodeskresearch.com/publications/samestats)
Birincisi, sizi "aptal" ın zıttı olarak düşünüyorum ve bir yöntemi belirtmekten memnuniyet duyarım.$ X $ ve $ y $ seçeneklerinden birini veya ikisini birden ölçeklendirebilirsiniz.Bunu simetrik olarak yapmak için $ x, y $ veri oluşturun.Hesaplanan kovaryansları $ v $ olsun."Ölçek" değerini $ s = \ sqrt {| -150 / v |} $ ve "işareti" $ u $ -150 $ -150 / v \ lt 0 $, aksi takdirde $ 1 $ olarak tanımlayın.$ (Sx, usy) $ ($ x $ sırasını koruyacak ve belki $ y $ değerini tersine çevirecek) verisi $ -150 $ kovaryansına sahiptir çünkü $$ \ operatorname {Cov} (sx, usy) = s (us) \ operatorname {Cov} (x, y) = us ^ 2 v = \ pm u \ left (\ frac {-150} {v} \ right) v = -150. $$ (+ 1 düzenlemeler için,btw.)
@Guilherme https://stats.stackexchange.com/a/152034/919 adresindeki bir cevapta, sadece sahip olmalarını istediğiniz * özellikleri * belirterek, bu tür örnekleri isteyerek üretecek yazılımlar sağlayarak tüm bunların ötesine geçtim.Örnek olarak, Anscombe's Quartet'i yeniden üretmek için kodu kullandım.
Ah, bir süre sonra "<- 200" varyansının R kodu olduğunu ve varyansın -200'den az olduğunu kastetmediğinizi anladım: P Neden sadece $ varyans = 200 $ yazmıyorsunuz?
@HelloGoodbye: evet, haklısınız.Dürüst olmak gerekirse, R şimdiye kadar benim için o kadar doğal ki bunu düşünmeden yazdım.Ve sadece estetik düzenlemeler için açılış sayfasının üst kısmına vurmamayı tercih ederim.Yine de teşekkürler!
@whuber: teşekkür ederim!Bugün bir şey öğrendim!(Ancak, $ u $ işaretinin çevrilmesi gerekiyor gibi görünüyor, bu doğru olabilir mi?)
Łukasz Deryło
2017-07-27 13:45:25 UTC
view on stackexchange narkive permalink

Size yalnızca bu ilişkinin olumsuz olduğunu söyler.Bu, bir değişkenin düşük değerlerinin diğerinin yüksek değerleriyle birlikte oluşma eğiliminde olduğu anlamına gelir.

Bu kovaryansın büyük mü yoksa küçük mü olduğunu söylemek zor (ilişkiniz güçlü mü zayıfsa) çünkü $ cov (X, Y) $ $ -sd (X) \ cdot sd (Y) $ ile $ arasında değişiyorsd (X) \ cdot sd (Y) $.Dolayısıyla, değişkenlerinizin ölçeğine bağlıdır.

Bu ilişkinin güçlü olup olmadığına karar vermek için kovaryansı korelasyona dönüştürmeniz gerekir (bunu $ sd (X) \ cdot sd (Y) $ ile bölün).Bu, -1 $ ile 1 $ arasında değişir ve Web'de ve ders kitaplarında yorumlamaya yönelik birçok farklı kılavuz bulunabilir.

Korelasyonun önemi için test de çalıştırabilirsiniz.

Bu yorum, yaygın olmakla birlikte, genel eğilimlerle araçları karıştırır.Verilerin * büyük çoğunluğu * pozitif bir ilişkiyi takip etse bile kovaryans kolaylıkla negatif olabilir.
Wikipedia: [Pearson korelasyon katsayısı] (https://en.wikipedia.org/wiki/Pearson_correlation_coefficient)


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...