Soru:
Çok değişkenli normal dağılımın yayılma ölçüsü
Kristian D'Amato
2011-07-07 15:21:26 UTC
view on stackexchange narkive permalink

Çok değişkenli normal dağılım için iyi bir yayılma ölçüsü nedir?

Bileşen standart sapmalarının ortalamasını kullanmayı düşünüyordum; belki kovaryans matrisinin izinin boyutların sayısına bölünmesi veya bunun bir versiyonu. Bu iyi mi?

Teşekkürler

bu nedenle, çok değişkenli gauss'un yayılması bir anlam ifade etmiyor. Bununla birlikte, ihtiyaçlarınıza bağlı olarak, sorunuza cevap verecek yaklaşımlar olabilir. Matrisin izi birçok yoldan biridir, ancak korelasyonları görmezden gelirsiniz, bu da büyük bir fark yaratabilir. Öz değerler, PCA vb. Çok daha iyi olabilir. Bu nedenle, ihtiyaçlarınızı detaylandırır mısınız?
Bu nedenle, çok boyutlu bir uzaya standart sapmanın bir analogunu istiyorum. Evet, bu iz korelasyonları görmezden gelecektir, korktuğum şey de bu. Bunu söyledikten sonra, bunun matematiksel olarak kesin olması gerekmez. Temel olarak, yayılmanın iyi bir göstergesi, 1. std ile tanımlanan hiperellipsin hipervolüm boyutu olacaktır. ortalamadan sapma. Ancak tam hacmi türetmeden güzel, kullanışlı bir formül çok takdir edilecektir.
Görünüşe göre PCA sorunuzu yanıtlayabilir.
üç yanıtlar:
#1
+13
schenectady
2011-07-07 16:41:19 UTC
view on stackexchange narkive permalink

Örnek varyans-kovaryans matrisinin determinantına ne dersiniz: Ölçüm vektörünün boyut uzayı içinde matris tarafından çevrelenen karesel hacmin bir ölçüsü. Ayrıca, bu ölçünün sıklıkla kullanılan ölçek değişmez bir versiyonu, örnek korelasyon matrisinin belirleyicisidir: ölçüm vektörünün boyutları içinde kaplanan alanın hacmi.

+1 Evet, belirleyiciler doğrudan "ortalamadan 1 sd ile tanımlanan elipsin hipervolumu ..." ile ilgilidir.
Yani kovaryans matrisinin belirleyicisi bu, değil mi?
@Kristian Kovaryans matrisinin determinantının karekökü, hem şekil (korelasyon) hem de boyut (standart sapma) bilgisini birleştiren hipervolumu söyler. Temel bileşenlerin standart sapmalarının ürünüdür. Korelasyon matrisinin belirleyicisi temelde yalnızca bir şekil faktörüdür, dejenere dağılımlar için 0'dan tüm bileşenler ilintisiz olduğunda 1'e kadar değişir.
@whuber, Ya ayrı bir şekil ve boyut ölçümüne sahip olmak istersem?(Aslında sadece bedenle ilgileniyorum, sanırım.)
@Atcold "Boyut" için nicel bir tanım oluşturmanız gerekir.Bu, her bir şekil için birim boyut dağılımının ne olduğunu belirlemeye eşdeğer olacaktır.(Tanım gereği, "şekil", bir dağıtımın sahip olabileceği, çevirme veya yeniden ölçeklendirme ile değişmeyen özelliklerdir.) Bunu yapmanın sayısız yolu vardır, bu nedenle nihayetinde mesele, özel analiziniz için uygun bir tanım seçmeye gelir.Bu, birden çok şekli içeren herhangi bir dağıtım ailesi için evrensel bir boyut (veya "yayılma") tanımı olamamasının bir nedenidir.
D-boyutlu baloncuklarım (Gaussianlar) olduğunu varsayalım.Onların yarıçaplarının peşindeydim.Daha doğrusu bu baloncuklardan oluşan bir koleksiyonum var ve mesafelerini yayılmalarıyla karşılaştırmak istiyorum.Yeni bir soru oluşturmamı tercih ederseniz bana bildirin.
#2
+3
MRocklin
2011-07-16 01:23:11 UTC
view on stackexchange narkive permalink

Uygulamaya bağlı olarak iz tercih ederek ya iz ya da determinant ile giderdim. İkisi de temsile değişmez olmaları ve net geometrik anlamlara sahip olmaları bakımından iyidirler.

Determinant yerine Trace için yapılacak iyi bir argüman olduğunu düşünüyorum.

Belirleyici, belirsizlik elipsoidinin hacmini etkili bir şekilde ölçer. Bununla birlikte, sisteminizde herhangi bir fazlalık varsa, kovaryans neredeyse tekil olacaktır (elipsoid bir yönde çok incedir) ve sonra determinant / hacim, çok fazla belirsizlik / yayılma olsa bile sıfıra yakın olacaktır. diğer yönler. Orta ila yüksek boyutlu bir ortamda bu çok sık meydana gelir

İz, geometrik olarak eksen uzunluklarının toplamıdır ve bu tür durumlar için daha sağlamdır. Yönlerden bazıları kesin olsa bile sıfır olmayan bir değere sahip olacaktır.

Ek olarak, izlemeyi hesaplamak genellikle çok daha kolaydır.

+1 İyi puan. Bu beni düşündürüyor: $ n $ özdeğerlerin herhangi bir simetrik işlevi "iyi" olarak nitelendirilir. Tüm bu tür polinom fonksiyonları, determinantı ve izi içeren $ n $ temel simetrik fonksiyonlardaki polinomlardır.
Evet, toplam (izleme) mutlaka gitmek için en iyi yol değildir. Uygulamaya bağlı olarak burada birçok karışım hayal edebileceğiniz konusunda haklısınız. Acaba burada iyi olacak bazı standart işlevler ailesi var mı ...
@MR Çok değişkenli bir normal dağılımın yayılmasını hesaplamak için tek bir istatistik kullanmaya çalışan hiç kimsenin farkında değilim (elbette, tüm bileşenlerin bağımsız olduğu varsayıldığında). Bu, böyle standart bir aile olmayabileceğine inanmamı sağlıyor.
#3
+1
jpillow
2011-07-08 10:16:02 UTC
view on stackexchange narkive permalink

Başka bir (yakından ilişkili) miktar, dağılımın entropisidir: çok değişkenli bir Gauss için bu, kovaryans matrisinin determinantının günlüğüdür veya

$ \ frac {1} {2} \ log | (2 \ pi e) \ Lambda | $

burada $ \ Lambda $ kovaryans matrisidir. Bu seçimin avantajı, diğer (örneğin, Gauss olmayan) dağılımlar altındaki noktaların "yayılması" ile karşılaştırılabilmesidir.

(Teknik olmak istiyorsak, bu bir Gauss'un diferansiyel entropisidir ).



Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...