Soru:
Standart altı yüzlü bir kalıp için varyans ve standart sapma nedir?
Marcos
2016-02-23 08:22:56 UTC
view on stackexchange narkive permalink

Bir dizi zımba silindiri için varyans ve sapmanın ne anlama geldiğini hayal etmekte güçlük çekiyorum. Yani, adil bir kalıp 1-6 tüm değerlerinde düz bir dağılımla düşecektir. Varyans kavramı, tek tip bir dağılımda gerçekten mantıklı mıdır? [Düzenleme: "Beyaz gürültünün varyansı nedir?" Diye sormaya benziyor mu?]

Ortalama 3.5 olacak, ancak varyans ve sapma değerleri nedir? Bu soru ideal bir ortamda bile geçerli mi? Görünüşe göre varyans ve standart sapma, belirtilmemiş veya bilinmeyen bir sıra etrafında önsel normal bir dağılımın zımni olarak varsayılır - ancak başka hiçbir gizli değişken içermeyen (n-> sonsuz gibi) tamamen düz bir dağılım varyans yok (veya olmamalı ).

[Düzenleme: Bağımlı ve bağımsız eksenlerin standart yönünü değiştirdiği için soru kafa karıştırıcıdır. Buradaki "anlamı" bilmek, sezgiyi yanlış bilgilendirir. Soruyu anlamanız gereken şey, her biri ölünün oraya kaç kez düştüğünü gösteren 6 farklı "kutu" fikridir. Yüz değerleri değişmese bile bağımsız eksen değildir. Rulo sayısı bağımsız eksendir. Aşağıdaki cevabıma bakın.]

Bu, öğrencilere rutin ders kitabı tarzı sorulan yaygın bir sorudur;bu nedenle muhtemelen "kendi kendine çalışma" olarak işaretlenmelidir;lütfen [etiket wiki] 'ne bakın (http://stats.stackexchange.com/tags/self-study/info)
"Zar" çoğuldur;"ölmek" tekildir.[Ayrık üniforma] (https://en.wikipedia.org/wiki/Uniform_distribution_%28discrete%29) üzerindeki wikipedia sayfasından, 1 $, ..., k $ üzerindeki ayrı bir üniforma için varyansın $ olduğunu görebilirsiniz.(k ^ 2-1) / 12 = (k + 1) (k-1) / 12 $.$ K = 6 $ olduğunda, bu 35 $ / 12 $ olur.
@Glen_b aslında Glen, bence varyans denklemlerinin zayıflığını gösteriyor - onu daha az keyfi yapacak gerçek bir model yok.Ortalama bir kalıp olduğunda, varyansın 2.916 olduğunu söylemek, ortalamanın her zaman 3.5 civarında olacağını, kimin aralığı 1-6 olduğunu ve olasılık dağılımının tamamen düz olduğunu söylemek, sonucun NOWHERE dışında görünmesini sağlar.
Üzgünüm Marcos, oradaki amacını kaçırıyorum;neyi sorunlu olarak gördüğünüzü netleştirmeniz gerekebilir.i) Elbette bir model var;1,2, ..., 6'daki ayrık üniforma.Hesaplama doğrudan [rastgele değişkenin varyans tanımından] (https://en.wikipedia.org/wiki/Variance#Discrete_random_variable): $ \ text {Var} (X) = \ sum_ {i = 1}^ 6 (i- \ mu).p (i) $ (burada $ \ mu $ 3.5'tir).Sonuç "hiçbir yerden çıkmaz", tanımdan doğrudan hesaplamadır.Ancak genel durumun sonucu (sadece 6 değil, herhangi bir sayıda yüz) o kadar basit ki genel durumu hesaplayabiliriz ...
... ve aslında, daha genel durum (yüzler 1'den yukarı değil, ancak $ a $ yukarı etiketli yüzler) da çok kolaydır ve zaten wikipedia'da aranmaya hazırdır.Bunun "hiçbir yerden" olduğunu düşünüyorsanız, tanımdan hesaplayarak çözülebilir.
Cevabım size mantıklı gelmiyorsa, ["2 taraflı kalıp"] (https://en.wikipedia.org/wiki/Bernoulli_distribution) durumunu düşünebilirsiniz (tüm sayfayı okumanızı öneririm.kısadır ve oldukça açıktır).
@GeoMatt22: Bu konudaki ilginiz için teşekkür ederim.Benim sorunum, bilgi kuramsal bir fikirle, yani bu cevapların, probleme girilenden daha fazla Shannon tipi bilgi çıktısı (yani vermesi) ile ilgisi var.Öyleyse bu ekstra bilgi parçaları nereden geliyor?
Adil bir madeni para için, $ \ Pr [x = 0] = \ Pr [x = 1] = \ frac {1} {2} $.Sonra $ \ mathbb {E} [x] = p_0 (0) + p_1 (1) = \ frac {1} {2} $ ve $ \ mathbb {E} [x ^ 2] = p_0 (0 ^ 2) +p_1 (1 ^ 2) = \ frac {1} {2} $.Yani $ x $, $ \ mu_x = \ mathbb {E} [x] = \ frac {1} {2} $ ve varyans $ \ sigma_x ^ 2 = \ mathbb {E} [x ^ 2] - \ mathbb {anlamına gelirE} [x] ^ 2 = \ frac {1} {4} $.Benzer şekilde, "bilgi" yi $ I = - \ log_2p $ olarak tanımlayarak, $ I_0 = I_1 = 1 $ bitimiz var.Dolayısıyla, $ x $ rastgele değişkeni, $ H [p [x]] = \ mu_I = \ mathbb {E} [I_x] = p_0I_0 + p_1I_1 = \ frac {1} {2} değerinde bir "entropiye" (beklenen bilgi) sahiptir(1) + \ frac {1} {2} (1) = 1 $ bit.(Bilginin sıfır varyansı vardır, $ \ sigma_I ^ 2 = 0 $, maksimize edilmiş $ H $ ile tutarlıdır.)
Dört yanıtlar:
StatsStudent
2016-02-23 11:15:02 UTC
view on stackexchange narkive permalink

@ dsaxton'ın cevabı doğru olsa da, istatistiğe yeni başlayanların varyans kavramını kavramasını daha zor hale getirdiğini düşünüyorum, bu nedenle varyansın ne olduğu konusunda daha iyi bir "his" edinmenize yardımcı olacak başka bir cevap sunacağımaslında "yapıyor."Bu durumda varyans için eşdeğer bir ifade şöyledir:

$ Var (X) $ = $ \ sum_ {i = 1} ^ 6 (X_i- \ bar {X}) ^ 2 \ over {6} $.

Şimdi, ortalama $ \ bar {X} = 3.5 $ olduğunu biliyorsunuz, bu nedenle kalıbın $ i $ th'nin görünen değerini $ i = 1, 2, almanız yeterlidir..., 6 $, $ X_i $ ve ortalamadan çıkarın, karesini alın ve 6'ya bölün. Aslında bu size her bir kalıp değerinin ortalamasından ne kadar uzakta olduğunun bir ortalamasını verir.Dolayısıyla $ Var (X) $ şu şekilde verilir:

$ {(1-3.5) ^ 2 + (2-3.5) ^ 2 + (3-3.5) ^ 2 + (4-3.5) ^2+ (5-3,5) ^ 2 + (6-3,5) ^ 2} \ {6} $ = 17,5 $ \ over {6} $ = 105 $ / 36 $, aynı yanıt @dsaxton sağlandı.

$ X_i- \ bar {X} $ değerlerinin karesini alırız çünkü aksi takdirde değerlerin toplamı sıfıra eklenir ve negatif sayılar pozitif sayıları iptal eder.

İlginç.Bu konuda bana bir şey keyfi geliyor.Sonucun kendisi pek bir anlam ifade etmiyor: 100 yuvarlamayla sonuçların ortalamanın etrafında ve düz bir eğri içinde ortalanacağını biliyorum.Sonuçların 2,916'ya kadar değiştiğini söylemek, teorik değerin herhangi bir açıklaması olmadan ortaya çıkıyor.
@Marcos Bunun anlamı olmayan nedir?Bu sadece varyansın tanımı.100 $ 'lık ruloların * örnek ortalaması, dağıtım ortalamasına yakın olma eğilimindedir, ancak varyans da 100 $' lık bir faktör kadar azalır, bu nedenle sorun olmaz.
@Marcos, sonucu temelde, ortalama olarak, her bir değer ile değerlerin "merkezi" arasındaki "kare mesafenin" yaklaşık 2,916 olduğunu söylüyor. Ayrıca, hesaplanan ortalama mutlak sapma gibi, kullanılan başka değişkenlik ölçüleri de vardıraynı şekilde, sadece sonucun karesini almak yerine, her değer ile ortalama arasındaki mutlak değer alınır. Varyansın da bazı önemli özellikleri vardır.Örneğin, bunu bilerek, rastgele bir değişkenin bir içinde olma olasılığının sınırlarını hesaplayabilirsiniz.dağılımın şekline bakılmaksızın ortalamanın verilen mesafesi.
@dsaxton: Teşekkürler, sanırım sorunumu anladım.0 tabanlı muhakemeye alışkınım.Zar 1'de başlıyor ve sanırım bu, zarif sonuçlar aradığım kafamda her şeyi dengeden çıkarıyor.
@StatsStudent: sonra tekrar (önceki yoruma atıfta bulunarak), düzgün bir kalıbın rulosu mükemmel * düz * olmalıdır.Düz eğrilerin hiçbir varyansı yoktur.Sorunu görmek için 0-5 numaralı 6 kenarlı bir zar deneyin ve denkleminiz ne öneriyor?
Kafanız karıştı - olasılık fonksiyonunun yüksekliği sınırları içinde düzdür, ancak değişkenliğini hesapladığımız her sonuçtaki olasılık değil, * sonuçların * dağılımlarının değişme şeklidir.[Görüyorsunuz (1 / 6,1 / 6,1 / 6 ...) ve bunların değişmediğini düşünüyorsunuz ama bizim baktığımız şey bu değil.* Sonuçların * dağılımı --- (1,2 ..., 6) değerlerinin hepsi eşit sıklıkta çıkıyor.
@Glen_b: Yine de * sonsuz * zar atışları verildiğinde sonuçlar eşit olacaktır.Sanırım bunu, hesapta limit teoremini ele alır gibi ele almalı - bir noktada, bir inanç sıçraması yapmalısın, çünkü oraya asla ulaşamazsın - * henüz * sonuç * ses * --Her sayımı içeren her sütun eşit derecede yüksek olacaktır.
1. Sonuçları sıklıklarıyla karıştırmayın (atışların sayısını artırdıkça 1 neredeyse 6'ya eşit olmaz - her seferinde 6-1 = 5).2. Varyansın ne olduğunu hala yanlış anlıyorsunuz.Bu, pmf'nin yüksekliklerini - yani olasılıkları (hatta sayıları) karşılaştırmakla ilgili değildir.Bu, orijinal rastgele değişkenin varyansından başka bir şeydir, değişkenin alabileceği * sonuçlardaki * varyasyon.3. Şimdi sınırda adil bir zar attığınızda sayıların daha eşit olma eğiliminde olacağını düşünerek de yanılıyorsunuz....
.... Aslında, * sayımlarda * beklenen fark, sınırda artar (ancak bu varyasyon, tartışılmakta olan orijinal değişkenin varyansı ile doğrudan bağlantılı değildir).Örnek oranlarının eşitliğe yakınsaması durumunda, sayılar birbirinden uzaklaşır (birbirlerinden beklenen mutlak sapmaları, herhangi bir sonlu sınırın ötesinde artacaktır)
dsaxton
2016-02-23 09:06:21 UTC
view on stackexchange narkive permalink

$ X $ zarın değeriyse, $ \ text {E} (X) = 21/6 $ 'ı zaten biliyoruz, dolayısıyla $' dan beri yalnızca $ \ text {E} (X ^ 2) $ 'ı bulmalıyız\ text {Var} (X) = \ text {E} (X ^ 2) - \ text {E} (X) ^ 2 $.Doğrudan hesaplayabiliriz

\ begin {align} \ text {E} (X ^ 2) & = \ sum_ {k = 1} ^ {6} \ frac {k ^ 2} {6}\\ & = \ frac {1 ^ 2 + 2 ^ 2 + 3 ^ 2 + 4 ^ 2 + 5 ^ 2 + 6 ^ 2} {6} \\ & = \ frac {91} {6} \ end {hizala}

bazı aritmetik işlemlerden sonra bize $ \ text {Var} (X) = 105/36 $ verir.

Cevabınız için teşekkürler, ancak aşağıdaki StatsStudent yorumuma bakın.
Bu mantıklı değil: Eğer kalıp sıfır tabanlı numaralandırmaya başlarsa, varyans değişir.Ancak, tüm yüzler eşit derecede olası olduğundan, varyans kalıbın numarasına bağlı olmamalıdır.
Cevabım, gerçek dünyada gördüğümüz türden ölümlerden bahsettiğimizi varsayıyor ve bunun ne kadar mantıklı olmadığını anlamıyorum.Sıfır tabanlı biriyle karşılaşırsak, o zaman birinci ve ikinci anlar buna göre değişir, böylece varyans aynı kalır.Kendinizi daha iyi hissettiriyorsa, ayrık bir tekdüze dağılımın varyansı için standart tanımı uygulayın.
GeoMatt22
2016-12-06 07:10:00 UTC
view on stackexchange narkive permalink

Halihazırda yayınlanan birkaç iyi yanıt var (ayrıca yorumlarda bir tane). Buradaki amacım, bu yanıtları kopyalamak değil , daha ziyade "varyansın tanımı" hakkındaki bariz kafa karışıklığını çözmeye çalışmaktır.

Sorunuzda şunu söylüyorsunuz:

Görünüşe göre varyans ve standart sapma, belirtilmemiş veya bilinmeyen bir sıra etrafında önceden normal bir dağılım varsayar - ancak başka hiçbir gizli değişken içermeyen düz bir "eğri" nin hiçbir varyansı yoktur.

Yayınladığınız yanıtta da

Cevap (ahem: is) 0 olmalıdır. Görünüşe göre varyans denklemleri, sonuçları etkileyen başka bir bilinmeyen değişkeni (başka bir boyut) varsaymaktadır.

Bir zar rulosunun değerini $ x $ olarak adlandırırsak, rastgele değişken $ x $ ayrık tek tip bir dağılıma sahip olacaktır. Yani, $ x $ olasılık kütle fonksiyonunu (PMF) $ p [k] \ equiv \ Pr [x = k] $ ile belirtirsek, o zaman $ p [k] = \ frac {1} {K} $, burada $ K $, $ k $ 'ın alabileceği farklı değerlerin sayısıdır (yani burada $ K = 6 $).

Olasılık dağılımının formundan bağımsız olarak, ortalama $ \ mu $ ve varyans $ \ sigma ^ 2 $ her zaman beklentiler açısından tanımlanır. Bu tanımlar $$ \ mu_x \ equiv \ mathbb {E} [x] \ ,, \, \ sigma ^ 2_x \ equiv \ mathbb {E} \ left [(x- \ mu_x) ^ 2 \ sağ] $$ (ör. Wikipedia 'ya bakın).

$ x \ in \ {X_1, \ ldots, X_K \} $ gibi PMF $ p [X_k] \ equiv \ Pr [x = X_k] $ gibi ayrı bir rastgele değişken için, beklenti operatörü $ \ mathbb { E} [\,] $ şu şekilde tanımlanır: $$ \ mathbb {E} \ büyük [f [x] \ büyük] \ equiv \ sum_ {k = 1} ^ Kf [X_k] p [X_k] $$ $ f [\,] $ herhangi bir deterministik fonksiyondur.

Kafa karışıklığınız bu son bölümle ilgili görünüyor. Ortalama $ \ mu $ için doğru şekilde $ f [x] = x $ kullanıyor görünüyorsunuz. Ancak, fark için $ f [x] = p [x] $, yani $ x $ PMF kullanıyor gibi görünüyorsunuz.

Belki aşağıdaki özet her şeyi daha net hale getirecektir

\ başlar {dizi} {c | c | c} \ text {nesne} (f) & \ text {ortalama} (\ mu_f) & \ text {varyans} (\ sigma_f ^ 2) \\ \ hline x & \ frac {7} {2} & \ frac {105} {36} \\ p [x] = \ frac {1} {6} & \ frac {1} {6} & 0 \ end {dizi}

Diğer bir deyişle, olasılık dağılımı $ p [x] $ sıfır varyansa sahiptir, ancak kalıp değeri $ x $ kesinlikle sıfır olmayan bir varyansa sahiptir.

Love my
2016-12-02 00:35:39 UTC
view on stackexchange narkive permalink

Bu, ayrık tek tip bir dağılımdır.Dolayısıyla, varyansı bulmak için $ \ frac {(b-a + 1) ^ 2-1} {12} $ kullanabiliriz.$ \ frac {(6-1 + 1) ^ 2-1} {12} $ = $ \ frac {6 ^ 2-1} {12} $ = $ \ frac {35} {12} $



Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...