Soru:
Standart sapma nasıl simüle edilir
Tumaini Kilimba
2020-09-05 03:45:52 UTC
view on stackexchange narkive permalink

Yakalanan gerçek verilere dayalı olarak verileri simüle etmek istiyorum.Yakalanan gerçek veri 15 gözlemdir.Mevcut verilere dayalı simülasyon 100 gözlemdir.15 gözlem için bir ortalama ve standart sapmam var, ancak daha küçük gerçek verilere dayalı olarak daha büyük bir örneklem (100 gözlem) için standart sapmayı nasıl simüle edebilirim?Standart sapma, genel olarak örneklem büyüklüğündeki artışla azalmalıdır, ancak hangi oranda?

* Örnek * standart sapma ve * popülasyon * standart sapma arasında ayrım yapmak için dikkatli olmak istersiniz.Ayrıca: CV'ye hoş geldiniz!
Daha büyük bir örneklemle standart sapma neden artar?Belki önemli bir ayrıntı eksik gibi görünüyor
üç yanıtlar:
Tim
2020-09-05 04:03:42 UTC
view on stackexchange narkive permalink

Standart sapma, örneklem boyutuyla azalmaz .Örneğiniz ne kadar büyükse, standart sapma popülasyonun standart sapmasına o kadar yakın olmalıdır.Ardından, daha büyük örneklem boyutuyla, daha büyük ve daha küçük örnekler için tahmin edilen standart sapmaların dağılımı azalacaktır, çünkü daha büyük örneklere dayanarak daha kesin sonuçlar elde edeceğiz.

Aşağıda, 15 ve 100 örnek için standart normal dağılımdan (sd = 1 ile) çizimleri simüle ettiğimiz ve ardından bunlar için standart sapmaları tahmin ettiğimiz R'de sayısal bir örnek görebilirsiniz.

  > özeti (çoğaltma (100000, sd (rnorm (15))))
   Min.1. ÇeyrekMedyan Ortalama 3. Çeyrek.Maks. Alan sayısı
 0.3039 0.8515 0.9762 0.9824 1.1061 1.8886
> özeti (kopya (100000, sd (rnorm (100))))
   Min.1. ÇeyrekMedyan Ortalama 3. Çeyrek.Maks. Alan sayısı
 0.6916 0.9498 0.9971 0.9980 1.0451 1.3089
 
Dave
2020-09-05 03:59:46 UTC
view on stackexchange narkive permalink

Örnek boyutu arttıkça standart hata azalır. Standart sapma ilgili bir kavramdır, ancak istatistik öğrenmeye başlayan herkesin kafasını karıştıran benzer bir terminolojiyi garanti edecek kadar alakalı olmayabilir.

Örnekleme dağılımı, bir popülasyondan tekrar tekrar örnekleme yapıp her seferinde ortalama gibi bazı istatistikleri hesaplarsanız elde edeceğiniz değerlerin dağılımıdır. Bu örnekleme dağılımının standart sapması standart hatadır. Ortalamanın standart hatası için $ \ sqrt {n} $ azalır, yani $ s / \ sqrt { Standart hatanın tahmini olarak n} $ (burada $ s $ , örnek standart sapmadır).

Bir dağılımın standart sapması, her ne ise odur ve ne kadar büyük bir örnek aldığınız ya da hiç örneklemeniz bile umurunda değildir.

Görünüşe göre, 15 $ örneğinden hesapladığınız ortalama ve standart sapma ile bir dağılımdan veri simülasyonu yapmak istiyorsunuz, öyle yapın. Normal bir dağılım varsaymak istiyorsanız, R komutu rnorm ve Python komutu numpy.random.normal'dir.

Normal bir dağıtım varsayımı yapmak istemiyorsanız, lütfen sorununuzu daha ayrıntılı olarak açıklayacağınız yeni bir soru gönderin.
BruceET
2020-09-05 04:24:39 UTC
view on stackexchange narkive permalink

Özellikle simülasyon hakkında soru soruyorsunuz. @ Dave'in Cevabını (+1) takiben, işte R'de birkaç simülasyon var.

Dağıtılmış bir popülasyondan $ n = 16 $ boyutunda bir milyon örnek aldığımı varsayalım $ \ mathsf {Gama} (\ mathrm {şekil} = 4, \, \ mathrm {oran} =. 1), $ olarak popülasyonun anlamı $ \ mu = 40 $ popülasyon varyansı $ \ sigma ^ 2 = 400, $ ve $ \ sigma = 20'dir. $

O zaman örnek şu anlama gelir (ortalamalar) $ A = \ bar X_ {15} $ $ E (A) = 40 $ ve standart hatalar $ SD (A) = \ sigma / \ sqrt {n} = 5 $ Bir milyon örnekle simülasyon sonuçları olmalı yaklaşık üç anlamlı basamağa kadar doğru.

  set.seed (904)
a = çoğaltma (10 ^ 6, ortalama (rgamma (16, 4, .1)))
ortalama (a); sd (a)
[1] 40.00176 # aprx 40
[1] 4.996061 # aprx 5
 

Bunun tersine, $ n = 100 $ boyutundaki milyonlarca numunenin benzer bir simülasyonunu yapalım aynı popülasyondan. Şimdi $ E (\ bar X_ {100}) = 40 $ ve $ SD (\ bar X_ {100}) = \ sigma / \ sqrt {n} = 20 / \ sqrt {100} = 2 $

  set.seed (2020)
a = çoğaltma (10 ^ 6, ortalama (rgamma (100, 4, .1)))
ortalama (a); sd (a)
[1] 40.0014 # aprx 40
[1] 2,001084 # aprx 20/10 = 2
 


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 4.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...