Soru:
Önyükleme yoluyla standart sapma güven aralığı tahmininde garip model
user16
2017-01-16 20:19:07 UTC
view on stackexchange narkive permalink

Bazı veriler için standart sapmanın güven aralığını tahmin etmek istedim. R kodu aşağıdaki gibi görünür:

  kitaplığı (önyükleme)
sd_boot <- function (x, ind) {
        res <- sd (x $ ReadyChange [ind], na.rm = DOĞRU)
        dönüş (res)
}
data_boot <- boot :: boot (veri, istatistik = sd_boot, R = 10000)
plot (data_boot)
 

Ve bir sonraki konuya sahibim: enter image description here

Bu önyükleme histogramını doğru şekilde yorumlamakta kaldım. Diğer her benzer veri seti, önyükleme tahminlerinin normal dağılımlarını gösterir ... Ama bu değil. Bu arada, bu gerçek ham veriler:

  > verileri $ ReadyChange
 [1] 27.800000 8.985046 11.728021 8.830856 5.738600 12.028310 7.771528 9.208924 11.778611 6.024259 5.969931 6.063484 4.915764
[14] 12.027639 9.111146 13.898171 12.921377 6.916667 10.764479 6.875000 12.875000 7.017917 9.750000 7.921782 12.911551 6.000000
 

Lütfen bu önyükleme modelini yorumlamama yardım eder misiniz?

Kod hepimiz için şeffaf değil!"İnd" in rolü nedir?Buradaki örneklemeye müdahale ediyor mu?
Kodu kopyalayıp yapıştırırken bile sonuçlarınızı yeniden oluşturamıyorum.Çok normal dağıtılmış bir histogram elde ediyorum.
@nick-cox, lütfen 'boot' R paketi kılavuzuna bakın.'ind', orijinal veriyi önyüklemek için veri vektörünün rastgele indeksleri olan 'indeksler' anlamına gelir.Bu, ilk bakışta çok net görünmeyen standart 'önyükleme' paket kodudur.
@jwimberley, yanlış bir veri vektörü vardı ... Keşfettiğiniz için zaman ayırdığınız için teşekkür ederiz.Gerçek veriler EDIT'in altındaki postada.
yeni veriler için desen onaylandı.Benim tahminim, diğerlerinden çok daha büyük olan 27.800000 veri noktasından kaynaklanıyor.
@psarka Doğrulanıyor.Bu noktayı kaldırmak, garip davranışı ortadan kaldırır.Bu nokta olmadan sd'nin standart sapması 3.02'dir, ancak bu noktada 4.24'tür.Bu, 3.02 ve 4.24'teki zirveleri açıklar (nokta önyüklemeye dahil değildir; nokta önyüklemeye dahil edilmiştir).Daha yüksek rezonanslar, bu noktanın birçok kez dahil edildiği zamandır.
@jwimberley neden bunu bir cevap olarak göndermiyorsunuz?
@mdewey Bu, benim payımı almak istemediğim psarka tarafından yapılan bir gözlemi temel alıyordu.
@jwimberley Katılan hepiniz için çok teşekkür ederim.1 aykırı değerin bu kadar bariz bir 'rezonatör' etkisi olabileceğini hiç düşünmemiştim.Bu, küçük örnek önyükleme için göz açıcıdır.Bu yorumları sorunun gerçek yanıtı olarak nasıl işaretleyeceğinizi bilmiyorum.
Eve döndüm ve cevabımı güncelledim.
Iki yanıtlar:
psarka
2017-01-16 21:50:44 UTC
view on stackexchange narkive permalink

Kodunuzda bir hata olabilir veya önyükleme kitaplığı beklenenden başka bir şey yapabilir.

Edit:

Düzeltilmiş veriler sağlandıktan sonra, modelin bir aykırı değerden kaynaklandığı ve her tepe noktasının, aykırı değerin bir örneklemde seçildiği farklı sayıya karşılık geldiği ortaya çıktı.

enter image description here

Aynen R: 21 element vektör verisini bariz bir şekilde yaptıktan sonra, "inds <- matrix (sample (21,10000 * 21, replace = TRUE), 10000,21)" ile bir indis matrisi oluşturun ve ardından şunu arayın:her sütundaki verilerin elemanlarını bulun ve "hist (apply (inds, 1, function (ind) {sd (data [ind])}))" ile standart sapmayı bulun.Birden fazla zirve yok.
Bu cevap, sorunu çok iyi açıklar ve gösterir, ancak pratikte bu konuda ne yapılması gerektiği konusunda hiçbir rehberlik veya tavsiye sağlamaz.
IWS
2017-01-16 21:19:18 UTC
view on stackexchange narkive permalink

Bunu bir yanıt olarak yazmakta tereddüt ediyorum, ancak bana göre bu, önyüklemenizi temel aldığınız az miktardaki veri noktasından kaynaklanıyor gibi görünüyor (21, yanılıyorsam beni düzeltin).

Daha kesin olmak gerekirse, örneklediğiniz specific 21 değerlerinin yalnızca birkaç olası standart sapma (histogramınızdaki zirveler) olduğu görülüyor.Temel örnek daha büyük ve daha çeşitli olsaydı, ortaya çıkan histogram çok daha pürüzsüz olurdu (ve muhtemelen beklediğiniz normal dağılıma daha çok benzer).

Genel bir not olarak ve ben burada olduğunu varsayarsak, bu, önyüklemenin küçük bir örnekleme sahip olmanın sorunlarını çözmediğini göstermek için iyi bir örnektir.

Bunun gibi açıklamaları severim, ancak sonucu yeniden oluşturamıyorum!
@NickCox Bunu belirtmekte kesinlikle haklısınız.Bu cevabı bu sonuçları kopyalamaya çalışmadan girdim.Psarka'nın cevabında görülebileceği gibi (hemen oy verdim) bazı kodlama hataları olmuş olmalı.Dolayısıyla ben de bir şeyler öğrendim (böyle bir problemi denemek ve kopyalamak için).
Bootstrap'in mutlaka orijinal verilere bağlı olması da önemlidir.
Tabii ki, ne demek istiyorsun?
Seni destekliyorum!Yani, eserlerin mümkün olduğunu ve bu ihtiyatın gerekli olduğunu savunmak.
Teşekkürler!Cevabım sorunu gerçekten çözmese de ...;)
Ben de bunun doğru yanıt olduğuna inanıyorum.Verilerin histogramı bu açıklamayı desteklemektedir.
Düzeltilmiş soru için doğru cevap!


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...