Bilim adamlarının 5 numaralı özet istatistikler hakkında tahminler girmesine olanak tanıyan bir web aracı (= "Buraya stackoverflow.com'dan gelen cahil bir istatistikim" ) programlıyorum. bir değişken. Giriş, bir kutu grafiğinin UI metaforu kullanılarak yapılır.
Bilim adamlarının girdilerini PDF / CDF olarak görselleştirmelerine izin vermek istiyorum, ancak temel bir dağıtım seçmem gerekiyor.
- ~ 1'inci, 25'inci sırayı sabitleyen 5 numaralı özete iyi bir şekilde uyarken "olabildiğince normal" bir dağıtım arıyorum. 50., 75. ve ~ 99. yüzdelik dilimler.
- 3-param skew-normal ile başladım, ancak 5-girişli parametrelere tam olarak (veya hatta yakından) uyması için yeterli DOF'ye sahip olmadığı açıktır
- "Min" ve "max" ı 1. ve 99. yüzdelik dilimler olarak yorumluyorum. Bunun kabataslak olduğunu biliyorum, ancak girilen sayılar spekülatif tahminler (= "Merak etmeyin, ölçülen verilerin yorumunu mahvetmiyorum" )
- Basitlik bir erdem. İdeal olarak, dağıtımın sayısal parametre tahmini ile yapılması kolay ve kolay olacaktır (kapalı form en güzel, ala http://www.johndcook.com/blog/2010/01/31/parameters-from -yüzdelikler /, ancak bu hemen hemen ay için çekim yapmak, doğrusal olmayan optimizasyon yapmak veya bir şey sorun değil)
- GSN / CSN gibi dağıtımlara bakmaya başladım. http://www2.warwick.ac.uk/fac/sci/statistics/crism/research/2012/paper12-08/12-08w.pdf, ancak ben gerçekten emin değilim ' Doğru aileye bakıyorum. Belki de çarpık normal başlamak için en iyi yer değildir? Ayrıca Johnson dağıtımı gibi şeyleri de düşündüm ve bulabildiğim kadarıyla neredeyse "uyacak şekilde tasarlanmış" görünüyor.
Hangi dağıtımlara bakmalıyım? ?
Aracın ekran görüntüsü: ortanca değeri çarpık normal dağılıma sığdırmamak