$ k / n \ rightarrow \ lambda $ sınırı çok ilginç değil. Ancak, örnek boyutunun $ n $ ile üssel olarak artmasına izin verirseniz, sınırlayıcı bir dağılım elde edersiniz, bu "ayrık bir Gumbel" (yukarıdaki açıklamaların hızını ayarlayın). Örneğin, basitlik için $ p = 0.5 $ olsun, böylece $ X_i $ IID $ B (n, 0.5) $ olur, burada $ n $ büyüktür ve örnek boyutu $ k $ üssel olarak artar (ancak $ 2 ^ n $) - $ k = 2 ^ m $ deyin, burada $ n>m> \ frac {n} {2} $. Maksimumdan ziyade minimumla ilgilendiğimizi varsayalım (aynı şeye geliyor ama yazmak biraz daha kolay). Normal yaklaşım, çok büyük bir örneklemde tamamen işe yaramaz - genellikle negatif bir minimum önerir.
Minimumun dağılımı, $ \ mathbb {P} (X_i \ le d) \ yaklaşık 2 ^ {- m} $, böylece $ \ mathbb {P} (min (X_i) >d) \ yaklaşık e ^ {- 1} $. Aşağıdaki çalışma, $ m $, $ n $ 'a yakın olana kadar $ d $' ın sıfıra yaklaşmayacağını göstermektedir - aslında $ \ frac {d} {n} $, belirli bir $ \ frac {m} oranı için neredeyse sabit olacaktır { n} $. Ve bu bölgede Binom dağılımı, ayrık (tersine çevrilmiş) bir üsse yakın olacaktır, bu nedenle minimumun dağılımı, ayrık bir ters Gumbel dağılımına yakın olacaktır.
Ayrıntıları çalışmak: Stirling yaklaşımı kullanarak faktöriyel için, iki terimli katsayıyı şu şekilde tahmin edebiliriz: $$ \ binom {n} {d} \ yaklaşık \ frac {1} {\ sqrt {2 \ pi n}} \ left (\ frac {d} {n} \ sağ) ^ {- d-1/2} \ left (1- \ frac {d} {n} \ right) ^ {- n + d-1/2}. $$
Eğer $ n \ gg d \ gg 1 $, sonra $ j \ ge0 $, $$ \ mathbb {P} (X_i = dj) \ yaklaşık \ left (\ frac {d} {nd} \ right) ^ j \ mathbb { P} (X_i = d) $$ (çarpım hızla sıfıra giderken iki terimli katsayılar arasındaki ardışık oranlar yavaşça değişir), bu nedenle $$ \ mathbb {P} (X_i \ le d) \ yaklaşık \ left (1- \ frac {d} {n} \ right) \ left (1-2 \ frac {d} {n} \ right) ^ {- 1} \ mathbb {P} (X_i = d). $$
Kümülatif olasılık için bir ifade elde etmek için yukarıdakileri birleştirerek, bu kümülatif olasılığı 2 $ ^ {- m} $ 'a eşitleyerek, 2 ^ n $ ile çarparak, günlükleri alıp $ n $ ile bölerek, şunu elde ederiz: : $$ - \ left (\ frac {d} {n} + \ frac {1} {2n} \ right) log \ left (\ frac {d} {n} \ sağ) - \ left (1- \ frac {d} {n} - \ frac {1} {2n} \ right) log \ left (1- \ frac {d} {n} \ right) - \ frac {1} {n} log \ left (1- 2 \ frac {d} {n} \ right) = log (2) \ left (1- \ frac {m} {n} \ right) + log (2 \ pi n) / 2n. $$ Yazma $ \ nu = \ frac {d} {n} + \ frac {1} {2n} $ ve $ \ alpha.log (\ alpha + \ delta) \ yaklaşık \ alpha.log (\ alpha) + \ delta $ küçük için $ \ delta $: $$ - \ nu.log (\ nu) - (1- \ nu) log (1- \ nu) - \ frac {1} {n} log (1-2 \ nu) = log ( 2) \ left (1- \ frac {m} {n} \ right) + log (2 \ pi n) / 2n. $$ Bu, Newton-Raphson ile yeterince kolay çözülebilir. Küçük üçüncü terim indirildiğinde ($ d $ değeri, $ n \ ge 100, m \ ge n / 2 $ için en fazla 0,15 etkilenir), $ \ frac {d} {n} $ 'ın yalnızca bağımlı olduğunu görürüz $ \ frac {m} {n} $ üzerinde, eğer $ n $ büyükse ve sabit oranda $ n $ ve $ m $ arttığı için sıfıra meyilli değildir.
Sürekli bir çözüm bulmuş olmak $ d $ en yakın tam sayıya $ \ hat {d} $ yuvarlıyoruz. (Süreklilik düzeltmesi ve doğru şekilde yuvarlama konusunda biraz daha dikkatli olabilir, ancak burada gerekli değildir.) $ \ Hat {\ lambda} = \ frac {n- \ hat {d}} {\ hat {d} yazın } >1 $. $ \ Rho = 2 ^ m \ mathbb {P} (X_i \ le \ hat {d}) $ yazın: $ 1 / \ sqrt {\ hat {\ lambda}} \ le \ rho \ le \ sqrt {\ hat {\ lambda}} $. Ardından: $$ \ mathbb {P} (X_i = \ hat {d} -j) \ yaklaşık \ mathbb {P} (X_i = \ hat {d}) \ hat {\ lambda} ^ {- j}, $$ ve bu yaklaşım, $ n $ ve $ \ hat {d} $ birlikte arttıkça daha iyi hale gelir. Öyleyse: $$ \ mathbb {P} (X_i \ le \ hat {d} -j) \ yaklaşık \ mathbb {P} (X_i \ le \ hat {d}) \ hat {\ lambda} ^ {- j} = 2 ^ {- m} \ rho \ hat {\ lambda} ^ {- j}, $$ ve böylece $$ \ mathbb {P} (min (X_i) > \ hat {d} -j) = (1- \ mathbb {P} (X_i \ le \ hat {d} -j)) ^ {2 ^ m} \ yaklaşık (1-2 ^ {- m} \ rho \ hat {\ lambda} ^ {- j}) ^ { 2 ^ m} = e ^ {- \ rho \ hat {\ lambda} ^ {- j}}. $$
$ x = \ hat {d} -j $ yazarsak $$ \ rho \ hat {\ lambda} ^ {- j} = e ^ {log (\ rho) - \ hat {d} .log (\ hat {\ lambda}) + x.log (\ hat {\ lambda}) }, $$ so
$$ \ mathbb {P} (min (X_i) >x) \ yaklaşık exp (-e ^ {\ frac {x- \ mu} {\ sigma}}) $$, $ \ mu parametrelerine sahip ayrık bir ters Gumbel'dir = \ hat {d} - \ frac {log (\ rho)} {log (\ hat {\ lambda})} $ ve $ \ sigma = \ frac {1} {log (\ hat {\ lambda})} $ .
$$ \ hat {\ lambda} \ yaklaşık \ lambda = \ frac {nd} {d} \ text {ve} \ hat {d} - \ frac {log (\ rho)} {log (\ hat {\ lambda})} \ yaklaşık d. $$
Okuyucu için alıştırma - $ p \ ne0.5 $?