Soru:
İstatistiksel kontrol grafiklerini anlama
Dave Kincaid
2011-09-09 17:52:12 UTC
view on stackexchange narkive permalink

Kontrol çizelgeleri bugünlerde şirketim için çok revaçta. "Veri analistlerimiz" (alıntılar kasıtlıdır) ürettikleri hemen hemen tüm grafiklere kontrol sınırları koymaktadır. Geçen gün, geçen yıl içinde destek çağrı merkezimize gelen bazı arama grafiklerine bakıyorduk. Her hafta için bir çizgi grafiğinde gösterilen arama sayısının ölçümlerine sahibiz. Son zamanlarda, bu grafikleri hazırlayan analistler, grafiklere "kontrol limitlerini" gösteren çizgiler koymaya başladılar.

Benim sorum, bu kontrol limitlerinin nerede olması gerektiğini nasıl hesapladıklarıyla ilgili. Sınırları nasıl belirlediklerini sorduğumda, aldığım cevap şudur:

Önce, grafikte noktaların biraz sabit göründüğü (küçük varyans anlamına gelen) bir bölüm buluyoruz, sonra bunların ortalamasını puan. Sonra bu noktaların standart hatasını hesaplıyoruz ve hesapladığımız ortalamadan +/- 3 standart hatada kontrol sınırlarını çiziyoruz.

Ortalamayı bu şekilde hesaplamak doğru mu? Görünüşe göre ortalamayı hesaplamak için çok fazla değişiyormuş gibi "görünen" herhangi bir şeyi atmak yerine TÜM noktaları kullanmalıyız.

Böyle bir ölçüme kontrol sınırları koymak mantıklı mı? (bir çağrı merkezine gelen çağrı sayısı)? Ölçümler kontrol sınırları dahilinde olduğu sürece haftayı normal kabul ederiz. Bir haftanın arama hacmi ölçümü bu kontrol limitlerinin dışındaysa, önemli kabul edilir ve daha fazla analiz gerektirir. Bana bütün bunlarla ilgili bir şeyler yapay geliyor.

Gerçekten * "standart hata" (ortalamanın) anlamına mı geliyordu, "standart sapma" değil mi? (Ne olursa olsun, tarif ettiğiniz prosedürlerde * hiçbir şey * doğru değildir; bunların hiçbirinin teori veya pratikte herhangi bir gerekçesi yoktur; ve bahsettiğiniz her bir unsurdan şüphelenmekte haklısınız.)
W / whuber ile katılıyorum. Hedef, haftalık arama dağılımının 0.135. ve 99.865. Yüzdelik dilimlerini tahmin etmek mi? (Eğer dağıtım normalse ve standart geliştirmeyi kastettiyseniz ve verileri atmadıysa, o zaman bu hedef tahmin gibi görünüyor.) <1000 gözlemle (aynı dağıtımdan), bu zor, ama mümkün, örneğin [Dekkers & de Haan (1989)] (http://www.jstor.org/pss/2241666). Yani: Mevcut yöntemin gerekçesiz olduğuna katılıyorum; Siz de olumlu öneriler mi isteyip istemediğinizi yoksa sadece (doğru) eleştirel düşüncelerinizin doğrulanmasını mı istediğinizi merak etmek
Kontrol çizelgelerinin bu ölçümler için uygun olup olmadığını ve uygunsa nasıl uygulanmaları gerektiğini gerçekten anlamaya çalışıyorum.
Standart sapmaya karşı standart tahmin hakkındaki soruya gelince, buna standart sapma diyorlar, ancak hesaplamaları standart hata (sd / sqrt (N)) gibi görünüyor. Gerçi tam olarak kavrayamadığımı itiraf ediyorum.
Standart sapma, bize değerlerin tipik olarak ortalamalarından ne kadar farklı olacağını söyler. Standart hata bize örnek ortalamasının gerçek ortalamadan ne kadar farklı olacağını söyler. $ 1 / \ sqrt (N) $ 'a dikkat edin: Bu, daha büyük geçmiş dönemler kullanıldıkça kontrol limitlerinin daralacağı anlamına gelir ve limitlerin bu * keyfi * seçime bağlı olduğunu gösterir. Öte yandan, SD'nin tahmini, N $ büyüdükçe (nüfus SD'sine göre) stabilize olacaktır.
Diğer yorumlara ve yanıtlara ek olarak, şirketiniz zaman zaman yeni ürünler çıkarabilir, ürün geri çağırmaları vb. Olabilir ve bu da geçici değişikliklere neden olabilir.
Iki yanıtlar:
#1
+12
whuber
2011-09-09 22:19:20 UTC
view on stackexchange narkive permalink

Bir kontrol grafiğinin amacı , düzeltilebilir bir şeyin ters gittiğini olabildiğince çabuk belirlemektir. İyi çalışması için, rastgele veya kontrol edilemeyen değişiklikleri "kontrol dışı" olarak tanımlamamalı .

Açıklanan prosedürle ilgili sorunlar şunlardır: manifold.

  • Grafiğin "sabit" bölümü tipik değildir. Tanım olarak, normalden daha az değişkendir. Kontrol altındaki durumun değişkenliğini küçümsemek, grafiğin hatalı bir şekilde birçok değişikliği kontrol dışı olarak tanımlamasına neden olur.

  • Standart hataları kullanmak yanlıştır. Standart bir hata, ortalama haftalık arama oranının örnekleme değişkenliğini tahmin eder, arama oranlarının kendi değişkenliğini değil.

  • Sınırları \ $ olarak belirleme pm 3 $ standart sapmalar etkili olabilir veya olmayabilir. Seri olarak ilişkilendirilmemiş normal dağıtılmış veriler için geçerli olan genel bir kurala dayanmaktadır. Orta derecede büyük olmadıkça (haftada yaklaşık 100+) arama ücretleri normal olarak dağıtılmayacaktır. Bunlar, seri olarak ilişkilendirilmiş olabilir veya olmayabilir.

  • Prosedür, temeldeki sürecin zaman içinde değişmeyen bir hızda olduğunu varsayar. Ama widget yapmıyorsunuz; - umarım - (a) boyut olarak büyüyen ancak (b) zaman içinde çağrı oranını düşüren bir pazara yanıt veriyorsunuz. Zamansal eğilimler beklenmektedir. Er ya da geç herhangi bir eğilim, verilerin sürekli olarak kontrol dışı görünmesine neden olur.

  • İnsanlar yıllık faaliyet döngülerine girme eğilimindedir. mevsimlere, akademik takvime, tatillere vb. karşılık gelir. Bu döngüler, öngörülebilir (ancak anlamsız) kontrol dışı olaylara neden olan eğilimler gibi davranır.

Simüle edilmiş bir veri kümesi bu ilkeleri ve sorunları gösterir.

Control chart

Simülasyon prosedürü, kontrolü elinde bulunduran gerçekçi bir veri dizisi oluşturur: öngörülebilir bir temel modele göre, hiç kontrol dışı gezinti içerir. bir neden atandı. Bu grafik, simülasyonun tipik bir sonucudur.

Bu veriler, arama ücretleri için makul bir model olan Poisson dağılımlarından alınmıştır. Haftada 100'lük bir temelden başlarlar ve doğrusal olarak yılda 13 oranında yukarı doğru eğilim gösterirler. Bu eğilimin üst üste bindirilmesi, haftada sekiz çağrı (kesikli gri eğri ile izlenen) genliği ile sinüzoidal yıllık döngüdür. Sanırım bu mütevazı bir trend ve nispeten küçük bir mevsimsellik.

Kırmızı noktalar (yaklaşık 12 - 37. haftalar), ilk 1,5 yılda karşılaşılan en düşük standart sapmanın 26 haftalık dönemi bu iki yıllık çizelge. İnce kırmızı ve mavi çizgiler, bu dönemin ortalaması civarında $ \ pm 3 $ standart hatalar olarak ayarlanmıştır. (Açıkçası işe yaramazlar.) Kalın altın ve yeşil çizgiler ortalama etrafında $ \ pm 3 $ standart sapmalara ayarlanmıştır.

(Kontrol çizgileri genellikle geriye zaman içinde, ancak bunu görsel referans için burada yaptım. Kontrolleri geriye dönük olarak uygulamak genellikle anlamsızdır: gelecekteki değişiklikleri belirlemeyi amaçlamaktadırlar.)

eğilim ve mevsimsel değişiklikler, sistemi 40-65. haftalar arasında (yıllık en yüksek) ve 85. haftadan sonra (yıllık yüksek artı bir yıllık kümülatif trendin üzerinde) kontrol dışı durumlara yönlendirir. Bunu bir kontrol çizelgesi olarak kullanmaya çalışan herhangi biri, çoğu zaman yanlışlıkla var olmayan nedenleri arıyor olacaktır. Pratikte bu sistemden nefret edilecek ve kısa sürede herkes tarafından görmezden gelinecektir. (Her ofis kapısının ve tüm koridor duvarlarının kontrol çizelgeleri ile kaplı olduğu, kimsenin okumaya zahmet etmediği, çünkü hepsi daha iyi bildiği şirketler gördüm.)

Devam etmenin doğru yolu , kaliteyi nasıl ölçersiniz gibi temel soruları sormakla başlar. Bunun üzerinde ne gibi etkilere sahip olabilirsiniz? En iyi çabalarınıza rağmen, bu önlemler nasıl dalgalanma eğilimi gösterir? Aşırı dalgalanmalar size ne söylerdi (kontrol edilebilir nedenleri ne olabilir)? Ardından, geçmiş verilerin istatistiksel bir analizini yapmanız gerekir. Dağılımları nedir? Geçici olarak ilişkili mi? Trendler var mı? Mevsimsel bileşenler? Kontrol dışı durumları göstermiş olabilecek geçmiş gezintilerin kanıtı mı?

Tüm bunları yaptıktan sonra, etkili bir kontrol çizelgesi (veya diğer istatistiksel izleme) sistemi oluşturmak mümkün olabilir. Literatür geniştir, bu nedenle bu şirket kaliteyi iyileştirmek için kantitatif yöntemler kullanma konusunda ciddiyse, bunun nasıl yapılacağına dair bol miktarda bilgi vardır. Ancak bu istatistiksel ilkeleri görmezden gelmek (ister zaman eksikliği ister bilgi eksikliği olsun) çabanın başarısız olacağını pratik olarak garanti eder.

+1: Harika yanıt. Bahsettiğiniz kanonik literatüre bazı referanslarınız olduğunu sanmıyorum?
@SnOrfus Keşke size güvenilir referanslar verebilseydim, ancak literatür konusunda güncel değilim. Bu gönderi, çeyrek asır önce okuduklarıma ve bu bilgileri uygularken öğrendiklerime dayanmaktadır. (O zamanlar özel kontrol çizelgesi yazıp sattım ve sonuç olarak - kelimenin tam anlamıyla - müşterilerin verilerinin birkaç milyon kontrol çizelgesine bakma ve bu çizelgelerin karar verme süreçleri için yeterliliği üzerine düşünme fırsatım oldu.)
Tamamen anlaşılır. Her iki şekilde de çok teşekkür ederim.
#2
+6
Greg Snow
2011-09-09 21:38:40 UTC
view on stackexchange narkive permalink

Kontrol grafiklerinin genel fikri, ortak neden varyasyonu ile özel neden varyasyonunu ayırt etmektir. Buradaki fikir, sürecin oldukça kararlı olması ve belirli bir dağılımdan veri üretmesidir (Poisson, arama sayısı için normalden daha mantıklı olsa da). Kontrol grafiklerinin en büyük avantajlarından biri, sürecin ne zaman değiştiğini bulmaya devam ederken doğal varyasyona aşırı tepki vermeyi sınırlandırmalarıdır.

Küçük varyasyonlara sahip oldukları için bir dizi gözlem seçmek, neredeyse sınırların da fazla olduğunu garanti eder daraltır ve bu nedenle uygunsuz reaksiyonları normal varyasyona yükseltir. Tüm verileri kullanmak çok daha mantıklıdır ve Poisson C grafiği kullanmak x çubuk grafiğinden daha iyi olabilir. Ancak, bir çağrı merkezinin tatiller veya sezon nedeniyle (desteklenenlere bağlı olarak) farklılıklar bekleyeceği de görülüyor, bu nedenle temel varsayımlar burada uygun bile olmayabilir.

Yapıyorlar gibi görünüyor anlamlı bir soruyu yanıtladığı için değil, çünkü yapabilirler.



Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...