Soru:
Korelasyon katsayıları ile çalışma
Adhesh Josh
2011-08-31 17:42:43 UTC
view on stackexchange narkive permalink

Alışverişleriyle ilgili davranışlarını incelediğim üç yaş grubu için (yani 21-30 yaş, 31-40 yaş ve 41-50 yıl) üç Pearson korelasyon katsayım (.8978, .5676 ve .7865) var alışkanlıklara karşı kilo alımı.

Alışveriş alışkanlıkları ile kilo alma arasındaki en güçlü ilişkinin .8978 olduğunu söyleyebilir miyim?

Katsayılar arasındaki farktan yola çıkarak, üç yaş grubunun alışveriş alışkanlıkları ve kilo alımlarında bir fark olduğunu söyleyebilir miyim?

Son olarak, şunu ekleyebilir miyim? üç katsayı ve bir ortalama bulmak için üçe bölmek mi?

Tüm bunlar 'görünen değer' yorumları. Kabul edilebilir mi yoksa bir tür istatistiksel analiz yapmam gerekiyor mu? İkincisi ise (cennet korusun), SPSS bunu yapabilir mi?

Sadece emin olmak için, korelasyon katsayıları alışveriş alışkanlıkları ile üç alt popülasyon için kilo alımı arasında mı?
Evet, korelasyon katsayıları alışveriş alışkanlıkları ile kilo alımı arasında şu şekildedir: 21 ila 30 yıl (.8978, örnek büyüklüğü 105), 31 ila 40 yıl (.5678, örneklem büyüklüğü 95) ve 41 ila 50 yıl (.7865, numune büyüklüğü 120).
["Ortalama korelasyon değerleri"] (http://stats.stackexchange.com/questions/8019/averaging-correlation-values/8023#8023) okumanız gerekir. Oradaki bir tartışma (silindiğinden beri), bazı insanların ortalama almak için Fisher dönüşümünü kullandığını, diğerlerinin ise anlamlılığı hakkında şüpheler uyandırdığını gösterdi. Açık olan bir şey var: Üç korelasyon katsayınızın herhangi bir matematiksel kombinasyonunun, 21-50 yaş arası her yaş için alışveriş ve kilo arasındaki korelasyonla öngörülebilir herhangi bir ilişkisi olması gerekmez.
Ortalama korelasyonun tüm veri kümesindeki korelasyonla hiçbir ilişkisi olmayabilir.Bakınız: [Simpson Paradox] (https://en.wikipedia.org/wiki/Simpson%27s_paradox)
Iki yanıtlar:
#1
+12
Felix S
2011-08-31 20:26:55 UTC
view on stackexchange narkive permalink

Alışveriş alışkanlıkları ile kilo alımı arasındaki en güçlü ilişkinin .8978 olduğunu söyleyebilir miyim?

Betimsel olarak, en güçlü ilişki diyebilirsiniz. Diğer ikisinden önemli ölçüde daha güçlü olup olmadığı, örneklem büyüklüğüne bağlıdır. Bunun için bir çevrimiçi hesap makinesi var.

Katsayılardaki farklılığa dayanarak, üçünün alışveriş alışkanlıkları ve kilo alımlarında bir fark olduğunu söyleyebilir miyim? yaş grupları mı?

Bu, yukarıdaki istatistiksel soruyla aynı. Farkın önemi için her bir korelasyon çiftini test edin. Üç test gerçekleştirirken, $ \ alpha $ düzeyindeki bir düzeltme hakkında düşünmek isteyebilirsiniz. Burada ayrıntılı olarak açıklanan bir başka olasılık, yaş grubunu bir regresyon analizine sahte kodlu değişken olarak eklemek olabilir.

Son olarak, üç katsayıyı toplayıp üçe bölerek bir ortalama elde edebilir miyim?

Hayır. Ortalama bir korelasyon elde etmek için bir $ r $-to-$ Z $ dönüşümü ( Fisher's $ Z $) yapmanız, bu dönüştürülmüş değerlerin ortalamasını almanız ve ortalama $ Z $ 'ı $ r'ye geri çevirmeniz gerekir. tekrar $. Dönüşüm için birkaç çevrimiçi hesap makinesi var.

Sitemize hoş geldin Felix!
Fisher'in dönüşümünü kullanan yöntem hangi anlamda meşru bir korelasyon katsayıları * ortalamasıdır? Bu ortalama ne anlama geliyor? Bu yaklaşımla, eğer korelasyonlardan biri 1,0 ve diğerleri -1,0'dan büyükse, bu "ortalama" 1,0'a eşit olacaktır.
Ancak sadece 1,0 korelasyonunun sınır durumu için, bu da Z'nin "nf" değerine yol açar. Ampirik olarak daha olası korelasyon durumunda <| 1 |, Zs'nin geri dönüştürülmüş ortalaması orijinal rs ortalamasından daha az önyargılıdır (bkz. Örneğin [burada] (http://bit.ly/oqRE0k) veya [burada] (http://www.sciencedirect.com/science/article/pii/S0021901003015395)).
#2
+6
StasK
2011-09-02 00:21:57 UTC
view on stackexchange narkive permalink

Korelasyon katsayılarının ortalamasını almak anlamsız bir işlemdir. Korelasyon şudur $$ \ rho = \ frac {\ mbox {Cov} [X, Y]} {\ sqrt {\ mbox {Var} [X] \ mbox {Var} [Y]}}. $$ Ortalama bile olamazsınız her iki değişkendeki tüm grupların ortalamaları aynı olmadığı sürece, bileşenleri (kovaryans ve iki varyans). Değilse, popülasyon varyansınız / kovaryansınız, gruplar arası farklılıklar nedeniyle varyansların / kovaryansların (ağırlıklı) toplamından daha büyük / farklı olacaktır.

Aslında, ortalama korelasyonlar birçok istatistiksel bağlamda yapılır, örn. [Cronbach's alpha] (http://en.wikipedia.org/wiki/Cronbach%27s_alpha) hesaplaması için. İddianızı gerçekten anlayamıyorum ... Bu ortalama için elbette sağduyuya ihtiyaç var. Katsayıları farklı değişkenlerden veya çok farklı örneklerden ortalama alırsanız, ortaya çıkan ortalama hiç bir anlam ifade etmeyebilir. Ancak IMO, bu daha çok bir içerik meselesi, istatistiksel prosedürler değil.
@Felix Kaygı, yanlış yorumlanma potansiyeli ile ilgili olabilir. "Ortalama korelasyon 0,75'ti" bize yaş grupları hakkında ayrı ayrı bir şeyler söyler, ancak bize tüm yaş grupları için genel korelasyon hakkında neredeyse hiçbir şey söylemez; bu, prensipte neredeyse -1 kadar küçük ve neredeyse +1 kadar büyük olabilir ( ve yine de ortalama 0,75 verir).
@Felix, Cronbach's alpha varyanslarla çalışır ve tau-eşdeğeri ölçümler hakkında bazı güçlü varsayımlar yapar, yani varyansların sabit olmasıyla ilgili benzer varsayımlar. Ayrıca, Cronbach alfa aynı bireyler üzerinde ölçülen kovaryanslarla çalışır, burada ise OP popülasyon grupları arasında ortalama almak ister. Bunlar sadece ortalamanın farklı boyutlarıdır.
@StasK: Cronbach'ın alfasının orijinal soruda yayınlanan senaryodan başka bir senaryo olduğu konusunda size tamamen katılıyorum. Örneğim daha çok "Korelasyon katsayılarının ortalamasının alınması anlamsız bir işlemdir" e bir cevap olarak düşünülmüştür. Bu ortalamayı yapmanın kesinlikle birçok tuzağı ve yanlış kullanımı vardır; ancak AFAIK, anlamsız bir işlem olmadığı senaryolar vardır. Aksi takdirde, birçok istatistiksel ders kitabı ve birçok psikolojik araştırma anlamsız olacaktır (... ama belki de ...).
@whuber: Bu doğru. Özellikle hiyerarşik veri kümeleri söz konusu olduğunda, alt gruplar içindeki korelasyon, tüm veri noktalarının korelasyonuna kıyasla zıt yöne gidebilir (bu bir [ekolojik yanlışlığa] yol açar (http://en.wikipedia.org/wiki/Ecological_correlation )). Genel olarak bir ortalamanın hesaplanması birçok durumda anlamsız olabilir (örneğin, iki modlu dağılımlarla) ve toplam ölçümlerin bir ortalamasını hesaplamak daha da sorunlu olabilir. Sadece _if_ ortalamayı hesaplamak istiyorsa, Fisher's Z'nin yapılması gereken bir yol olduğunu iddia etmek istiyorum (örneğin [buraya] (http://bit.ly/oqRE0k) bakın).
@StasK Korelasyon katsayısının paydasında bir karekök ihtiyacınız var.


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...