Bir iş arkadaşımla tartıştım ve merak etmeye başladık, verilere özellik normalleştirme / ölçeklendirme ne zaman uygulanmalı? Diyelim ki bazı özelliklerin çok geniş bir değer aralığına sahip olduğu ve bazı özelliklerin çok geniş bir değer aralığına sahip olmadığı bir dizi özelliğimiz var.
Temel bileşen analizi yapacak olsaydım, verileri normalleştirmem gerekirdi, bu açıktır, ancak verileri basit ve basit k-en yakın komşu / doğrusal regresyon kullanarak sınıflandırmaya çalıştığımızı varsayalım. yöntem.
Verileri hangi koşullar altında normalleştirmeli ya da normalleştirmemeliyim ve neden? Cevaba eklenen noktayı vurgulayan kısa ve basit bir örnek mükemmel olacaktır.