Döviz ve tahvil piyasalarındaki zaman serisi verilerine bakıyorum (aşırı hareketlerde geri dönüşü test etmek için). Talihsiz "işaret" verileri, yani yüksek frekanslı veriler, birçok soruna eğilimlidir ve açık bir şekilde analizi önemli ölçüde bozabilir. Aşağıdaki oldukça sık veri temizleme sorunlarında hangi R kitaplığının yardımcı olabileceğini bilmek istiyorum:
1) bir artış:
Bu, genellikle bir piyasa yapıcı bir tikte yanlış bir fiyat teklifi yazdırdığında oluşturulur, ancak bu fiyatta ticarete açıklık olmazdı, çünkü bir saniye kadar sürdü. Ani yükselişi ortadan kaldırmak istiyorum (ancak yalnızca bir (veya belki 2) baskı varsa)
2) teklif sorma boşluğu:
Bu durumda, pazar oldukça likit değildir ve veri algoritması teklifler arasında atlar ve sorar (bu durumda 2bps genişliğinde) bu garip buluta neden olur.
Bu şeyleri temizlemeye nereden başlamalıyım, belli ki en az miktarda gerçek veriyi atmaya çalışıyorum. Burada "verilere bakma" kuralının geçerli olduğunun farkındayım, ancak her biri 100 günlük veri içeren 1000 seriye baktığınızda, bunun nasıl hızlı bir şekilde pratik olmayacağını görebilirsiniz, bu nedenle otomatik yardıma ihtiyacım var. Varsa Python dil yöntemlerine de bakacağım.