R'de birden çok veri çerçevesini birleştirmenin etkili yolu

Anthony Kong

2011-08-16 12:49:37 UTC

view on stackexchange narkive permalink

Birkaç dosyanın içeriğini birleştirerek büyük bir veri çerçevesi oluşturuyorum. Bu dosyalar aynı sütun düzenini paylaşır.

  c = read.delim ('bigfile1.txt') c1 = read.delim ('bigfile2.txt') c2 = read.delim ('bigfile3 .txt ') ctmp1 = merge (c, c1, all = TRUE) ctmp2 = merge (ctmp1, c2, all = TRUE)

Yukarıdaki kod verimli mi?

Bunun yerine aynı değişken adını yeniden kullanmalı mıyım, örneğin

  tmp = merge (c, c1, all = TRUE) tmp = merge (tmp, c2, all = TRUE)

Ne tür bir verimlilik arıyorsunuz? Hız mı bellek kullanımı mı?

mptiktas: Güzel soru! Önce performans, ikinci olarak bellek ayak izi.

Bunun performans üzerinde ciddi bir etkisi olacağından şüpheliyim, ancak dosyaları bir listeye okur ve "do.call" aracılığıyla "birleştirmek" için "rbind" veya "cbind" kullanırdım. Bu şekilde etrafta fazladan nesneler kalmaz.

Şüphelendiğim gibi şeyler varsa (cevabıma bakın), dosyalara R dışında katılmak ve sonra onları okumaktan daha iyi olabilirsiniz: performans iyi olacak ve muhtemelen 1'den fazla dosyaya sahip olma ihtiyacından kaçınabilirsiniz ( aynı anda belleğe eklediğiniz dosya).

@Nick:, önerinize tamamen katılıyor. Bu özel durumda, sadece kaynak klasöre okuma erişimim var. Elbette, dosyaları yerel bir konuma gönderebilir ve onları bir araya getirebilirim.

Sorunuzu `` dput (head (c)) `,` dput (head (c1)) `,` dput (head (c2)) 'nin içeriğiyle güncelleyebilir misiniz, böylece insanlar cevaplarını çalışan gerçek kodla güncelleyebilirler? "En sevdiğimAraçToDoHipotetik Analizimi kontrol edin" referanslarının hiç kimse için bu kadar yapıcı olduğunu sanmıyorum. Bu yöntemleri iş başında görebilseydik çok daha ilginç bir oyun olurdu.

@chase: Bu komutları denedim. Özel bilgiler olan bazı temel verileri ortaya çıkaracağından, muhtemelen bunları buraya gönderemem.

Veri yapınızı kopyalayan bazı rastgele veriler oluşturmaya ne dersiniz? `rnorm ()`, `runif ()`, `sample ()`, vb. hepsi burada kullanılabilir. Esasen, "veriyi kontrol edin, bu tür şeyler için harika olduğunu duydum" dan daha ayrıntılı yanıtlar getirecek bir şey istiyorum ve tekrarlanabilir bir örnek, insanlara XYZ'nin ne kadar havalı olduğunu gösterme şansı verecektir.

@chase. İyi bir nokta. Bir şans vereceğim. Burada çaylak bu yüzden nefesini tutma. :-)