Perform a function on both disk.frames .x and .y, each chunk of .x and .y gets run by .f(x.chunk, y.chunk)
cmap2(.x, .y, .f, ...)
map_by_chunk_id(.x, .y, .f, ..., outdir)
a disk.frame
a disk.frame
a function to be called on each chunk of x and y matched by chunk_id
not used
output directory
cars.df = as.disk.frame(cars)
cars2.df = cmap2(cars.df, cars.df, ~data.table::rbindlist(list(.x, .y)))
collect(cars2.df)
#> speed dist
#> 1: 4 2
#> 2: 4 10
#> 3: 7 4
#> 4: 7 22
#> 5: 8 16
#> 6: 9 10
#> 7: 10 18
#> 8: 10 26
#> 9: 10 34
#> 10: 4 2
#> 11: 4 10
#> 12: 7 4
#> 13: 7 22
#> 14: 8 16
#> 15: 9 10
#> 16: 10 18
#> 17: 10 26
#> 18: 10 34
#> 19: 11 17
#> 20: 11 28
#> 21: 12 14
#> 22: 12 20
#> 23: 12 24
#> 24: 12 28
#> 25: 13 26
#> 26: 13 34
#> 27: 13 34
#> 28: 11 17
#> 29: 11 28
#> 30: 12 14
#> 31: 12 20
#> 32: 12 24
#> 33: 12 28
#> 34: 13 26
#> 35: 13 34
#> 36: 13 34
#> 37: 13 46
#> 38: 14 26
#> 39: 14 36
#> 40: 14 60
#> 41: 14 80
#> 42: 15 20
#> 43: 15 26
#> 44: 15 54
#> 45: 16 32
#> 46: 13 46
#> 47: 14 26
#> 48: 14 36
#> 49: 14 60
#> 50: 14 80
#> 51: 15 20
#> 52: 15 26
#> 53: 15 54
#> 54: 16 32
#> 55: 16 40
#> 56: 17 32
#> 57: 17 40
#> 58: 17 50
#> 59: 18 42
#> 60: 18 56
#> 61: 18 76
#> 62: 18 84
#> 63: 19 36
#> 64: 16 40
#> 65: 17 32
#> 66: 17 40
#> 67: 17 50
#> 68: 18 42
#> 69: 18 56
#> 70: 18 76
#> 71: 18 84
#> 72: 19 36
#> 73: 19 46
#> 74: 19 68
#> 75: 20 32
#> 76: 20 48
#> 77: 20 52
#> 78: 20 56
#> 79: 20 64
#> 80: 22 66
#> 81: 23 54
#> 82: 19 46
#> 83: 19 68
#> 84: 20 32
#> 85: 20 48
#> 86: 20 52
#> 87: 20 56
#> 88: 20 64
#> 89: 22 66
#> 90: 23 54
#> 91: 24 70
#> 92: 24 92
#> 93: 24 93
#> 94: 24 120
#> 95: 25 85
#> 96: 24 70
#> 97: 24 92
#> 98: 24 93
#> 99: 24 120
#> 100: 25 85
#> speed dist
# clean up cars.df
delete(cars.df)
delete(cars2.df)