클러스터간 데이터를 복사할때는 hadoop 쉘 커맨드인 distcp를 사용한다.
hadoop distcp hdfs://복사서버명:포트번호/복사경로 hdfs://저장서버명:포트번호/저장경로
hadoop distcp hdfs://복사서버명:포트번호/복사경로 hdfs://저장서버명:포트번호/저장경로
예) (John,18,4,0f)
예)
X = GROUP A BY f1; DUMP X;
(1,{(1,2,3)})
(4,{(4,2,1),(4,3,3)})
(8,{(8,3,4)})
예) [name#John,phone#5551212]