Šta je DistCp u Hadoop-u?
Šta je DistCp u Hadoop-u?

Video: Šta je DistCp u Hadoop-u?

Video: Šta je DistCp u Hadoop-u?
Video: 9 Complete Sqoop Training - Overwrite Existing Data on Hadoop Distributed File System (HDFS) 2024, Maj
Anonim

DistCp (distribuirana kopija) je alat koji se koristi za veliko kopiranje među/unutar klastera. Koristi se MapReduce kako bi se izvršila njegova distribucija, rukovanje greškama i oporavak, te izvještavanje. On proširuje listu datoteka i direktorija u ulaz za mapiranje zadataka, od kojih će svaki kopirati particiju datoteka navedenih u izvornoj listi.

Slično se može pitati, da li Distcp prepisuje?

Trebao bih također neke elaborirati i objasniti to distcp - prepisati će prepisati fajl bez obzira odgovara li veličina ili ne. Ovo će ažurirati sve datoteke u hdfs-nn2 koje se ne podudaraju po veličini sa hdfs-nn1, kao i izbrisati sve vanjske datoteke.

Slično tome, šta je Hadoop FS komanda? Sistem datoteka ( FS ) ljuska uključuje razne ljuske slične komande koji su u direktnoj interakciji sa Hadoop Distribuirani sistem datoteka ( HDFS ) kao i drugi sistemi datoteka koji Hadoop podrške, kao što je Lokalni FS , HFTP FS , S3 FS , i drugi.

Na ovaj način, kako da prenesem podatke sa jednog Hdf-a na drugi Hdfs?

Hadoop fs cp – Najlakše način kopiranja podataka sa jednog izvorni direktorij u drugi . Koristiti hadoop fs -cp [izvor] [odredište]. Hadoop fs copyFromLocal – Treba kopirati podatke iz lokalnog sistema datoteka u HDFS ? Koristiti hadoop fs -copyFromLocal [izvor] [odredište].

Kako da kopiram klaster iz jednog klastera u drugi?

Kopiranje fajlova između klasteri . Možeš kopirajte fajlove ili direktorije između različitih klasteri pomoću naredbe hadoop distcp. Morate uključiti akreditive fajl u vašem kopija zahtjev tako izvor klaster može potvrditi da ste autentificirani za izvor klaster i cilj klaster.

Preporučuje se: