Kako se postiže lokalizacija podataka u Hadoop-u?
Kako se postiže lokalizacija podataka u Hadoop-u?

Video: Kako se postiže lokalizacija podataka u Hadoop-u?

Video: Kako se postiže lokalizacija podataka u Hadoop-u?
Video: КАК НАСТРОИТЬ L4D2 2024, Novembar
Anonim

Lokalizacija podataka in Hadoop . Uzmite primjer broja riječi, gdje se većina riječi ponavlja 5 ili više puta. U tom slučaju nakon Mapper faze, svaki izlaz mapera će imati riječi u rasponu od 5 Lacs. Ovaj kompletan proces pohranjivanja Mapper izlaza u LFS naziva se kao Lokalizacija podataka.

Imajući ovo u vidu, šta je lokalizacija podataka u Hadoop-u?

The Concept of Podaci lokalitet u Hadoop podaci lokalitet u MapReduce odnosi se na sposobnost da se proračun pomjeri blizu mjesta gdje je stvarna podaci nalazi se na čvoru, umjesto da se kreće velikom podaci na računanje. Ovo minimizira zagušenje mreže i povećava ukupnu propusnost sistema.

Takođe, kako se čuvaju veliki podaci? Većina ljudi automatski povezuje HDFS, ili Hadoop distribuirani sistem datoteka, sa Hadoop-om podaci skladišta. HDFS pohranjuje informacije u klastere koji se sastoje od manjih blokova. Ovi blokovi su pohranjeni u fizičkoj skladištenje jedinice, kao što su interni disk drajvovi.

Samo tako, kako se podaci pohranjuju u Hadoop-u?

Na Hadoop klaster, the podaci unutar HDFS-a i MapReduce sistem su smješteni na svakoj mašini u klasteru. Podaci je pohranjeni in podaci blokova na DataNodes. HDFS ih replicira podaci blokove, obično veličine 128 MB, i distribuira ih tako da se repliciraju unutar više čvorova u klasteru.

Kako se fajlovi pohranjuju u HDFS?

HDFS izlaže a fajl sistemski imenski prostor i omogućava da se podaci korisnika pohranjeni in datoteke . Interno, a fajl je podijeljen na jedan ili više blokova i ti blokovi su pohranjeni u skupu DataNodes. NameNode se izvršava fajl sistemske operacije imenskog prostora kao što su otvaranje, zatvaranje i preimenovanje datoteke i imenike.

Preporučuje se: