Šta je jezero podataka u Hadoop-u?
Šta je jezero podataka u Hadoop-u?

Video: Šta je jezero podataka u Hadoop-u?

Video: Šta je jezero podataka u Hadoop-u?
Video: 30 глупых вопросов Data Engineer [Карьера в IT] 2024, Maj
Anonim

A Hadoop jezero podataka je podaci platforma za upravljanje koja se sastoji od jedne ili više Hadoop klasteri. Koristi se uglavnom za obradu i pohranjivanje nerelacijskih podaci , kao što su datoteke evidencije, internetski zapisi klikova, senzor podaci , JSON objekte, slike i objave na društvenim mrežama.

U tom smislu, koja je razlika između skladišta podataka i jezera podataka?

Jezera podataka i podaci Skladišta se naširoko koriste za skladištenje velikih podaci , ali to nisu zamjenjivi pojmovi. A data lake je ogroman bazen sirovina podaci , čija svrha još nije definisana. A skladište podataka je spremište za strukturirane, filtrirane podaci koji je već obrađen za određenu svrhu.

Dodatno, šta je arhitektura jezera podataka? A Data Lake je skladište za pohranu koje može pohraniti veliku količinu strukturiranih, polustrukturiranih i nestrukturiranih podaci . Za razliku od hijerarhijske Dataware kuće gdje podaci je pohranjen u datotekama i fasciklama, Data lake ima stan arhitektura.

U vezi s tim, šta se podrazumijeva pod jezerom podataka?

A data lake je skladište za skladištenje koje sadrži ogromnu količinu sirovog podaci u svom izvornom formatu dok ne bude potreban. Dok je hijerarhijski podaci magacinske radnje podaci u fajlovima ili fasciklama, a data lake koristi ravnu arhitekturu za skladištenje podaci . Pojam data lake se često povezuje sa Hadoop orijentiranim skladištenjem objekata.

Da li je Elasticsearch jezero podataka?

A data lake je jednostavno mjesto za parkiranje podaci dok vam ne zatreba, a može obuhvatiti HDFS (najčešći), pohranu objekata, NAS kutije ili bilo šta drugo. u osnovi, Elasticsearch je alat za indeksiranje podaci , nije za skladištenje podaci sebe.

Preporučuje se: