Šta je AWS MapReduce?
Šta je AWS MapReduce?

Video: Šta je AWS MapReduce?

Video: Šta je AWS MapReduce?
Video: Introduction to Amazon Elastic MapReduce | Big Data Application on AWS | Intellipaat 2024, Novembar
Anonim

Amazon Elastic MapReduce (EMR) je Amazon Web Services ( AWS ) alat za obradu i analizu velikih podataka. Amazon EMR obrađuje velike podatke preko Hadoop klastera virtuelnih servera na Amazon Elastic Compute Cloud (EC2) i Amazon Simple Storage Service (S3).

Na ovaj način, kako funkcioniše AWS EMR?

Usluga pokreće broj Amazon EC2 instanci koje je odredio korisnik, koji se sastoji od jednog glavnog i više drugih čvorova. Amazon EMR pokreće Hadoop softver na ovim instancama. Glavni čvor dijeli ulazne podatke u blokove i distribuira obradu blokova na druge čvorove.

Osim gore navedenog, koja je razlika između ec2 i EMR? Za razliku od EMR , EC2 ne kategorizira slave čvorove u jezgre i čvorove zadataka. Ovo povećava rizik od gubitka HDFS podataka u slučaju uklanjanja/gubljenja čvora. EC2 koristi Apache biblioteke (s3a) za pristup podacima na s3. S druge strane, EMR koristi AWS vlasnički kod za brži pristup s3.

Osim toga, da li se AWS EMR u potpunosti upravlja?

Amazon Elastic MapReduce ( EMR ) je u potpunosti upravljano Hadoop i Spark platforma od Amazon Web servis ( AWS ). With EMR , AWS korisnici mogu brzo pokrenuti Hadoop klastere sa više čvorova za obradu velikih radnih opterećenja.

Da li AWS koristi Hadoop?

Amazon Web Services koristi Apache otvorenog koda Hadoop distribuiranu računarsku tehnologiju kako bi se olakšao pristup velikim količinama računarske snage za izvršavanje zadataka intenzivnih podataka. Hadoop , open-source verziju Google MapReducea, već koriste kompanije kao što su Yahoo i Facebook.

Preporučuje se: