Sadržaj:

Kako mogu poboljšati svoj sqoop učinak?
Kako mogu poboljšati svoj sqoop učinak?

Video: Kako mogu poboljšati svoj sqoop učinak?

Video: Kako mogu poboljšati svoj sqoop učinak?
Video: Как установить Hadoop в Windows 2024, Maj
Anonim

Za optimizaciju performanse , set the broj zadataka mapiranja na vrijednost manju od the maksimalan broj veza koji the baza podataka podržava. Kontroliranje the količina paralelizma koja Sqoop koristit će se za prijenos podataka the glavni način kontrole the load on vaša baza podataka.

Shodno tome, šta se dešava ako sqoop ne uspe između procesa?

Tipično Sqoop posao koji unosi podatke iz izvorne baze podataka u HDFS će kopirati podatke u ciljni direktorij. Kopirana datoteka će biti izbrisana ako sqoop ne uspije bez kompletiranja.

Neko se takođe može zapitati, kako se postiže paralelizam u sqoop-u? Kontroliranje Paralelizam . Sqoop uvozi podatke paralelno iz većine izvora baze podataka. Možete odrediti broj zadataka mapiranja (paralelnih procesa) koji će se koristiti za obavljanje uvoza koristeći argument -m ili --num-mappers. Svaki od ovih argumenata uzima cjelobrojnu vrijednost koja odgovara stepenu paralelizam zaposliti

Shodno tome, kako da poboljšam performanse svog Hive upita?

Ispod je lista praksi koje možemo slijediti da bismo optimizirali Hive Queries

  1. Omogućite kompresiju u košnici.
  2. Optimize Joins.
  3. Izbjegavajte globalno sortiranje u košnici.
  4. Omogućite Tez Execution Engine.
  5. Optimiziraj LIMIT operator.
  6. Omogući paralelno izvršavanje.
  7. Omogućite Mapreduce Strict Mode.
  8. Pojedinačno smanjenje za više grupa BY.

Kako funkcionira sqoop split?

Može se koristiti za poboljšanje performansi uvoza postizanjem većeg paralelizma. Sqoop stvara razdvaja na osnovu vrednosti u određenoj koloni tabele koja je određena sa -- podijeliti -od strane korisnika putem naredbe import. Ako nije dostupan, primarni ključ ulazne tabele se koristi za kreiranje razdvaja.

Preporučuje se: