Sadržaj:

Šta su outliers u analizi podataka?
Šta su outliers u analizi podataka?

Video: Šta su outliers u analizi podataka?

Video: Šta su outliers u analizi podataka?
Video: 30 глупых вопросов Data Engineer [Карьера в IT] 2024, Maj
Anonim

U statistici, an outlier je podaci tačka koja se značajno razlikuje od ostalih zapažanja. An outlier može biti zbog varijabilnosti u mjerenju ili može ukazivati na eksperimentalnu grešku; potonji su ponekad isključeni iz podaci set. An outlier može izazvati ozbiljne probleme u statističke analize.

Uzimajući ovo u obzir, kako pronalazite vanjske vrijednosti u podacima?

Tačka koja je izvan podaci innerfence skupa je klasifikovan kao minor outlier , dok se onaj koji pada izvan vanjskih ograda klasificira kao glavni outlier . Da biste pronašli unutrašnje ograde za svoje podaci postavite, prvo, pomnožite interkvartilni raspon sa 1,5. Zatim dodajte rezultat Q3 i oduzmite ga od Q1.

Osim gore navedenog, trebam li ukloniti vanjske vrijednosti iz mojih podataka? Za the najvećim dijelom, ako vaše podatke na vas utiču ovi ekstremni slučajevi mogu vezan the doprinos istorijskom predstavniku vaše podatke thatexcludes outliers . Od slučaja do slučaja odredite šta the efekat od outliers bio. I odatle odlučite da li želite ukloniti , promijenite ili zadržite theoutlier vrijednosti.

U vezi s tim, kako se analiza podataka nosi sa outliers?

Evo četiri pristupa:

  1. Izbacite vanredne zapise. U slučaju Billa Gatesa, ili nekog drugog istinskog izvanrednog, ponekad je najbolje potpuno ukloniti taj zapis iz skupa podataka kako ta osoba ili događaj ne bi izobličili vašu analizu.
  2. Ograničite svoje podatke o izvanrednim vrijednostima.
  3. Dodijelite novu vrijednost.
  4. Probajte transformaciju.

Šta je primjer outlier-a?

Outlier . više Vrijednost koja "leži izvan" (što je mnogo manja ili veća od) većine drugih vrijednosti u skupu podataka. Za primjer u bodovima 25, 29, 3, 32, 85, 33, 27, 28 oba3 i 85 su " outliers ".

Preporučuje se: