Kako da uklonim vrijednosti koje nedostaju u R?
Kako da uklonim vrijednosti koje nedostaju u R?

Video: Kako da uklonim vrijednosti koje nedostaju u R?

Video: Kako da uklonim vrijednosti koje nedostaju u R?
Video: 4 tipa muškaraca od kojih treba bežati - Divna Milovanović 2024, Maj
Anonim

Prvo, ako želimo da isključimo nedostajuće vrijednosti iz matematičkih operacija koristiti N / A . rm = TRUE argument. Ako ne isključite ove vrijednosti većina funkcija će vratiti an N / A . Možemo također poželjeti da podskupimo naše podaci da dobijemo potpuna zapažanja, ta zapažanja (redovi) u našem podaci koji sadrže br podaci koji nedostaju.

Jednostavno, kako R rješava nedostajuće vrijednosti?

U R the nedostajuće vrijednosti su kodirani simbolom N / A . Za identifikaciju nedostataka u vašem skupu podataka funkcija je. N / A (). Kada uvezete skup podataka iz drugih statističkih aplikacija nedostajuće vrijednosti može biti kodiran brojem, na primjer 99. Da bi pustili R znam da je to a nedostaje vrijednost morate ga prekodirati.

Nadalje, kako imputirate vrijednosti koje nedostaju u R? Rješavanje podataka koji nedostaju pomoću R

  1. colsum(is.na(okvir podataka))
  2. suma(is.na(okvir podataka$ime kolone)
  3. Nedostajuće vrijednosti mogu se tretirati korištenjem sljedećih metoda:
  4. Srednja vrijednost/Mod/Medijana Imputacija: Imputacija je metoda kojom se nedostajuće vrijednosti popunjavaju procijenjenim.
  5. Model predviđanja: Model predviđanja je jedan od sofisticiranih metoda za rukovanje podacima koji nedostaju.

Nakon toga, neko se također može pitati, kako da uklonim redove koji sadrže NA vrijednosti u R?

omit() funkcija vraća listu bez ikakvog redova to sadrže vrijednosti . Prolazak vašeg okvira podataka kroz N / A . omit() funkcija je jednostavan način za brisanje nepotpunih zapisa iz vaše analize. Efikasan je način uklanjanja na vrijednosti u r.

Kako da uklonim vanjske vrijednosti iz skupa podataka u R?

Nema konkretnih R funkcije za ukloniti vanjske vrijednosti . Prvo ćete morati saznati koja su zapažanja outliers i onda ukloniti njih, tj. pronalaženje prvog i trećeg kvartila (šarki) i interkvartilnog raspona da bi se numerički definirale unutrašnje ograde.

Preporučuje se: