Pagrindinės grupuotų duomenų tendencijos



The sugrupuotų duomenų centrinės tendencijos jie naudojami statistikoje tam, kad apibūdintų tam tikrą pateiktų duomenų grupės elgesį, pvz., ką jie yra artimi, koks yra surinktų duomenų vidurkis, be kita ko,.

Kai imamasi didelių duomenų, naudinga juos suskirstyti, kad jie turėtų geresnę jų tvarką ir galėtų apskaičiuoti tam tikras centrinės tendencijos priemones.

Tarp labiausiai paplitusių centrinės tendencijos priemonių yra aritmetinis vidurkis, mediana ir režimas. Šie skaičiai nurodo tam tikras savybes, susijusias su tam tikru eksperimentu surinktais duomenimis.

Norint naudoti šias priemones, pirmiausia reikia žinoti, kaip grupuoti duomenis.

Sugrupuoti duomenys

Norėdami grupuoti duomenis pirmiausia turite apskaičiuoti duomenų diapazoną, kuris gaunamas atimant didžiausią vertę, atėmus mažiausią duomenų vertę..

Tada pasirinkite numerį „k“, kuris yra klasių, kuriose norite grupuoti duomenis, skaičius.

Toliau skirstome intervalą tarp „k“, kad gautume grupuojamų klasių amplitudę. Šis skaičius yra C = R / k.

Galiausiai pradėtas grupavimas, kuriam pasirenkamas mažesnis skaičius nei mažiausia gautų duomenų vertė..

Šis numeris bus apatinė pirmos klasės riba. Tam pridedama C. Gauta vertė bus viršutinė pirmos klasės riba.

Tada į šią vertę pridedama C ir gaunama antrojo klasės viršutinė riba. Tokiu būdu jūs tęsite tol, kol gausite paskutinės klasės viršutinę ribą.

Po to, kai duomenys yra sugrupuoti, galėsite apskaičiuoti vidurkį, vidurkį ir madą.

Norėdami parodyti, kaip apskaičiuojamas aritmetinis vidurkis, mediana ir režimas, mes tęsime pavyzdį.

Pavyzdys

Todėl grupuodami duomenis gausite tokią lentelę kaip:

Trys pagrindinės centrinės tendencijos priemonės

Dabar mes pradėsime apskaičiuoti aritmetinį vidurkį, medianą ir režimą. Pirmiau pateiktas pavyzdys bus naudojamas šiai procedūrai iliustruoti.

1 - aritmetinis vidurkis

Aritmetinis vidurkis yra kiekvieno dažnio padauginimas iš intervalo vidurkio. Tada pridedami visi šie rezultatai ir galiausiai padalinami iš visų duomenų.

Naudojant ankstesnį pavyzdį galėtume gauti, kad aritmetinis vidurkis yra lygus:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111

Tai rodo, kad lentelėje pateikta duomenų vidutinė vertė yra 5.11111.

2 - Vidutinis

Norėdami apskaičiuoti duomenų rinkinio mediana, pirmiausia visi duomenys yra užsakomi mažiausiai iki didžiausio. Galima pateikti du atvejus:

- Jei duomenų numeris yra nelyginis, tada mediana yra duomenys, kurie yra teisingi centre.

- Jei duomenų skaičius yra lygus, vidurkis yra dviejų duomenų, likusių centre, vidurkis.

Kai kalbama apie sugrupuotus duomenis, mediana apskaičiuojama taip:

- N / 2 apskaičiuojamas, kur N yra bendri duomenys.

- Pirmasis intervalas yra ieškomas, kai sukauptas dažnis (dažnių suma) yra didesnis nei N / 2, o šio intervalo apatinė riba - Li..

Mediana apskaičiuojama pagal šią formulę:

Me = Li + (Ls-Li) * (N / 2 - susikaupęs dažnis prieš Li) / [Li, Ls] dažnis

Ls yra aukščiau nurodytos ribos viršutinė riba.

Jei naudojama aukščiau pateikta duomenų lentelė, turime N / 2 = 18/2 = 9. Surinkti dažniai yra 4, 8, 14 ir 18 (po vieną kiekvienai lentelės eilutei).

Todėl reikia pasirinkti trečiąjį intervalą, nes sukauptas dažnis yra didesnis nei N / 2 = 9.

Taigi Li = 5 ir Ls = 7. Taikant pirmiau aprašytą formulę turite:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.

3 - Mada

Mada - tai vertybė, turinti dažniausiai tarp visų grupuotų duomenų; tai yra vertė, kuri daugiausiai kartojama pradiniame duomenų rinkinyje.

Kai turite labai didelį duomenų kiekį, ši formulė naudojama grupuotų duomenų režimui apskaičiuoti:

Mo = Li + (Ls-Li) * (Li dažnis - L (i-1) dažnis) / ((L (i-1)) dažnio dažnis + (L-dažnio dažnis L ( i + 1)))

Intervalas [Li, Ls] yra intervalas, kuriame randamas didžiausias dažnis. Šiame straipsnyje pateiktame pavyzdyje mes turime tokią madą:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

Kita formulė, naudojama norint gauti apytikslę mados vertę, yra tokia:

Mo = Li + (Ls-Li) * (dažnis L (i + 1)) / (dažnis L (i-1) + dažnis L (i + 1)).

Pagal šią formulę sąskaitos yra tokios:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

Nuorodos

  1. Bellhouse, D. R. (2011). Abraham De Moivre: Klasikinės tikimybės ir jos taikymo etapų nustatymas. „CRC Press“.
  2. Cifuentes, J. F. (2002). Įvadas į tikimybių teoriją. Kolumbijos pilietis.
  3. Daston, L. (1995). Klasikinė tikimybė apšvietime. Prinstono universiteto leidykla.
  4. Larson, H. J. (1978). Įvadas į tikimybių teoriją ir statistinį išvadą. Redakcija Limusa.
  5. Martel, P. J., & Vegas, F. J. (1996). Tikimybės ir matematinė statistika: taikymas klinikinėje praktikoje ir sveikatos valdymas. Ediciones Díaz de Santos.
  6. Vázquez, A. L., ir Ortiz, F. J. (2005). Statistiniai metodai kintamumo matavimui, aprašymui ir kontrolei. Kantabrijos universitetas.
  7. Vázquez, S. G. (2009). Matematikos vadovas, skirtas susipažinti su Universitetu. Redakcinis studijų centras Ramon Areces SA.