Sturgų taisyklė, taikymas ir pavyzdžiai



The Sturges taisyklė yra kriterijus, naudojamas nustatyti klasių ar intervalų, kurie yra būtini statistinių duomenų rinkinio grafiniam vaizdavimui, skaičių. Šią taisyklę 1926 m. Paskelbė vokiečių matematikas Herbert Sturges.

Sturges pasiūlė paprastą metodą, pagrįstą x mėginių skaičiumi, leidžiančiu rasti klasių skaičių ir jų diapazono amplitudę. „Sturges“ taisyklė yra plačiai naudojama, ypač statistikos srityje, ypač kuriant dažnio histogramas.

Indeksas

  • 1 Paaiškinimas
  • 2 Programos
  • 3 Pavyzdys
  • 4 Nuorodos

Paaiškinimas

„Sturges“ taisyklė - tai empirinis metodas, plačiai naudojamas aprašomojoje statistikoje, siekiant nustatyti klasių, kurios turi egzistuoti dažnio histogramoje, skaičių, kad būtų galima klasifikuoti duomenų rinkinį, vaizduojantį pavyzdį arba populiaciją.

Iš esmės ši taisyklė nustato grafinių konteinerių plotį, dažnio histogramas.

Norėdamas nustatyti savo taisyklę, Herbert Sturges laikė idealią dažnio diagramą, kurią sudaro K intervalai, kur i intervalas turi tam tikrą skaičių mėginių (i = 0, ... k - 1), atstovaujamą kaip:

Šis mėginių skaičius apskaičiuojamas pagal būdų, kuriais galima rinkti rinkinį, skaičių; tai yra binominis koeficientas, išreikštas taip:

Siekiant supaprastinti išraišką, jis taikė logaritmų savybes abiejose lygties dalyse:

Taigi, Sturges nustatė, kad optimalų intervalų k skaičių nurodo išraiška:

Jis taip pat gali būti išreikštas kaip:

Šioje frazėje:

- k yra klasių skaičius.

- N yra bendras mėginio stebimų skaičius.

- Žurnalas yra bendras pagrindo 10 logaritmas.

Pvz., Norint sukurti dažnio histogramą, išreiškiančią atsitiktinį 142 vaikų aukščio mėginį, intervalų ar klasių, kurias turi paskirstymas, skaičius:

k = 1 + 3,322 * žurnalas10 (N)

k = 1 + 3,322* žurnalas (142)

k = 1 + 3,322* 2,1523

k = 8,14 ≈ 8

Taigi pasiskirstymas bus 8 intervalais.

Intervalų skaičius visada turi būti pateikiamas sveikais skaičiais. Tais atvejais, kai vertė yra dešimtainė, turi būti atliktas artimiausio sveiko skaičiaus apytikslis.

Programos

Sturgų taisyklė taikoma daugiausia statistikoje, nes ji leidžia dažnių pasiskirstymą skaičiuojant klasių (k) skaičių, taip pat kiekvieno iš jų ilgį, taip pat žinomą kaip amplitudę.

Amplitudė yra skirtumas tarp klasės viršutinės ir apatinės ribos, padalintas iš klasių skaičiaus ir išreiškiamas:

Yra daug empirinių taisyklių, leidžiančių atlikti dažnių paskirstymą. Tačiau „Sturges“ taisyklė dažniausiai naudojama, nes ji artima klasių skaičiui, kuris paprastai svyruoja nuo 5 iki 15.

Tokiu būdu apsvarstykite vertę, tinkamai atspindinčią pavyzdį ar populiaciją; tai yra, apytikslis neatstovauja ekstremalioms grupėms, taip pat neveikia pernelyg daug klasių, kurios neleidžia apibendrinti mėginio.

Pavyzdys

Būtina atlikti dažnio histogramą pagal pateiktus duomenis, atitinkančius vyrų, kurie atlieka pratimus vietinėje sporto salėje, apklausą..

Norint nustatyti intervalus, turite žinoti, koks yra mėginio dydis arba stebimų skaičius; šiuo atveju turite 30.

Tada taikoma „Sturges“ taisyklė:

k = 1 + 3,322 * žurnalas10 (N)

k = 1 + 3,322* žurnalas (30)

k = 1 + 3,322* 1,4771

k = 5.90 ≈ 6 intervalai.

Nuo intervalų skaičiaus galima apskaičiuoti šių amplitudžių skaičių; ty kiekvieno dažnio histogramoje rodomos juostos plotis:

Apatinė riba laikoma mažiausia duomenų verte, o viršutinė riba - didžiausia vertė. Skirtumas tarp viršutinės ir apatinės ribos vadinamas kintamojo intervalu arba keliu (R).

Iš lentelės matome, kad viršutinė riba yra 46 ir apatinė riba 13; tokiu būdu kiekvienos klasės amplitudė bus:

Intervalai sudarys viršutinę ir apatinę ribą. Norėdami nustatyti šiuos intervalus, pradėkite skaičiuoti nuo apatinės ribos, pridedant prie jo (6) nustatytą amplitudę:

Tada apskaičiuojamas absoliutusis dažnis, kad būtų galima nustatyti kiekvienam intervalui tenkančių vyrų skaičių; šiuo atveju tai yra:

- Intervalas 1: 13 - 18 = 9

- Intervalas 2: 19 - 24 = 9

- Intervalas 3: 25 - 30 = 5

- Intervalas 4: 31 - 36 = 2

- Intervalas 5: 37 - 42 = 2

- Intervalas 6: 43 - 48 = 3

Pridedant absoliutų kiekvienos klasės dažnį, tai turi būti lygi bendram mėginio skaičiui; šiuo atveju 30.

Vėliau apskaičiuojamas kiekvieno intervalo santykinis dažnis, absoliutus šio intervalo dažnis padalijamas iš viso stebėjimų skaičiaus:

- 1 intervalas: fi = 9 ÷ 30 = 0,30

- 2 intervalas: fi = 9 ÷ 30 = 0,30

- 3 intervalas: fi = 5 ÷ 30 = 0.1666

- 4 intervalas: fi = 2 ÷ 30 = 0,0666

- 5 intervalas: fi = 2 ÷ 30 = 0,0666

- 4 intervalas: fi = 3 ÷ 30 = 0,10

Tada galite pateikti lentelę, atspindinčią duomenis, taip pat diagramą iš santykinio dažnio, palyginti su gautais intervalais, kaip matyti iš šių vaizdų:

Tokiu būdu „Sturges“ taisyklė leidžia nustatyti klasių ar intervalų, kuriais gali būti dalijamasi mėginiu, skaičių, kad būtų galima apibendrinti duomenų pavyzdį rengiant lenteles ir grafikus.

Nuorodos

  1. Alfonso Urquía, M. V. (2013). Atskirų įvykių modeliavimas ir modeliavimas. UNED,.
  2. Altmanas Naomi, M. K. (2015). „Paprasta linijinė regresija“. Gamtos metodai .
  3. Antúnez, R. J. (2014). Švietimo statistika. Skaitmeninis UNID.
  4. Fox, J. (1997). Taikoma regresijos analizė, tiesiniai modeliai ir susiję metodai. SAGE leidiniai.
  5. Humberto Llinás Solano, C. R. (2005). Aprašomoji statistika ir tikimybių pasiskirstymas. Šiaurės universitetas.
  6. Panteleeva, O. V. (2005). Tikimybės ir statistikos pagrindai.
  7. O. Kuehl, M. O. (2001). Eksperimentų projektavimas: statistiniai projektavimo principai ir tyrimų analizė. „Thomson“ redaktoriai.