Sentrale trendmålinger for grupperte data



den tiltak av sentral tendens til grupperte data de brukes i statistikk for å beskrive visse atferd av en gruppe data som leveres, for eksempel hva de er i nærheten av, hva er gjennomsnittet av dataene som samles inn blant annet.

Når en stor mengde data er tatt, er det nyttig å gruppere dem for å få en bedre rekkefølge av dem og dermed kunne beregne visse tiltak av sentral tendens.

Blant de sentrale tendenser som er mest brukte, er det aritmetiske middel, medianen og modusen. Disse tallene forteller visse kvaliteter om dataene samlet i et bestemt eksperiment.

For å bruke disse tiltakene er det først nødvendig å vite hvordan man grupperer et sett med data.

Gruppert data

For å gruppere data først må du beregne rekkevidden av dataene, som oppnås ved å subtrahere høyest verdi minus laveste verdi av dataene.

Velg deretter et tall "k", som er antall klasser du vil gruppere dataene i.

Vi fortsetter å dele området mellom "k" for å oppnå amplitude av klassene som skal grupperes. Dette tallet er C = R / k.

Til slutt startes grupperingen, for hvilket et mindre antall enn den minste verdien av de innhentede dataene er valgt..

Dette nummeret vil være den nedre grensen til første klasse. Til dette legges til C. Verdien som er oppnådd vil være den øvre grensen til første klasse.

Deretter blir C lagt til denne verdien, og den øvre grensen for den andre klassen er oppnådd. På denne måten fortsetter du til du får den øvre grensen til den siste klassen.

Etter at dataene er gruppert, kan du fortsette å beregne gjennomsnitt, median og mote.

For å illustrere hvordan aritmetikken betyr, medianen og modusen beregnes, vil vi fortsette med et eksempel.

eksempel

Derfor, når du grupperer dataene, får du et bord som følger:

De tre viktigste sentrale tendensen tiltak

Nå skal vi fortsette å beregne aritmetisk middel, median og modus. Eksemplet ovenfor vil bli brukt til å illustrere denne prosedyren.

1- Aritmetisk middel

Det aritmetiske gjennomsnittet består i å multiplisere hver frekvens med gjennomsnittet av intervallet. Da blir alle disse resultatene lagt til, og til slutt delt med de totale dataene.

Ved hjelp av det forrige eksempelet vil vi oppdage at det aritmetiske gjennomsnittet er lik:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111

Dette indikerer at gjennomsnittsverdien av dataene i tabellen er 5,11111.

2- Medium

For å beregne medianen til et datasett blir først alle data bestilt fra minst til største. To saker kan presenteres:

- Hvis datanummeret er merkelig, er medianen dataene som ligger midt i sentrum.

- Hvis datanummeret er jevnt, er medianen gjennomsnittet av de to dataene som er igjen i midten.

Når det gjelder gruppert data, utføres beregningen av medianen på følgende måte:

- N / 2 beregnes, hvor N er de totale dataene.

- Det første intervallet søkes der hvor den akkumulerte frekvensen (summen av frekvensene) er større enn N / 2, og den nedre grensen for dette intervallet, kalt Li, er valgt..

Medianen er gitt med følgende formel:

Me = Li + (Ls-Li) * (N / 2 - Akkumulert frekvens før Li) / Frekvens av [Li, Ls)

Ls er den øvre grensen for området som er nevnt ovenfor.

Dersom ovennevnte datatabellen anvendes, må N / 2 = 18/2 = 9. Kumulative frekvenser er 4, 8, 14 og 18 (en for hver rad i tabellen).

Derfor bør det tredje intervallet velges, siden den akkumulerte frekvensen er større enn N / 2 = 9.

Så Li = 5 og Ls = 7. Ved å bruke formelen beskrevet ovenfor må du:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.

3- Mote

Mote er verdien som har mest frekvens blant alle grupperte data; det vil si det er verdien som gjentas mest ganger i det opprinnelige datasettet.

Når du har en veldig stor mengde data, brukes følgende formel til å beregne modusen for grupperte data:

Mo = Li + (Ls-Li) * (frekvens Li - Frequency L (i-1)) / ((frekvens Li - Frequency L (i-1)) + (frekvens Li - Frekvens L ( jeg + 1)))

Intervallet [Li, Ls) er intervallet der den høyeste frekvensen er funnet. For eksempel laget i denne artikkelen har vi den mote som er gitt av:

Mo = + 5 (7-5) (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

En annen formel som brukes til å oppnå en omtrentlig verdi til moten, er følgende:

Mo = Li + (Ls-Li) * (frekvens L (i + 1)) / (frekvens L (i-1) + frekvens L (i + 1)).

Med denne formelen er kontoene som følger:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

referanser

  1. Bellhouse, D. R. (2011). Abraham De Moivre: Stille scenen for klassisk sannsynlighet og dens applikasjoner. CRC Press.
  2. Cifuentes, J. F. (2002). Introduksjon til sannsynlighetsteori. Univ. National of Colombia.
  3. Daston, L. (1995). Klassisk sannsynlighet i opplysningen. Princeton University Press.
  4. Larson, H.J. (1978). Introduksjon til sannsynlighetsteori og statistisk inngrep. Editorial Limusa.
  5. Martel, P.J. & Vegas, F.J. (1996). Sannsynlighet og matematisk statistikk: applikasjoner i klinisk praksis og helsestyring. Ediciones Díaz de Santos.
  6. Vázquez, A. L., & Ortiz, F.J. (2005). Statistiske metoder for å måle, beskrive og kontrollere variabilitet. Ed. Universitetet i Cantabria.
  7. Vázquez, S. G. (2009). Matematikkmanual for tilgang til universitetet. Redaksjonelt senter for studier Ramon Areces SA.