Klassemerk for hva den tjener, hvordan det tas og eksempler



den klassemerket, også kjent som midtpunktet, er verdien som ligger i midten av en klasse, som representerer alle verdiene som er i den kategorien. I utgangspunktet brukes klassemerket til beregning av visse parametere, for eksempel det aritmetiske gjennomsnittet eller standardavviket.

Da er klassemerket midtpunktet for et hvilket som helst intervall. Denne verdien er også svært nyttig for å finne variansen til et datasett og gruppert i klasser, som igjen tillater oss å forstå hvor langt fra sentrum er de data bestemmes.

index

  • 1 Frekvensfordeling
    • 1.1 Hvor mange klasser å vurdere?
  • 2 Hvordan får du det??
    • 2.1 Eksempel
  • 3 Hva er det for??
    • 3.1 Eksempel
  • 4 referanser

Frekvensfordeling

For å forstå hva et klassenavn er, er begrepet frekvensfordeling nødvendig. Gitt et datasett er en frekvensfordeling en tabell som deler slike data inn i en rekke kategorier som kalles klasser.

Denne tabellen viser hva som er antall elementer som tilhører hver klasse; sistnevnte er kjent som frekvens.

I denne tabellen deles informasjonen vi får fra dataene, siden i stedet for å ha den enkelte verdien av hvert element, vet vi bare at det tilhører den nevnte klassen.

På den annen side får vi bedre forståelse av datasettet, siden det på denne måten er lettere å sette pris på etablerte mønstre, noe som letter manipuleringen av dataene..

Hvor mange klasser å vurdere?

For å lage en frekvensfordeling må vi først bestemme antall klasser vi ønsker å ta og velge klassegrenser for dem.

Valget av hvor mange klasser å ta skal være hensiktsmessig, med tanke på at et lite antall klasser kan skjule informasjon om dataene vi ønsker å studere og en veldig stor man kan generere for mange detaljer som ikke nødvendigvis er nyttige.

Faktorer for å vurdere når du velger hvor mange take klasser er flere, men mellom disse to skiller seg ut: den første er å vurdere hvor mye data vi trenger for å vurdere; Den andre er å vite hvilken størrelse er fordelingsområdet (det vil si forskjellen mellom den største og den minste observasjonen).

Etter å ha klassene som allerede er definert, fortsetter vi å telle hvor mye data som finnes i hver klasse. Dette nummeret kalles klassefrekvens og er betegnet med fi.

Som vi tidligere sa, har vi at en frekvensfordeling mister informasjonen som kommer individuelt fra hver data eller observasjon. Derfor søkes det en verdi som representerer hele klassen som den tilhører; denne verdien er klassenes klasse.

Hvordan får du det??

Klassemerket er den sentrale verdien som en klasse representerer. Den oppnås ved å legge til grensene for intervallet og dele denne verdien med to. Dette kan vi uttrykke matematisk som følger:

xjeg= (Nedre grense + Øvre grense) / 2.

I dette uttrykket xjeg betegner ith klassens merke.

eksempel

Gitt følgende datasett, gi en representativ frekvensfordeling og få den tilsvarende klassen.

Da dataene med den høyeste numeriske verdien er 391 og den minste er 221, har vi at intervallet er 391 -221 = 170.

Vi velger 5 klasser, alle med samme størrelse. Én måte å velge klassene på er:

Merk at hver data er i en klasse, de er ujevne og har samme verdi. En annen måte å velge klassene på er å vurdere dataene som en del av en kontinuerlig variabel, noe som kan nå noen reell verdi. I dette tilfellet kan vi vurdere klasser av skjemaet:

205-245, 245-285, 285-325, 325-365, 365-405

Denne måten å gruppere data på kan imidlertid presentere visse tvetydigheter med grenser. For eksempel, når det gjelder 245, oppstår spørsmålet: Hvilken klasse tilhører den, til den første eller den andre??

For å unngå disse forvirringene er det gjort en konvensjon med ekstreme poeng. På denne måten vil første klasse være intervallet (205.245), det andre (245.285) og så videre.

Når klassene er definert, fortsetter vi å beregne frekvensen og vi har følgende tabell:

Etter å ha oppnådd frekvensfordelingen av dataene, fortsetter vi å finne klassemerkene for hvert intervall. I virkeligheten må vi:

x1= (205+ 245) / 2 = 225

x2= (245 + 285) / 2 = 265          

x3= (285 + 325) / 2 = 305

x4= (325+ 365) / 2 = 345

x5= (365 + 405) / 2 = 385

Vi kan representere dette med følgende grafikk:

Hva er det for??

Som nevnt tidligere, er merket svært funksjonsklasse for å finne den aritmetisk gjennomsnitt og variansen av datasett som er gruppert i ulike klasser.

Vi kan definere det aritmetiske gjennomsnittet som summen av observasjonene oppnådd mellom prøvestørrelsen. Fra et fysisk synspunkt er tolkningen som likeverdigpunktet i et datasett.

Å identifisere et helt sett med data med et enkelt tall kan være risikabelt, så vi må også ta hensyn til forskjellen mellom dette likevektspunktet og de reelle dataene. Disse verdiene er kjent som avvik fra det aritmetiske gjennomsnittet, og med disse søker vi å bestemme hvor mye det aritmetiske gjennomsnittet av dataene varierer.

Den vanligste måten å finne denne verdien på er av variansen, som er gjennomsnittet av kvadratene av avvikene fra det aritmetiske gjennomsnittet.

For å beregne det aritmetiske gjennomsnittet og variansen av et sett med data gruppert i en klasse benytter vi henholdsvis følgende formler:

I disse uttrykkene xjeg  er i-th-klassen, fjeg representerer den tilsvarende frekvensen og k antall klasser hvor dataene ble gruppert.

eksempel

Ved å bruke dataene som er gitt i det forrige eksempelet, kan vi utvide dataene til frekvensfordelingsbordet litt mer. Du får følgende:

Da, når du erstatter dataene i formelen, har vi forlatt at det aritmetiske gjennomsnittet er:

Dens varians og standardavvik er:

Herfra kan vi konkludere med at de opprinnelige dataene har et aritmetisk gjennomsnitt på 306,6 og et standardavvik på 39,56.

referanser

  1. Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Beskrivende statistikk. Esic Editorial.
  2. Jhonson Richard A.Miller og Freund Sannolikhet og statsmenn for Engineers.Pearson Education.
  3. Miller I & Freund J. Sannsynlighet og statsmenn for ingeniører. Reverte.
  4. Sarabia A. Jose Maria, Pascual Marta. Grunnkurs for statistikk for bedrifter
  5. Llinás S. Humberto, Rojas A. Carlos Beskrivende statistikk og sannsynlighetsfordeling.Universidad del Norte Editorial