Flere lineære regresjonslokaler, metode og bruksområder



den flere lineære regresjon er et beregningsverktøy som undersøker årsakssammenheng mellom objekter av studier og tester komplekse hypoteser.

Den brukes i matematikk og statistikk. Denne type av lineær regresjon krever avhengig (med andre ord, de resultater) og uavhengige variable (dvs. bevirker) følger en hierarkisk orden, og andre faktorer som ligger i forskjellige områder av studien.

Vanligvis er den lineære regresjonen en som representeres av en lineær funksjon som beregnes fra to avhengige variabler. Dette har som sin viktigste sak det som fenomenet studerte har en rett linje av regresjon.

I et gitt sett av data (x1, y1) (xn, yn) og av verdier som korresponderer med et par tilfeldige variabler i direkte korrelasjon med hverandre, kan regresjonslinjen ta til å begynne med formen av en ligning, som y = a · x + b .

Teoretiske beregningsgrunnlag i den multiple lineære regresjonen

Enhver beregning ved hjelp av multippel lineær regresjon avhenge sterkt av studerte objektet og studieområdet, slik som økonomi, siden de variable gjør at formlene er kompleksiteten som varierer fra tilfelle.

Dette betyr at jo mer intrikate spørsmålet, jo flere faktorer som bør tas i betraktning, flere data skal samles, og derfor større vil volumet av elementer som skal inngå i beregningen, som vil gjøre formelen er større.

Imidlertid er vanlige i alle disse formler som det er en vertikal akse (langs ordinaten eller y-aksen) og en horisontal akse (langs abscissen eller x-aksen) deretter beregnet grafisk representert ved et kartesisk system.

Derfra blir tolkningen av dataene gjort (se neste avsnitt) og konklusjoner eller spådommer er gjort. Under alle omstendigheter kan pre-statistiske lokaler brukes til å veie variablene, for eksempel følgende:

1- Svak eksogenitet

Det betyr at variabelen må antas med en fast verdi som knapt kan gi seg til endringer i modellen på grunn av årsakene som er utenfor seg selv.

2- Linjær karakter

Det innebærer at verdiene til variablene, så vel som av andre parametere og prediksjonskoeffisienter, må vises som en lineær kombinasjon av elementer som kan representeres i grafen, i det kartesiske systemet.

3- Homocedasticity

Dette må være konstant. Her menes det at, uansett de forutsigbare variablene, må det være den samme variansen av feilene for hver forskjellig responsvariabel.

4- uavhengighet

Dette gjelder bare feilene i responsvariablene, som må vises isolert og ikke som en gruppe feil som representerer et definert mønster.

5- Fravær av multikollinearitet

Den brukes til uavhengige variabler. Det skjer når du prøver å studere noe, men svært lite informasjon er tilgjengelig, så det kan være mange svar, og verdiene kan derfor ha mange tolkninger som i hvert fall ikke løser problemet.

Det er andre lokaler som tas i betraktning, men de som presenteres ovenfor gjør det klart at flere lineære regresjoner krever mye informasjon, ikke bare for å ha en strengere, komplett og fri for forstyrrelser, men slik at løsningen på spørsmålet Forslaget er konkret.

Det vil si at det må gå til poenget med noe veldig spesifikt, spesifikt, som ikke gir seg til vaghet, og at det i mindre grad mulig fører til feil.

Husk at flere lineære regresjoner ikke er ufeilbare og kan være utsatt for feil og unøyaktigheter i beregningen. Dette er ikke så mye på grunn av hvem som utfører studien, men fordi et bestemt fenomen av natur ikke er helt forutsigbart eller nødvendigvis er produktet av en bestemt årsak.

Det skjer ofte at ethvert objekt kan endres plutselig eller at en hendelse oppstår fra handlingen (eller manglende handling) av mange elementer som samhandler med hverandre.

Tolkninger av grafikken

Når dataene er beregnet i henhold til modellene utformet i tidligere faser av studien, vil formlene gi verdier som kan representeres i en graf.

I denne rekkefølgen vil det kartesiske systemet vise mange punkter som tilsvarer de beregnede variablene. Noen vil være mer i ordinatets akse, mens andre vil være mer i aksen til abscissene. Noen vil bli mer gruppert, mens andre blir mer isolerte.

For å legge merke til kompleksiteten som er involvert i å tolke dataene i grafene, kan vi observere, for eksempel Ascombe-kvartetten. I dette kvartetten håndteres fire forskjellige sett med data, og hver av dem er i en egen graf som derfor fortjener en egen analyse.

Linjaliteten forblir, men punktene i det kartesiske systemet må sees veldig nøye ut før du vet hvordan stykkene av puslespillet kommer sammen. Deretter kan de relevante konklusjonene trekkes.

Selvfølgelig er det flere måter at disse brikkene passer sammen, selv om de følger forskjellige metoder som er beskrevet i spesialiserte beregningsmanualer..

Multippel lineær regresjon, som allerede nevnt, avhenger av mange variabler som studieobjekt og felt der det er brukt, slik at prosedyrene i økonomi er ikke det samme som i medisin eller informatikk. Alt i alt, ja, et estimat er gjort, en hypotese som deretter kontrolleres på slutten.

Utvidelser av flere lineære regresjon

Det finnes flere typer av lineær regresjon, som det enkle og generelle, men flere aspekter ved multippel regresjon som imøtekomme til ulike studieobjekter er også observert og derfor behov vitenskap.

Disse håndterer vanligvis et stort antall variabler, slik at du ofte kan se modeller som multivariate eller multilevel. Hver bruker postulater og formler av mangfoldig kompleksitet, slik at tolkningen av resultatene har en tendens til å være av større betydning..

Beregningsmetoder

Det er et bredt spekter av prosedyrer for å estimere dataene som er oppnådd i den multiple lineære regresjonen.

Igjen vil alt her avhenge av soliditeten til modellen som brukes, beregningsformlene, antall variabler, de teoretiske postulatene som ble tatt i betraktning, studieområdet, algoritmene som er programmert i spesialiserte dataprogrammer, og , par excellence, kompleksiteten til objektet, fenomenet eller hendelsen som blir analysert.

Hver estimeringsmetode bruker helt forskjellige formler. Ingen er perfekt, men den har unike dyder som skal brukes i samsvar med den statistiske studien som utføres.

Det finnes alle typer: instrumentelle variabler, generaliserte minstefirkanter, Bayesian lineær regresjon, blandede modeller, Tyjonov regularisering, kvantile regresjon, Theil-Sen estimator og en lang liste over verktøy som dataene kan studeres med større presisjon. 

Praktiske bruksområder

Flere lineære regresjon brukes i ulike fagområder, og i mange tilfeller er det nødvendig med hjelp av dataprogrammer for å oppnå mer nøyaktige data.

På denne måten kan feilmarginene som oppstår ved manuelle beregninger reduseres (gitt nærvær av mange uavhengige og avhengige variabler, er det ikke overraskende at denne typen lineær regresjon gir seg feil, siden det er mange data og faktorer behandlet).

I analysen av markedstrender blir det for eksempel undersøkt om noen data som priser på et produkt har økt og redusert, men fremfor alt når og hvorfor.

Når analyseres bare når det er viktige variasjoner i tallene i en gitt tidsperiode, hovedsakelig hvis endringene er uventede. Hvorfor ser du etter de presise eller sannsynlige faktorene ved at produktet gikk opp, ned eller holdt sin utsalgspris?.

På samme måte drar helsevitenskapene (medisin, bioanalyse, apotek, epidemiologi) nytte av flere lineære regresjoner, hvor de studerer helseindikatorer som dødelighet, sykelighet og fødselsrate..

I disse tilfellene kan vi starte fra en undersøkelse som begynner med observasjonen, men etterpå blir det laget en modell for å avgjøre om variasjonen av noen av indikatorene skyldes noen spesifikk årsak, når og hvorfor.

Økonomi bruker også flere lineære regresjoner for å undersøke fordelene og ulempene ved å gjøre visse investeringer. Her er det alltid nødvendig å vite når de finansielle transaksjonene blir gjort, med hvem og hva var de forventede fordelene.

Risikoenivåene vil bli høyere eller lavere i samsvar med de ulike faktorene som tas i betraktning ved vurderingen av kvaliteten på disse investeringene, og vurderer også volumet av pengeveksling.

Det er imidlertid i økonomien hvor dette beregningsverktøyet er mest brukt. I denne vitenskapen brukes derfor flere lineære regresjoner med sikte på å forutsi forbruksutgifter, investeringskostnader, kjøp, eksport, import, eiendeler, etterspørsel etter arbeid, jobbtilbud og mange andre elementer..

Alle er knyttet til makroøkonomi og mikroøkonomi, og er den første der dataanalysevariabler er mer rikelig fordi de ligger globalt..

referanser

  1. Baldor, Aurelio (1967). Plane- og romgeometri, med en introduksjon til trigonometri. Caracas: Editorial Cultura Venezolana, S.A..
  2. Universitetssykehuset Ramón y Cajal (2017). Flere lineære regresjonsmodeller. Madrid, Spania: HRC, Madrid-regionen. Hentet fra www.hrc.es.
  3. Pedhazur, Elazar J. (1982). Flere regresjoner i atferdsforskning: Forklaring og prediksjon, 2. utgave. New York: Holt, Rinehart og Winston.
  4. Rojo Abuín, J.M. (2007). Flere lineære regresjon Madrid, Spania: Senter for human- og samfunnsvitenskap. Gjenopprettet fra humaniora.cchs.csic.es.
  5. Autonome Universitetet i Madrid (2008). Flere lineære regresjon Madrid, Spania: UAM. Gjenopprettet fra web.uam.es.
  6. University of A Coruña (2017). Flere lineære regresjonsmodeller; Korrelasjon. La Coruña, Spania: UDC, Institutt for matematikk. Gjenopprettet fra dm.udc.es.
  7. Uriel, E. (2017). Flere lineære regresjoner: estimering og egenskaper. Valencia, Spania: Universitetet i Valencia. Gjenopprettet fra www.uv.es.
  8. Barrio Castro, Tomás del; Clar López, Miquel og Suriñach Caral, Jordi (2002). Flere lineære regresjonsmodeller: spesifikasjon, estimering og kontrast. Catalonia: UOC Editorial.