Saturday, 21 October 2017

Flytting Gjennomsnitt Prosess Ppt


Når du beregner et løpende bevegelige gjennomsnitt, er det gjennomsnittlig å plassere gjennomsnittet i mellomtiden. I det forrige eksempelet beregnet vi gjennomsnittet av de første 3 tidsperiodene og plasserte det ved siden av perioden 3 Vi kunne ha plassert gjennomsnittet midt i tidsintervall på tre perioder, det vil si ved siden av periode 2 Dette fungerer bra med ulige tidsperioder, men ikke så bra for like tidsperioder. Så hvor skal vi plassere det første glidende gjennomsnittet når M 4. Teknisk vil det bevegelige gjennomsnittet falle på t 2 5, 3 5. For å unngå dette problemet glatter vi MAs ved å bruke M 2 Således glatter vi de jevne verdiene. Hvis vi gjennomsnittlig et jevnt antall termer, må vi glatte de jevne verdiene. Følgende tabell viser resultatene ved å bruke M 4.moving average. Mean av tidsserier data observasjoner like fordelt i tid fra flere sammenhengende perioder Kalt flytting fordi det kontinuerlig rekomputeres når nye data blir tilgjengelige, går det fram ved å slippe den tidligste verdien og legge til den nyeste verdien For eksempel, th Et flytende gjennomsnitt på seks måneders salg kan beregnes ved å ta gjennomsnittet av salget fra januar til juni, deretter gjennomsnittet av salget fra februar til juli, mars til august osv. Flytte gjennomsnitt 1 redusere effekten av midlertidige variasjoner i data, 2 forbedre passformen til en linje en prosess kalt utjevning for å vise data s trend tydeligere, og 3 markere en verdi over eller under trenden. Hvis du beregner noe med svært høy varians, er det best du kan være kunne gjøre det er å finne ut det bevegelige gjennomsnittet. Jeg ønsket å vite hva det bevegelige gjennomsnittet var av dataene, så jeg ville få en bedre forståelse av hvordan vi gjorde. Når du prøver å finne ut noen tall som ofte endrer seg best du kan gjøre er å beregne det bevegelige gjennomsnittet. Boks Jenkins BJ modeller. Innføring i ARIMA nonseasonal models. ARIMA p, d, q prognose ligning ARIMA modeller er i teorien den mest generelle klassen av modeller for å prognose en tidsserie som kan gjøres å være stasjonær av forskjellige om nødvendig, eventuelt i sammenheng med ikke-lineære transformasjoner som logging eller deflatering om nødvendig En tilfeldig variabel som er en tidsserie er stasjonær hvis dens statistiske egenskaper er konstant over tid En stasjonær serie har ingen trend, dens variasjoner rundt dens gjennomsnitt har en konstant amplitude og det vinkler på en konsistent måte, dvs. at kortsiktige tilfeldige tidsmønstre alltid ser like ut i statistisk forstand. Den sistnevnte tilstanden betyr at dens autokorrelasjoner korrelasjoner med sine egne tidligere avvik fra middelet forblir konstant over tid, eller tilsvarende, at dets maktspektrum forblir konstant over tid En tilfeldig variabel i denne formen kan sees som vanlig som en kombinasjon av signal og støy, og signalet hvis det er tydelig, kan være et mønster av hurtig eller langsom, gjennomsnittlig reversering eller sinusformet svingning, eller rask veksling i skilt, og det kan også ha en sesongkomponent En ARIMA-modell kan ses som et filter som prøver å skille segna l fra støyen, og signalet blir deretter ekstrapolert inn i fremtiden for å oppnå prognoser. ARIMA-prognosekvasjonen for en stasjonær tidsserie er en lineær ie-regresjonstype likning der prediktorene består av lags av den avhengige variabelen og eller prognosefeilene som er. Predittverdien av Y er en konstant og eller en vektet sum av en eller flere nylige verdier av Y og eller en vektet sum av en eller flere nyere verdier av feilene. Hvis prediktorene bare består av forsinkede verdier av Y Det er en ren autoregressiv selvregressert modell, som bare er et spesielt tilfelle av en regresjonsmodell, og som kan være utstyrt med standard regresjonsprogramvare. For eksempel er en første-ordens autoregressiv AR 1-modell for Y en enkel regresjonsmodell der uavhengig variabel er bare Y forsinket med en periode LAG Y, 1 i Statgraphics eller YLAG1 i RegressIt Hvis noen av prediktorene lags av feilene, er en ARIMA-modell det IKKE en lineær regresjonsmodell, fordi det ikke er noen måte å spesifisere feil siste periode s feil som en uavhengig variabel feilene må beregnes fra tid til annen når modellen er montert på dataene Fra et teknisk synspunkt er problemet med å bruke forsinkede feil som prediktorer at modellens spådommer er ikke-lineære funksjoner av koeffisientene, selv om de er lineære funksjoner i tidligere data. Således skal koeffisienter i ARIMA-modeller som inneholder forsinkede feil estimeres ved ikke-lineære optimaliseringsmetoder bakkeklatring i stedet for bare å løse et system av ligninger. Akronym ARIMA-stativene for automatisk-regressiv integrert flytende gjennomsnitt Lags av den stationære serien i prognosekvasjonen kalles autoregressive termer, lag av prognosefeilene kalles glidende gjennomsnittlige betingelser og en tidsserie som må differensieres for å bli stillestående, sies å være en integrert versjon av en stasjonær serie Tilfeldige-gange og tilfeldige trendmodeller, autoregressive modeller og eksponentielle utjevningsmodeller er alle spesielle tilfeller av ARIMA-modeller. En nonseasonal ARIMA-modell er klassifisert som en ARIMA p, d, q-modell, hvor. p er antall autoregressive termer. d er antall ikke-soneforskjeller som trengs for stasjonar, og. q er antall forsinkede prognoser feil i prediksjonsligningen. Forutsigelsesligningen er konstruert som følger. Først, la y betegne den forskjellen på Y som betyr. Merk at den andre forskjellen på Y d2-tilfellet ikke er forskjellen fra 2 perioder siden. den første forskjellen-av-første forskjellen som er den diskrete analogen til et andre derivat, det vil si den lokale akselerasjonen i serien i stedet for den lokale trenden. Med hensyn til y er den generelle prognosekvasjonen her. De bevegelige gjennomsnittsparametrene s er definert slik at deres tegn er negative i ligningen, etter konvensjonen som er innført av Box og Jenkins. Noen forfattere og programvare, inkludert programmeringsspråket R, definerer dem slik at de har pluss tegn i stedet når de faktiske tallene er plugget int o ligningen, det er ingen tvetydighet, men det er viktig å vite hvilken konvensjon programvaren din bruker når du leser utdata. Ofte er parameterne angitt der av AR 1, AR 2, og MA 1, MA 2, etc. To identifiser riktig ARIMA-modell for Y du begynner med å bestemme rekkefølgen på differensene du trenger for å stasjonære serien og fjerne bruttoegenskapene til sesongmessigheten, kanskje i forbindelse med en variansstabiliserende transformasjon som logging eller deflating Hvis du stopper på dette punktet og Forutsi at den differensierte serien er konstant, har du bare montert en tilfeldig tur eller tilfeldig trendmodell. Den stationære serien kan imidlertid fortsatt ha autokorrelerte feil, noe som tyder på at noen AR-vilkår p 1 og eller noen nummer MA-betingelser q 1 også er nødvendig i prognosekvasjonen. Prosessen med å bestemme verdiene p, d og q som er best for en gitt tidsserie, vil bli diskutert i senere avsnitt i notatene hvis linker er øverst på denne siden, men en forhåndsvisning av noen av de forskjellige ARIMA-modellene som ikke er vanlig, er gitt under. ARIMA 1,0,0 førsteordens autoregressive modell hvis serien er stasjonær og autokorrelert, kanskje det kan spåkes som et flerspråk av sin egen forrige verdi, pluss en konstant Forutsigelsesligningen i dette tilfellet er det som er Y regressert i seg selv forsinket av en periode. Dette er en ARIMA 1,0,0 konstant modell. Hvis gjennomsnittet av Y er null, vil det konstante uttrykket ikke være inkludert. Hvis hellingskoeffisienten 1 er positiv og mindre enn 1 i størrelsesorden, må den være mindre enn 1 i størrelsesorden dersom Y er stasjonær, beskriver modellen gjennombruddsadferd, hvor neste periode s-verdi skal anslås å være 1 ganger så langt vekk fra middelverdien som denne periodens verdi Hvis 1 er negativ, forutser den middelreferanseadferd med skifting av tegn, dvs. det forutsier også at Y vil være under gjennomsnittlig neste periode hvis den er over gjennomsnittet denne perioden. I en sekund - ordre autoregressiv modell ARIMA 2,0,0 , det ville også være et Y t-2-uttrykk til høyre, og så videre. Avhengig av tegn og størrelser av koeffisientene kunne en ARIMA 2,0,0-modell beskrive et system hvis gjennomsnitts reversering finner sted i en sinusformet oscillerende mote, som bevegelse av en masse på en vår som er utsatt for tilfeldige sjokker. ARMA 0,1,0 tilfeldig tur Hvis serien Y ikke er stasjonær, er den enkleste mulige modellen for det en tilfeldig turmodell som kan vurderes som et begrensende tilfelle av en AR 1-modell hvor den autoregressive koeffisienten er lik 1, dvs. en serie med uendelig sakte, gjennomsnittlig reversering. Forutsigelsesligningen for denne modellen kan skrives som. hvor konstant sikt er den gjennomsnittlige perioden til periodeendring dvs. den langsiktige driften i Y Denne modellen kan monteres som en ikke-avskjæringsregresjonsmodell der den første forskjellen i Y er den avhengige variabelen Siden den bare inneholder en ikke-sesongforskjell og en konstant periode, er den klassifisert som en ARIMA 0 , 1,0 modell med konstant Den tilfeldige - walk-uten-drift-modellen ville være en ARIMA 0,1,0-modell uten konstant. ARIMA 1,1,0 differensierte førsteordens autoregressive modell Hvis feilene i en tilfeldig turmodell er autokorrelert, kan problemet løses ved legge til et lag av den avhengige variabelen til prediksjonsligningen - dvs. ved å regresse den første forskjellen på Y i seg selv forsinket med en periode. Dette ville gi følgende prediksjonsligning. Det kan omorganiseres til. Dette er en førsteordens autoregressiv modell med en rekkefølge av ikke-sekundær differensiering og en konstant term, dvs. en ARIMA 1,1,0-modell. ARIMA 0,1,1 uten konstant enkel eksponensiell utjevning En annen strategi for korrigering av autokorrelerte feil i en tilfeldig gangmodell er foreslått ved den enkle eksponensielle utjevning modell Husk at for noen ikke-stationære tidsserier, for eksempel de som har støyende svingninger rundt et sakte varierende middel, utfører ikke den tilfeldige turmodellen så vel som et glidende gjennomsnitt av tidligere verdier. Med andre ord, i stedet for å ta konge den siste observasjonen som prognosen for neste observasjon, er det bedre å bruke et gjennomsnitt av de siste observasjonene for å filtrere ut støy og mer nøyaktig anslå det lokale gjennomsnittet. Den enkle eksponensielle utjevningsmodellen bruker et eksponentielt vektet glidende gjennomsnitt av tidligere verdier for å oppnå denne effekten Forutsigelsesligningen for den enkle eksponensielle utjevningsmodellen kan skrives i en rekke matematisk ekvivalente former, hvorav den ene er den såkalte feilkorreksjonsformen, der den forrige prognosen justeres i retning av Feil det gjorde. Fordi e t-1 Y t-1 - t-1 per definisjon kan dette omskrives som. Det er en ARIMA 0,1,1-uten konstant prognosekvasjon med 1 1 - Dette betyr at du kan tilpasse en enkel eksponensiell utjevning ved å spesifisere den som en ARIMA 0,1,1 modell uten konstant, og den estimerte MA 1-koeffisienten tilsvarer 1-minus-alfa i SES-formelen. Husk at i SES-modellen er gjennomsnittsalderen for dataene i t han 1-periode fremover prognoser er 1 som betyr at de vil ha en tendens til å ligge bak trender eller vendepunkter med ca 1 perioder. Det følger at gjennomsnittsalderen for dataene i de 1-periodene fremover prognosene for en ARIMA 0,1,1 - uten konstant modell er 1 1 - 1 For eksempel hvis 1 0 8 er gjennomsnittsalderen 5 Når 1 nærmer seg 1, blir ARIMA 0,1,1-uten-konstant modell en svært langsiktig bevegelse gjennomsnittlig, og når 1 nærmer seg 0 blir det en tilfeldig-walk-without-drift-modell. Hva er den beste måten å korrigere for autokorrelasjon legge til AR-vilkår eller legge til MA-termer I de to foregående modeller diskutert problemet med autokorrelerte feil i en tilfeldig turmodell ble fikset på to forskjellige måter ved å legge til en forsinket verdi av differensierte serier til ligningen eller legge til en forsinket verdi av prognosen feil Hvilken tilnærming er best En regel for tommel for denne situasjonen, som vil bli diskutert i mer detalj senere, er at positiv autokorrelasjon vanligvis behandles best ved å legge til et AR-uttrykk for modellen an d negativ autokorrelasjon er vanligvis best behandlet ved å legge til en MA-term. I forretnings - og økonomiske tidsserier oppstår negativ autokorrelasjon ofte som en artefakt av differensiering. Generelt reduserer differensiering positiv autokorrelasjon og kan til og med forårsake en bryter fra positiv til negativ autokorrelasjon. Så, ARIMA 0,1,1 modell, hvor differensiering er ledsaget av en MA-term, brukes hyppigere enn en ARIMA 1,1,0-modell. ARIMA 0,1,1 med konstant enkel eksponensiell utjevning med vekst Ved å implementere SES-modellen som en ARIMA-modell, får du faktisk en viss fleksibilitet. Først og fremst kan den estimerte MA 1-koeffisienten være negativ, dette tilsvarer en utjevningsfaktor som er større enn 1 i en SES-modell, som vanligvis ikke er tillatt i SES-modellprosedyren Andre , har du muligheten til å inkludere en konstant periode i ARIMA-modellen hvis du ønsker det, for å estimere en gjennomsnittlig ikke-null trend. ARIMA 0,1,1-modellen med konstant har prediksjonsligningen. En-perio D-prognoser fra denne modellen er kvalitativt lik SES-modellen, bortsett fra at bane av de langsiktige prognosene typisk er en skrånende linje hvis skråning er lik mu fremfor en horisontal linje. ARIMA 0,2,1 eller 0,2,2 uten konstant lineær eksponensiell utjevning. Lineære eksponensielle utjevningsmodeller er ARIMA-modeller som bruker to ikke-soneforskjeller i sammenheng med MA-termer. Den andre forskjellen i en serie Y er ikke bare forskjellen mellom Y og seg selv forsinket med to perioder, men heller er det den første forskjellen i den første forskjellen - Y-forandringen av Y ved periode t Således er den andre forskjellen på Y ved periode t lik Y t-Y t-1-Y t - 1 - Y t-2 Y t - 2Y t-1 Y t-2 En annen forskjell på en diskret funksjon er analog med et andre derivat av en kontinuerlig funksjon som måler akselerasjonen eller krumningen i funksjonen på et gitt tidspunkt. ARIMA 0,2,2 modell uten konstant forutser at den andre forskjellen på serien er lik en lineær funksjon av de to siste prognosefeilene. som kan omarrangeres som: hvor 1 og 2 er MA 1 og MA 2-koeffisientene. Dette er en generell lineær eksponensiell utjevningsmodell som i det vesentlige er den samme som Holt s-modellen, og Brown s modellen er et spesielt tilfelle Det bruker eksponentielt vektede glidende gjennomsnitt for å anslå både et lokalt nivå og en lokal trend i serien. De langsiktige prognosene fra denne modellen konvergerer til en rett linje hvis skråning avhenger av den gjennomsnittlige trenden observert mot slutten av series. ARIMA 1,1,2 uten konstant fuktet trend lineær eksponensiell utjevning. Denne modellen er illustrert i de tilhørende lysbildene på ARIMA-modeller. Det ekstrapolerer den lokale trenden i slutten av serien, men flater ut på lengre prognoshorisont for å introdusere en oppmerksom på konservatisme, en praksis som har empirisk støtte Se artikkelen om Why the Damped Trend fungerer av Gardner og McKenzie og Golden Rule-artikkelen av Armstrong et al for detaljer. Det er generelt råd ble å holde seg til modeller der minst en av p og q ikke er større enn 1, dvs. ikke prøv å passe på en modell som ARIMA 2,1,2, da dette sannsynligvis vil føre til overfitting og fellesfaktorproblemer som diskuteres mer detaljert i notatene om den matematiske strukturen til ARIMA-modeller. Implementering av ARIMA-modeller, som beskrevet ovenfor, er lett å implementere på et regneark. Prediksjonsligningen er bare en lineær ligning som refererer til tidligere verdier av originale tidsserier og tidligere verdier av feilene Dermed kan du sette opp et ARIMA prognose regneark ved å lagre dataene i kolonne A, prognoseformelen i kolonne B, og feildataene minus prognosene i kolonne C Forutsigelsesformelen i en typisk celle i kolonne B ville bare være et lineært uttrykk som refererer til verdier i forrige rader med kolonne A og C, multiplisert med de relevante AR - eller MA-koeffisientene lagret i celler andre steder på regnearket.

No comments:

Post a Comment