Glidande Medelvärde Modell Eviews
Introduktion till ARIMA nonseasonal models. ARIMA p, d, q prognos Equation ARIMA-modeller är i teorin den vanligaste klassen av modeller för prognoser för en tidsserie som kan göras stationär genom differentiering om det behövs, kanske i samband med olinjära transformationer Till exempel loggning eller avflöde om det behövs En slumpmässig variabel som är en tidsserie är stillastående om dess statistiska egenskaper är konstanta över tid En stationär serie har ingen trend, dess variationer runt dess medelvärde har en konstant amplitud och det vinklar på ett konsekvent sätt Dvs dess kortsiktiga slumpmässiga tidsmönster ser alltid ut i statistisk mening. Det sistnämnda tillståndet betyder att dess autokorrelationsrelationer med sina egna tidigare avvikelser från medelvärdet förblir konstanta över tiden, eller likvärdigt, att dess effektspektrum förblir konstant över tiden. En slumpmässig variabel i denna form kan ses som vanligt som en kombination av signal och brus, och signalen om en är uppenbar kan vara en patt ingen snabb eller långsam medelåterföring eller sinusformad oscillation eller snabb växling i tecken och det kan också ha en säsongskomponent. En ARIMA-modell kan ses som ett filter som försöker skilja signalen från bruset och signalen är då extrapoleras till framtiden för att erhålla prognoser. ARIMA-prognosen för en stationär tidsserie är en linjär dvs regressionstypsekvation där prediktorerna består av lags av den beroende variabeln och eller lags av prognosfel som är. Predicted value of Y En konstant och eller en vägd summa av en eller flera nya värden av Y och eller en vägd summa av en eller flera nya värden av felen. Om prediktorerna endast består av fördröjda värden på Y är det en ren självregressiv självregresserad modell, Vilket bara är ett speciellt fall av en regressionsmodell och som kan utrustas med standard regressionsprogramvara. Till exempel är en första-ordningsautegressiv AR 1-modell för Y en enkel regressionsmodell där den oberoende variabeln i s bara Y fördröjt med en period LAG Y, 1 i Statgraphics eller YLAG1 i RegressIt Om några av prediktorerna lags av felen är en ARIMA-modell det inte en linjär regressionsmodell eftersom det inte finns något sätt att ange den senaste periodens fel Som en oberoende variabel måste felen beräknas under en period då modellen är monterad på data. Tekniskt sett är problemet med att använda fördröjda fel som prediktorer att modellens förutsägelser inte är linjära funktioner hos Koefficienter trots att de är linjära funktioner i tidigare data Således måste koefficienter i ARIMA-modeller som innehåller fördröjda fel uppskattas genom olinjära optimeringsmetoder bergklättring snarare än genom att bara lösa ett system av ekvationer. Akronymet ARIMA står för auto-regressivt integrerat Flyttande medelvärden för den stationära serien i prognosen ekvationen kallas autoregressiva termer, lags av prognosfel kallas glidande medelvärden och en tidsserie som behöver Skilja sig från att bli stationär sägs vara en integrerad version av en stationär serie Slumpmässiga och slumpmässiga modeller, autoregressiva modeller och exponentiella utjämningsmodeller är alla speciella fall av ARIMA-modeller. En nonseasonal ARIMA-modell är klassad som en ARIMA p, d, q modell, where. p är antalet autoregressiva termer. d är antalet icke-säsongsskillnader som behövs för stationaritet, ochqq är antalet fördröjda prognosfel i prediksionsekvationen. Prognosekvationen är konstruerad enligt följande Först, låt y beteckna d: n skillnaden i Y vilket betyder. Notera att den andra skillnaden i Y d2 fallet inte är skillnaden från 2 perioder sedan. Det är snarare den första skillnaden-av-första skillnaden som är Den diskreta analogen av ett andra derivat, dvs den lokala accelerationen i serien snarare än den lokala trenden. Med avseende på y är den generella prognosekvationen här. De rörliga genomsnittsparametrarna s definieras så att deras tecken är negativa i ekvationen Uation, enligt konventionen introducerad av Box och Jenkins Några författare och programvara inklusive R-programmeringsspråket definierar dem så att de har plustecken i stället När faktiska siffror är anslutna till ekvationen finns det ingen tvetydighet, men det är viktigt att veta vilken konvention Din programvara använder när du läser utmatningen Vanligtvis anges parametrarna av AR 1, AR 2, och MA 1, MA 2 etc. För att identifiera lämplig ARIMA-modell för Y börjar du med att bestämma ordningen för differentiering d behöver att stationera serierna och ta bort säsongens bruttoegenskaper, kanske i kombination med en variansstabiliserande transformation som loggning eller deflatering. Om du slutar vid denna punkt och förutsäger att den olika serien är konstant har du bara utrustat en slumpmässig promenad eller slumpmässig trendmodell Dock kan den stationära serien fortfarande ha autokorrelerade fel, vilket tyder på att ett antal AR-termer p 1 och eller några nummer MA-termer q 1 också behövs I prognosekvationen. Processen att bestämma värdena p, d och q som är bäst för en given tidsserie kommer att diskuteras i senare avsnitt i anteckningarna vars länkar finns högst upp på den här sidan, men en förhandsgranskning av vissa av de typer av icke-säsongsmässiga ARIMA-modeller som vanligtvis förekommer anges nedan. ARIMA 1,0,0 första ordningens autoregressiva modell om serien är stationär och autokorrelerad, kanske det kan förutsägas som ett flertal av sitt eget tidigare värde plus en Konstant Prognosekvationen i detta fall är vilken som Y är regresserad i sig fördröjd med en period. Detta är en ARIMA 1,0,0 konstant modell Om medelvärdet av Y är noll, skulle den konstanta termen inte inkluderas. Om lutningen koefficienten 1 är positiv och mindre än 1 i storleksordningen måste den vara mindre än 1 i storleksordningen om Y är stillastående, beskriver modellen medelåterkallande beteende där nästa period s-värde bör förutses vara 1 gånger så långt bort från medelvärdet som Denna period s värde om 1 är negativ, det Förutspår medelåterkallande beteende med teckenväxling, dvs det förutspår också att Y kommer att ligga under den genomsnittliga nästa perioden om det ligger över medelvärdet i denna period. I en andraordningsautoregressiv modell ARIMA 2,0,0 skulle det finnas en Y t-2 termen till höger, och så vidare. Beroende på tecken och storheter på koefficienterna kan en ARIMA 2,0,0 modell beskriva ett system vars genomsnittliga reversering sker på ett sinusformigt oscillerande sätt, som rörelsen av en massa på en fjäder som utsätts för slumpmässiga shocks. ARIMA 0,1,0 slumpmässig promenad Om serien Y inte är stationär är den enklaste möjliga modellen för den en slumpmässig promenadmodell, som kan betraktas som ett begränsande fall av en AR 1-modell där den autoregressiva koefficienten är lika med 1, dvs en serie med oändligt långsam medelvärde. Förutsägningsekvationen för denna modell kan skrivas som. Om den konstanta termen är den genomsnittliga perioden för periodändring, dvs den långsiktiga Drift i Y Denna modell kan monteras som en icke-avlyssning Gressmodell där den första skillnaden i Y är den beroende variabeln Eftersom den endast innehåller en icke-sekundär skillnad och en konstant term, klassificeras den som en ARIMA 0,1,0-modell med konstant. Den slumpmässiga promenad-utan-driftmodellen skulle vara en ARIMA 0,1,0-modell utan konstant. ARIMA 1,1,0-differensierad första ordningens autoregressiv modell Om felen i en slumpmässig promenadmodell är autokorrelerad kanske problemet kan lösas genom att lägga en lag av den beroende variabeln till Prediksionsekvationen - dvs genom att regressera den första skillnaden i Y i sig själv fördröjd med en period. Detta skulle ge följande förutsägelsekvation. Det kan omordnas till. Detta är en första-orders autregressiv modell med en ordning av icke-säsongsskillnader och en konstant term - en ARIMA 1,1,0 modell. ARIMA 0,1,1 utan konstant enkel exponentiell utjämning En annan strategi för korrigering av autokorrelerade fel i en slumpmässig promenadmodell föreslås av den enkla exponentiella utjämningsmodellen. Kom ihåg att för vissa icke-stationära tidsserier, t ex de som uppvisar bullriga fluktuationer runt ett långsamt varierande medelvärde, utförs slumpmässiga gångmodellen inte lika bra som ett glidande medelvärde av tidigare värden. Med andra ord, snarare än att ta den senaste observationen som prognosen för nästa observation , är det bättre att använda ett genomsnitt av de senaste få observationerna för att filtrera bort bruset och mer exakt uppskatta det lokala medelvärdet. Den enkla exponentiella utjämningsmodellen använder ett exponentiellt vägat glidande medelvärde av tidigare värden för att uppnå denna effekt. Förutsättningsekvationen för enkel exponentiell utjämningsmodell kan skrivas i ett antal matematiskt ekvivalenta former, varav en är den så kallade felkorrigeringsformen, där den föregående prognosen justeras i riktning mot det fel som det gjorde. Eftersom e t-1 Y t - 1 - t-1 per definition kan detta skrivas om som vilken är en ARIMA 0,1,1-utan konstant prognosförening med 1 1 - Det betyder att du kan passa en enkel exponentiell smoo sak genom att specificera den som en ARIMA 0,1,1 modell utan konstant, och den uppskattade MA 1-koefficienten motsvarar 1-minus-alfa i SES-formeln. Minns att i SES-modellen är medelåldern för data i 1- periodprognoser är 1 vilket innebär att de tenderar att ligga bakom trender eller vändpunkter med cirka 1 perioder. Det följer att den genomsnittliga åldern för data i de 1-prognoser framöver av en ARIMA 0,1,1 utan konstant modell är 1 1 - 1 Så, till exempel, om 1 0 8 är medelåldern 5 När 1 närmar sig 1 blir ARIMA 0,1,1 utan konstant modell ett mycket långsiktigt glidande medelvärde, och När 1 närmar sig 0 blir det en slumpmässig promenad utan driftmodell. Vad är det bästa sättet att korrigera för autokorrelation som lägger till AR-termer eller adderar MA-termer I de tidigare två modellerna som diskuterats ovan, problemet med autokorrelerade fel i en slumpmässig promenadmodell fixades på två olika sätt genom att lägga till ett fördröjt värde av den olika serien till ekvationen eller lägga till ett fördröjt värde för foreca st fel Vilket tillvägagångssätt är bäst En tumregel för denna situation, som kommer att diskuteras mer i detalj senare, är att positiv autokorrelation vanligtvis behandlas bäst genom att addera en AR-term till modellen och negativ autokorrelation behandlas vanligtvis bäst av Lägga till en MA-term I affärs - och ekonomiska tidsserier uppstår negativ autokorrelation ofta som en artefakt av differentiering. I allmänhet minskar differentieringen positiv autokorrelation och kan till och med orsaka en växling från positiv till negativ autokorrelation. Således är ARIMA 0,1,1-modellen i vilken skillnad åtföljs av en MA-term, används oftare än en ARIMA 1,1,0-modell. ARIMA 0,1,1 med konstant enkel exponentiell utjämning med tillväxt Genom att implementera SES-modellen som en ARIMA-modell får du faktiskt lite flexibilitet För det första får den uppskattade MA 1-koefficienten vara negativ, vilket motsvarar en utjämningsfaktor som är större än 1 i en SES-modell, vilket vanligtvis inte är tillåtet med SES-modellproceduren Sec Du har möjlighet att inkludera en konstant term i ARIMA-modellen om du vill, för att uppskatta en genomsnittlig icke-nollutveckling. ARIMA 0,1,1-modellen med konstant har förutsägelsesekvationen. En-tiden framåt prognoser från denna modell är kvalitativt lik SES-modellen, förutom att banan för de långsiktiga prognoserna typiskt är en sluttande linje vars lutning är lika med mu snarare än en horisontell linje. ARIMA 0,2,1 eller 0, 2,2 utan konstant linjär exponentiell utjämning Linjära exponentiella utjämningsmodeller är ARIMA-modeller som använder två icke-säsongsskillnader i samband med MA-termer. Den andra skillnaden i en serie Y är inte bara skillnaden mellan Y och sig självfördröjt med två perioder, men snarare är det den första skillnaden i den första skillnaden - förändringen i förändringen av Y vid perioden t Således är den andra skillnaden hos Y vid period t lika med Y t-Y t-1-Y t-1-Y t-2 Y t - 2Y t-1 Y t-2 En andra skillnad på en diskret funktion är analog s till ett andra derivat av en kontinuerlig funktion, mäter accelerationen eller krökningen i funktionen vid en given tidpunkt. ARIMA 0,2,2-modellen utan konstant förutspår att den andra skillnaden i serien motsvarar en linjär funktion av den sista två prognosfel. som kan omordnas som. där 1 och 2 är MA 1 och MA 2-koefficienterna Detta är en generell linjär exponentiell utjämningsmodell som är väsentligen densamma som Holt s-modellen och Brown s-modellen är ett speciellt fall. Det använder exponentiellt vägt Glidande medelvärden för att uppskatta både en lokal nivå och en lokal trend i serien. De långsiktiga prognoserna från denna modell konvergerar till en rak linje vars lutning beror på den genomsnittliga trenden som observerats mot slutet av serien. ARIMA 1,1,2 utan Konstant dämpad trend linjär exponentiell utjämning. Denna modell illustreras i de bifogade bilderna på ARIMA-modellerna. Det extrapolerar den lokala trenden i slutet av serien men plattar ut på längre prognoshorisonter för att introducera en konservatismens övning, en övning som har empiriskt stöd Se artikeln om Varför den dämpade trenden fungerar av Gardner och McKenzie och Golden Rule-artikeln från Armstrong et al för detaljer. Det är vanligtvis lämpligt att hålla sig till modeller där minst en av p Och q är inte större än 1, dvs försök inte passa en modell som ARIMA 2,1,2, eftersom det här sannolikt kommer att leda till överfitting och commonfactorproblem som diskuteras närmare i noterna på matematiska struktur av ARIMA-modeller. Spreadsheet implementation ARIMA-modeller som de som beskrivs ovan är enkla att implementera på ett kalkylblad. Förutsägningsekvationen är helt enkelt en linjär ekvation som refererar till tidigare värden av ursprungliga tidsserier och tidigare värden på felen. Således kan du ställa in ett ARIMA prognosräkningsblad genom att lagra data i kolumn A, prognosformeln i kolumn B och feldata minus prognoser i kolumn C Prognosformeln i en typisk cell i kolumn B skulle helt enkelt vara en linjär uttryck N som hänvisar till värden i föregående rader av kolumnerna A och C multiplicerat med lämpliga AR - eller MA-koefficienter lagrade i cellerna någon annanstans på kalkylbladet. 2 1 Moving Average Models MA-modeller. Tidsseriemodeller som kallas ARIMA-modeller kan innefatta autoregressiva termer och eller Glidande medelvärden I vecka 1 lärde vi oss en autoregressiv term i en tidsseriemodell för variabeln. Xt är ett fördröjt värde på xt. Till exempel är en lag 1-autoregressiv term x t-1 multiplicerad med en koefficient Denna lektion definierar glidande medelvärden . En glidande medelfrist i en tidsseriemodell är ett tidigare fel multiplicerat med en koefficient. Låt wt överskridas N 0, sigma 2w, vilket betyder att wt är identiskt oberoende fördelat, var och en med en normal fördelning med medelvärde 0 och samma varians . Den 1: e ordningens glidande medelmodell, betecknad med MA 1 är. Xt mu wt theta1w. Den 2: a beställer rörlig genomsnittsmodell, betecknad med MA 2 är. Xt mu wt theta1w theta2. Den q-ordningsrörelserna medellägesmodellen, betecknad med MA q är. Xt mu wt theta1w theta2w prickar thetaqw. Note Många läroböcker och programvara definierar modellen med negativa tecken före villkoren. Detta förändrar inte de allmänna teoretiska egenskaperna hos modellen, även om den vrider de algebraiska tecknen på uppskattade koefficientvärden och oskydda termer i Formler för ACF och avvikelser Du måste kontrollera din programvara för att verifiera om negativa eller positiva tecken har använts för att korrekt skriva den beräknade modellen R använder positiva tecken i sin underliggande modell, som vi gör här. De teoretiska egenskaperna hos en tidsserie med En MA 1-modell. Notera att det enda nonzero-värdet i teoretiskt ACF är för lag 1 Alla andra autokorrelationer är 0 Således är ett sampel ACF med en signifikant autokorrelation endast vid lag 1 en indikator på en möjlig MA 1-modell. För intresserade studenter, Bevis på dessa egenskaper är en bilaga till denna handout. Exempel 1 Antag att en MA 1-modell är xt 10 wt 7 w t-1 där wt överför N 0,1 Således koefficienten 1 0 7 Th E teoretisk ACF ges av. En plot av denna ACF följer. Den plott som just visas är den teoretiska ACF för en MA 1 med 1 0 7 I praktiken har ett prov som vunnits t ge ett så tydligt mönster. Med hjälp av R simulerade vi n 100 Provvärden med hjälp av modellen xt 10 wt 7 w t-1 där w t. iid N 0,1 För denna simulering följer en tidsserieplot av provdata. Vi kan inte berätta mycket av denna plot. Provet ACF för den simulerade data följer Vi ser en spik vid lag 1 följt av allmänt icke-signifikanta värden för lags över 1 Observera att provet ACF inte matchar det teoretiska mönstret för den underliggande MA 1, vilket är att alla autokorrelationer för lags över 1 kommer att vara 0 A Olika prov skulle ha ett något annorlunda prov ACF som visas nedan, men skulle troligen ha samma breda egenskaper. Deoretiska egenskaperna hos en tids serie med en MA 2-modell. För MA 2-modellen är de teoretiska egenskaperna följande. Notera att den enda nonzero värden i teoretisk ACF är för lags 1 och 2 autocorrelat Joner för högre lags är 0 Så, ett ACF-prov med signifikanta autokorrelationer vid lags 1 och 2, men icke-signifikanta autokorrelationer för högre lags indikerar en möjlig MA 2-modell. N 0,1 Koefficienterna är 1 0 5 och 2 0 3 Eftersom detta är en MA 2, kommer den teoretiska ACF endast att ha nonzero-värden endast vid lags 1 och 2.Values av de två icke-oberoende autokorrelationerna är. En plot av den teoretiska ACF följer. Som nästan alltid är fallet, samplingsdata som vunnit t uppträder ganska Så perfekt som teori Vi simulerade n 150 provvärden för modellen xt 10 wt 5 w t-1 3 w t-2 var w t. iid N 0,1 Tidsseriens plot av data följer Som med tidsseriens plot för MA 1-provdata kan du inte berätta mycket för. Provet ACF för den simulerade data följer Mönstret är typiskt för situationer där en MA 2-modell kan vara användbar. Det finns två statistiskt signifikanta spikar vid lags 1 och 2 följt av icke - - värda värden för andra lags Observera att på grund av provtagningsfel stämde provet ACF inte Det teoretiska mönstret exactly. ACF för General MA q Models. A egenskap av MA q modeller i allmänhet är att det finns icke-oberoende autokorrelationer för de första q lagsna och autokorrelationerna 0 för alla lags q. Non-unikhet av samband mellan värdena på 1 och rho1 I MA 1-modell. I MA 1-modellen, för vilket värde som helst av 1, ger den ömsesidiga 1 1 samma värde. För exempel, använd 0 5 för 1 och använd sedan 1 0 5 2 för 1 Du får rho1 0 4 I båda fallen. För att tillfredsställa en teoretisk begränsning som kallas invertibilitet begränsar vi MA1-modellerna till att ha värden med absolutvärdet mindre än 1 I exemplet just givet är 1 0 5 ett tillåtet parametervärde medan 1 1 0 5 2 inte kommer att. Invertibility av MA modeller. En MA-modell sägs vara omvändbar om den är algebraiskt ekvivalent med en konvergerande oändlig ordning AR-modell. Genom konvertering menar vi att AR-koefficienterna minskar till 0 när vi flyttar tillbaka i tiden. Invertibility är en begränsning programmerad till tidsserie programvara som används för att uppskatta coeff icients of models med MA termer Det är inte något vi söker efter i dataanalysen Ytterligare information om invertibility-begränsningen för MA 1-modeller finns i bilagan. Avancerad teorinotering För en MA q-modell med en specificerad ACF finns det endast en omvänd modell Den nödvändiga förutsättningen för invertibilitet är att koefficienterna har värden så att ekvationen 1- 1 y - qyq 0 har lösningar för y som faller utanför enhetens cirkel. R Kod för exemplen. I exempel 1 ritade vi Teoretisk ACF av modellen xt 10 wt 7w t-1 och sedan simulerade n 150 värden från denna modell och ritade provtidsserierna och provet ACF för de simulerade data R-kommandona som användes för att plotta den teoretiska ACF var. acfma1 ARMAacf ma c 0 7, 10 lags av ACF för MA 1 med theta1 0 7 lags 0 10 skapar en variabel som heter lags som sträcker sig från 0 till 10 plot lags, acfma1, xlim c 1,10, ylab r, typ h, huvud ACF för MA 1 med theta1 0 7 abline h 0 lägger en horisontell axel till plot. Th E första kommandot bestämmer ACF och lagrar det i ett objekt med namnet acfma1 vårt val av namn. Plot-kommandot 3: e kommandotyperna lags mot ACF-värdena för lags 1 till 10 ylab-parametern markerar y-axeln och huvudparametern sätter en titel på plottet. För att se de numeriska värdena för ACF använder du bara kommandot acfma1. Simuleringen och diagrammen gjordes med följande kommandon. Lista ma c 0 7 Simulerar n 150 värden från MA 1 x xc 10 lägger till 10 för att göra medelvärdet 10 Simulering standardvärden betyder 0 diagram x, typ b, huvud Simulerat MA 1 data acf x, xlim c 1,10, huvud ACF för simulerade provdata. I exempel 2 ritade vi den teoretiska ACF av modellen xt 10 wt 5 w t-1 3 w t-2 och simulerade sedan n 150 värden från denna modell och ritade provtidsserierna och provet ACF för den simulerade Data R-kommandona som användes var. acfma2 ARMAacf ma c 0 5,0 3, acfma2 lags 0 10 plot lags, acfma2, xlim c 1,10, ylab r, typ h, huvud ACF för MA2 med theta1 O5, theta2 O 3 abline h 0 lista ma c 0 5, 0 3 x xc 10 plot x, typ b, huvud Simulerad MA 2-serie acf x, xlim c 1,10, huvud ACF för simulerade MA 2 Data. Appendix Bevis av egenskaper hos MA 1 . För intresserade studenter är här bevis på teoretiska egenskaper hos MA 1-modellen. Variantext xt text mu wt theta1 w 0 text wt text theta1w sigma 2w theta 21 sigma 2w 1 theta 21 sigma 2When h 1, föregående uttryck 1 W 2 För någon h 2 , Det föregående uttrycket 0 Anledningen är att, enligt definitionen av oberoende av Wt E wkwj 0 för någon kj vidare, eftersom wt har medelvärdet 0, E wjwj E wj 2 w 2.For en tidsserie. Använd detta resultat för att få ACF ges ovan. En inverterbar MA-modell är en som kan skrivas som en oändlig ordning AR-modell som konvergerar så att AR-koefficienterna konvergerar till 0 när vi rör sig oändligt tillbaka i tiden. Vi ska visa omvändlighet för MA 1-modellen. Vi då Substitutionsförhållande 2 för w t-1 i ekvation 1. 3 zt wt theta1 z-theta1w wt theta1z-theta 2w. At tiden t-2 ekvation 2 blir. Vi ersätter sedan förhållandet 4 för w t-2 i ekvation 3. zt wt Theta1 z - theta 21w wt theta1z - theta 21 z - theta1w wt theta1z - theta1 2z theta 31.Om vi skulle fortsätta oändligt, skulle vi få oändlig ordning AR - modellen. Zt wt theta1 z - theta 21z theta 31z - theta 41z prickar. Observera att om 1 1 kommer koefficienterna som multiplicerar lagren av z ökar oändligt i storlek när vi flyttar tillbaka i tiden. För att förhindra detta behöver vi 1 1 Detta är Villkoret för en inverterbar MA 1-modell. Infinite Order MA-modellen. I vecka 3 ser vi att en AR 1-modell kan konverteras till en oändlig MA-modell. Xt - mu wt phi1w phi 21w prickar phi k1 w prickar summa phi j1w. Denna summering av tidigare vita ljudvillkor är känd som kausalrepresentation av en AR 1 Med andra ord är xt en speciell typ MA med ett oändligt antal termer går tillbaka i tid Detta kallas ett oändligt ord MA eller MA En ändlig ordning MA är en oändlig ordning AR och någon ändlös ordning AR är en oändlig ordning MA. Recall i vecka 1 noterade vi att ett krav på en stationär AR 1 är att 1 1 Låt oss beräkna Var xt med hjälp av kausalrepresentationen. Detta sista steg använder ett grundläggande faktum om geometrisk serie som kräver phi1 1 annars serierna avviker. Allmänna säsongsbetonade ARIMA-modeller 0,1,1 x 0,1,1 etc. Outline av säsongsbetonad ARIMA-modellering. Den säsongsbetonade delen av en ARIMA-modell har samma struktur som den icke-säsongsmässiga delen, den kan ha en AR-faktor, en MA-faktor och en ordning med differentiering. I den säsongsmässiga delen av modellen, alla dessa faktorer fungerar över multiplar av lag s antalet perioder i en säsong. En säsongsbetonad ARI MA-modellen är klassad som en ARIMA p, d, qx P, D, Q-modell, där P antal säsongsautoregressiva SAR-villkor, D antal säsongsskillnader, Q antal säsongsmässiga genomsnittliga SMA-villkor. När man identifierar en säsongsmodell, första steget är att avgöra huruvida en säsongsskillnad behövs, förutom eller kanske istället för en säsongsbetonad skillnad. Du bör titta på tidsserier och ACF - och PACF-tomter för alla möjliga kombinationer av 0 eller 1 icke-säsongsskillnad Och 0 eller 1 säsongsskillnad Varning försiktigt använd inte mer än en säsongsskillnad eller mer än två totala skillnader säsongsmässiga och ej säsongsbundna. Om säsongsmönstret är både starkt och stabilt över tid t. ex. högt på sommaren och lågt i Vinter, eller vice versa, då ska du förmodligen använda en säsongsskillnad oavsett om du använder en säsongsmässig skillnad, eftersom det här förhindrar att säsongsmönstret dör ut i de långsiktiga prognoserna. Låt oss lägga till det i vår lista med regler för att identifiera modeller. Rule 12 Om serien har ett starkt och konsekvent säsongsmönster, bör du använda en ordningsföljd av säsongsskillnader - men använd aldrig mer än en ordning med säsongsskillnader eller mer än 2 order av total differensiering säsongsbetonad nonseasonal. signatur av rent SAR eller rent SMA-beteende liknar signaturen av rent AR eller rent MA-beteende, förutom att mönstret visas över multiplar av lag s i ACF och PACF. Exempelvis har en ren SAR 1-process spikar i ACF Vid Lags s, 2s, 3s, etc medan PACF skär av efter lag s. Conversely, en ren SMA 1-process har spikar i PACF vid lags s, 2s, 3s, etc medan ACF skärs efter lag s. An SAR Signatur uppträder vanligen när autokorrelationen under säsongsperioden är positiv e, medan en SMA-signatur vanligtvis uppstår när säsongens autokorrelation är negativ. Omsättning 13 Om autokorrelationen under säsongperioden är positiv överväga att lägga till en SAR-term för modellen Om autokorrelationen under säsongsperioden är negativ överväga att lägga till ett SMA-uttryck i modellen Försök att undvika att blanda SAR - och SMA-termer i samma modell och undvik att använda mer än något av något slag. Vanligtvis är en SAR 1 eller SMA 1-term tillräckligt. Du kommer sällan Stöter på en äkta SAR 2 eller SMA 2-process och har ännu sällan tillräckligt med data för att uppskatta 2 eller flera säsongs-koefficienter utan att estimeringsalgoritmen kommer in i en återkopplingsslinga. Även om en säsongsbetonad ARIMA-modell verkar ha bara några parametrar, kom ihåg att backproecasting kräver uppskattning av en eller två säsonger värden av implisita parametrar för att initiera den. Därför bör du ha minst 4 eller 5 säsonger av data för att passa en säsongsbetonad ARIMA-modell. Troligtvis är den mest använda säsongsbetonade ARIMA-modellen 0,1,1 X 0,1,1 modell - dvs en MA 1 xSMA 1-modell med både säsongsbetonad och en säsongsbetonad skillnad. Detta är i huvudsak en säsongsmässig exponentiell utjämningsmodell. När årliga ARIMA-modeller är monterade på loggade data kan de tr Ackumulera ett multiplicativt säsongsmönster. Exempel AUTOSALE-serien revisited. Recall att vi tidigare förutspådde försäljningsserien för detaljhandeln genom att använda en kombination av deflation, säsongjustering och exponentiell utjämning. Låt oss nu försöka montera samma serie med säsongsbetonade ARIMA-modeller med samma prov av data från januari 1970 till maj 1993 281 observationer Som tidigare kommer vi att arbeta med deflaterad automatisk försäljning - det vill säga vi använder serien AUTOSALE CPI som ingångsvariabel Här är tidsserierna och ACF - och PACF-diagrammen i originalserien, vilket erhålls i prognosproceduren genom att kartlägga resterna av en ARIMA 0,0,0 x 0,0,0 modell med konstant. Suspensionsbromönstret i ACF är typiskt för en serie som är både icke-stationär och starkt säsongsbetonad. Vi behöver klart åtminstone en ordning med differentiering Om vi tar en icke-sasonlig skillnad, är de motsvarande diagrammen följande. De olika serierna, residualerna av en slumpmässig-walk-med-tillväxtmodell ser mer eller mindre ut ess stilla, men det finns fortfarande mycket stark autokorrelation under säsongsperioden. 12. Eftersom säsongsmönstret är starkt och stabilt vet vi från regel 12 att vi kommer att vilja använda en ordning med säsongsskillnader i modellen. Här är vad bilden Ser ut som en säsongsmässig skillnad. Den säsongsvariationerade serien visar ett mycket starkt mönster av positiv autokorrelation, som vi kommer ihåg från vårt tidigare försök att passa en säsongsmässig slumpmässig modell. Detta kan vara en AR-signatur - eller det kan signalera behovet av En annan skillnad. Om vi tar både en säsongsmässig och icke-säsongsskillnad, erhålls följande resultat. Det här är förstås de rester från den säsongsmässiga slumpmässiga trendmodellen som vi monterade på den automatiska försäljningsdata tidigare. Vi ser nu telltale tecken på mild overdifferensiering de positiva spikarna i ACF och PACF har blivit negativa. Vad är den korrekta ordningen för differentiering En ytterligare information som kan vara till hjälp är en beräkning av felet s serienas tatistik vid varje nivå av differentiering Vi kan beräkna dessa genom att passa motsvarande ARIMA-modeller där endast differens används. De minsta felen, både i estimeringsperioden och valideringsperioden, erhålls genom modell A, som använder en skillnad på varje typ Detta, tillsammans med utseendet på diagrammen ovan, tyder starkt på att vi ska använda både säsongsbetonad och icke-säsongsskillnad. Notera att förutom den gratuösa konstanta termen är modell A den säsongsmässiga slumpmässiga SRT-modellen, medan modell B är Bara den säsongsmässiga slumpmässiga Walk SRW-modellen Som vi noterade tidigare när man jämförde dessa modeller verkar SRT-modellen passa bättre än SRW-modellen I analysen som följer kommer vi att försöka förbättra dessa modeller genom att lägga till säsongsbetonade ARIMA-villkor. Tillbaka till början Av sidan. Den ofta använda ARIMA 0,1,1 x 0,1,1 modell SRT-modellen plus MA 1 och SMA 1 termer. Returning till den sista uppsättningen tomter ovan, märker att med en skillnad av varje typ finns en egativ spik i ACF vid lag 1 och även en negativ spik i ACF vid lag 12 medan PACF visar ett mer gradvis sönderfallsmönster i närheten av båda dessa lags Genom att tillämpa våra regler för att identifiera ARIMA-modeller specifikt regel 7 och regel 13 , Kan vi nu dra slutsatsen att SRT-modellen skulle förbättras genom att tillägga en MA 1-termen och även en SMA 1-term. Även med regel 5 utesluter vi konstanten eftersom två order av differentiering är inblandade. Om vi gör allt detta, vi Få den ARIMA 0,1,1 x 0,1,1-modellen som är den vanligaste säsongsbetonade ARIMA-modellen. Den prognostiserande ekvationen är. Där 1 är MA 1-koefficienten och 1 kapitalet theta-1 är SMA 1-koefficienten. Observera att detta är bara den säsongsmässiga slumpmässiga trendmodellen uppbyggd genom att lägga till multiplar av felen vid lags 1, 12 och 13. Observera också att koefficienten för lag-13-felet är produkten av MA 1 och SMA 1-koefficienterna. Denna modell är begreppsmässigt liknande Winters-modellen i den utsträckning det effektivt tillämpar exponentia Jag utjämnar till nivå, trend och säsongssituation på en gång, även om det vilar på mer solida teoretiska fundament, särskilt när det gäller att beräkna konfidensintervaller för långsiktiga prognoser. Dina kvarstående tomter är i detta fall följande. Även om en liten mängd Autokorrelationen förblir vid lag 12, det övergripande utseendet på diagrammen är bra. Modelleringsresultatet visar att de uppskattade MA 1- och SMA 1-koefficienterna som erhållits efter 7 iterationer är faktiskt signifikanta. Prognoserna från modellen liknar de säsongsmässiga slumpmässiga trendmodellen - - som de plockar upp säsongsmönstret och den lokala trenden i slutet av serien - men de är något slätare i utseende eftersom både säsongsmönster och trend faktiskt är genomsnittliga i en exponentiell utjämning typiskt under den sista några årstider. Vad gör den här modellen verkligen Du kan tänka på det på följande sätt Först beräknar man skillnaden mellan varje månads s värde och en exponentiellt vägd hans Toriskt medelvärde för den månaden som beräknas genom att applicera exponentiell utjämning till värden som observerades under samma månad tidigare år, där mängden utjämning bestäms av SMA 1-koefficienten. Då appliceras en enkel exponentiell utjämning av dessa skillnader för att förutsäga avvikelsen från det historiska genomsnittet som kommer att observeras nästa månad Värdet av SMA 1-koefficienten nära 1 0 tyder på att många årstider av data används för att beräkna det historiska genomsnittet för en viss månad året. Minns att en MA 1-koefficient i En ARIMA 0,1,1 modell motsvarar 1-minus-alfa i motsvarande exponentiella utjämningsmodell och att medeltal för data i en exponentiell utjämningsmodellprognos är 1 alfa. SMA 1-koefficienten har en liknande tolkning med avseende på medelvärden över säsonger Här antyder värdet 0 91 att medelåldern för de data som används för att uppskatta det historiska säsongsmönstret är lite mer än 10 ja Rs nästan hälften av datamängden, vilket innebär att ett nästan konstant säsongsmönster antas. Det mycket mindre värdet på 0 5 för MA 1-koefficienten tyder på att relativt liten utjämning görs för att uppskatta den aktuella avvikelsen från det historiska genomsnittet för samma månad kommer nästa månad s förutspådda avvikelse från dess historiska medelvärde att vara nära avvikelserna från det historiska genomsnittet som observerades under de senaste månaderna. ARIMA 1,0,0 x 0,1,0 modell med konstant SRW-modellen plus AR 1-termen. Den tidigare modellen var en säsongsmässig slumpmässig trend SRT-modell finjusterad genom tillsats av MA 1 och SMA 1-koefficienter. En alternativ ARIMA-modell för denna serie kan erhållas genom att ersätta en AR 1-term för den icke-säsongsskillnad - genom att lägga till ett AR 1-term till SRW-modellen för Seasonal Random Walk Detta gör det möjligt för oss att bevara säsongsmönstret i modellen samtidigt som den totala differensskillnaden sänks, vilket ökar stabiliteten hos tråden slutprojektioner om så önskas Minns att med en säsongsskillnad ensam, ser serien ut en stark AR 1-signatur. Om vi gör det erhåller vi en ARIMA 1,0,0 x 0,1,0 modell med konstant vilket ger följande resultat . AR 1-koefficienten är faktiskt mycket signifikant och RMSE är bara 2 06 jämfört med 3 00 för SRW-modellen Modell B i jämförelsesrapporten ovan. Prognosekvationen för denna modell är. Den extra termen på höger - sidan är en multipel av säsongsskillnaden observerad under den senaste månaden, vilket medför att korrigeringen av effekten av ett ovanligt gott eller dåligt år här 1 betecknar AR 1-koefficienten, vars uppskattade värde är 0 73 Således, till exempel , Om försäljningen förra månaden var X dollar före försäljningen ett år tidigare, skulle kvantiteten 0 73X läggas till prognosen för denna månad betecknar CONSTANT i prognosförhållandet, vars uppskattade värde är 0 20 Den uppskattade MÄNNEN, vars värde är 0 75, är medelvärdet för haven olikartad serie, vilken är den årliga trenden i de långsiktiga prognoserna för denna modell. Konstanten är per definition lika med medeltiderna 1 minus AR 1-koefficienten 0 2 0 75 1 0 73. Prognosplotten visar att modellen faktiskt Gör ett bättre jobb än SRW-modellen för spårning av cykliska förändringar, dvs ovanligt bra eller dåliga år. Dock är MSE för denna modell fortfarande betydligt större än vad vi erhållit för ARIMA 0,1,1 x 0,1,1-modellen Om Vi tittar på restvärdena, vi ser utrymme för förbättring Resterna visar fortfarande ett tecken på cyklisk variation. ACF och PACF föreslår behovet av både MA 1 och SMA 1-koefficienter. En förbättrad version ARIMA 1,0,1 x 0 , 1,1 med konstant. Om vi lägger till de angivna MA 1 och SMA 1 termerna till föregående modell erhåller vi en ARIMA 1,0,1 x 0,1,1 modell med konstant vars prognosförening är. Detta är nästan samma som ARIMA 0,1,1 x 0,1,1 modell med undantag för att den ersätter nonseasonal skillnaden med en AR 1 term en partiell skillnad ce och den innehåller en konstant term som representerar den långsiktiga trenden. Denna modell antar en mer stabil trend än ARIMA 0,1,1 x 0,1,1-modellen, och det är den huvudsakliga skillnaden mellan dem. Passande resultat är följande. Notera att den uppskattade AR 1 koefficienten 1 i modellekvationen är 0 96, vilket är mycket nära 1 0 men inte så nära att det föreslås att det absolut bör ersättas med en första skillnad är dess standardfel är 0 02, så det är cirka 2 standardfel från 1 0 Den andra statistiken i modellen är de beräknade MA 1- och SMA 1-koefficienterna och felstatistiken i uppskattnings - och valideringsperioderna i övrigt nästan identiska med de för ARIMA 0,1, 1 x 0,1,1-modell De uppskattade MA 1- och SMA 1-koefficienterna är 0 45 och 0 91 i denna modell vs 0 48 och 0 91 i den andra. Den beräknade MEAN på 0 68 är den förutsagda långsiktiga trendens genomsnittliga årliga öka Detta är i huvudsak samma värde som erhölls i 1,0,0 x 0,1,0-med-konstanten Modell Standardfelet för det uppskattade medelvärdet är 0 26, så skillnaden mellan 0 75 och 0 68 är inte signifikant. Om konstanten inte inkluderades i denna modell skulle det vara en dämpad trendmodell, trenden i dess mycket långa Prognoser från denna modell ser ganska ut som i 0,1,1 x 0,1,1-modellen, eftersom den genomsnittliga trenden liknar den lokala trenden i slutet av serien Förtroendet för denna modell ökar dock något mindre på grund av antagandet att trenden är stabil. Observera att konfidensgränserna för de tvååriga prognoserna nu ligger inom de horisontella rutorna vid 24 och 44 medan de 0,1,1 x 0,1,1 modell gjorde inte. Seasonal ARIMA kontra exponentiell utjämning och säsongjustering Nu låt s jämföra prestanda de två bästa ARIMA modellerna mot enkla och linjära exponentiella utjämningsmodeller tillsammans med multiplikativ säsongjustering och Winters modell, som visas i bilderna på prognoser med säsongjustering. Felstatistiken för prognoserna för en period framåt för alla modeller är extremt nära i det här fallet. Det är svårt att välja en vinnare baserat på dessa siffror ensam. Gå tillbaka till toppen av sidan. är skillnaderna mellan de olika säsongsmodellerna De tre modellerna som använder multiplicativ säsongsjustering handlar om säsongsmässighet på ett tydligt sätt - dvs säsongsindex är brutna ut som en explicit del av modellen. ARIMA-modellerna hanterar säsongsmässigt på ett mer implicit sätt - - Vi kan inte lätt se i ARIMA-utgången, hur genomsnittet i december säger, skiljer sig från medeltalet i juli Beroende på om det anses viktigt att isolera säsongsmönstret kan detta vara en faktor vid valet mellan modellerna ARIMA-modellerna har fördelen att när de har initialiserats har de färre rörliga delar än exponentiella utjämnings - och justeringsmodeller och som sådana kan de vara mindre benägna att överföra data ARIMA-modellerna al så ha en mer solid underliggande teori med hänsyn till beräkningen av konfidensintervaller för längre horisontprognoser än de andra modellerna. Det finns mer dramatiska skillnader bland modellerna med avseende på beteendet hos deras prognoser och konfidensintervaller för prognoser mer än 1 Period in i framtiden Det här är de antaganden som görs med hänsyn till förändringar i trend och säsongsmönster är mycket viktiga. Mellan de två ARIMA-modellerna uppskattar en modell A en tidsvarierande trend medan den andra modellen B innehåller en lång medellång trend Vi kan, om vi önskar, utplåna den långsiktiga trenden i modell B genom att undertrycka den konstanta termen. Bland modellerna för exponentiell utjämning plus plus antar en modell C en platt trend medan den andra modellen D Antar en tidsvarierande trend Winters modell E antar också en tidsvarierande trend. Modeller som antar en konstant trend är relativt säkrare i sina långsiktiga prognoser än modeller som inte gör det, Och detta kommer vanligtvis att avspeglas i den utsträckning som konfidensintervall för prognoser blir bredare vid längre prognoshorisonter. Modeller som inte antar tidsvarierande trender har vanligtvis smalare konfidensintervaller för längre horisontprognoser, men smalare är inte bättre om inte detta antagande är Korrekt. De två exponentiella utjämningsmodellerna kombinerat med säsongsjustering förutsätter att säsongsmönstret har varit konstant under de 23 åren i dataprovet, medan de övriga tre modellerna inte är så länge som säsongsmönstret står för det mesta av månaden till månaden Variation i data är att det är viktigt att förutse vad som kommer att hända flera månader in i framtiden Om säsongsmönstret tros ha förändrats långsamt över tiden, skulle en annan metod vara att bara använda en kortare datalogik för att anpassa modellerna som uppskattar fasta säsongsindex. För rekordet är här prognoserna och 95 konfidensgränser för maj 1995 24 månader framåt som är producent ced av de fem modellerna. Pointprognoserna är faktiskt förvånansvärt nära varandra i förhållande till bredden av alla konfidensintervaller SES-poängprognosen är den lägsta, eftersom den är den enda modellen som inte antar en uppåtgående trend i slutet av serien ARIMA 1,0,1 x 0,1,1 c-modellen har de smalaste konfidensgränserna, eftersom det förutsätter mindre tidsvariation i parametrarna än de andra modellerna. Dessutom är dess prognosprognos något större än de för de Andra modeller, eftersom det extrapolerar en långsiktig trend snarare än en kortsiktig trend eller noll trend. Winters modellen är minst stabil i modellerna och dess prognos har därför de största konfidensgränserna, vilket framgår av detaljerade prognoser Tomter för modellerna och prognoserna och konfidensgränserna för ARIMA 0,1,1 x 0,1,1 modellen och LES-säsongsjusteringsmodellen är nästan identiska. För att logga eller inte logga Något som vi inte har gjort än , men kan ha, är en logg t Ransformation som en del av modellen Säsongsmässiga ARIMA-modeller är i sig additiva modeller, så om vi vill fånga ett multiplicativt säsongsmönster måste vi göra det genom att logga in data före montering av ARIMA-modellen. I Statgraphics behöver vi bara ange Natural Log som ett modelleringsalternativ - ingen stor sak I det här fallet verkar deflationstransformationen ha gjort ett tillfredsställande jobb för att stabilisera amplituden för säsongscyklerna, så det verkar inte vara en tvingande anledning att lägga till en logtransformation så länge som Termen trender är oroliga Om resterna uppvisar en markant ökning av variansen över tiden kan vi bestämma annorlunda. Det är fortfarande en fråga om huruvida felen i dessa modeller har en konsekvent varians över månader på året om de inte gör det, då konfidensintervall för prognoser kan tendera att vara för bred eller för smal beroende på säsongen. Rest-vs-time-tomterna visar inte ett uppenbart problem i detta avseende, men för att vara noggrann skulle det vara bra att titta på felvariationen per månad Om det verkligen finns ett problem, kan en loggomvandling fixa den. Tillbaka till början av sidan.
Comments
Post a Comment