Wednesday 25 October 2017

Glidande Medelvärde Säsongs Justering


Kalkylbladsimplementering av säsongjustering och exponentiell utjämning. Det är enkelt att utföra säsongsjustering och passa exponentiella utjämningsmodeller med Excel. Skärmbilderna och diagrammen nedan tas från ett kalkylblad som har ställts in för att illustrera multiplikativ säsongsjustering och linjär exponentiell utjämning på efter kvartalsvisa försäljningsdata från Outboard Marine. För att få en kopia av kalkylarkfilen själv, klicka här. Den version av linjär exponentiell utjämning som används här för demonstration är Brown s-versionen, bara för att den kan implementeras med en enda kolumn Av formler och det finns bara en utjämningskonstant för att optimera. Det är oftast bättre att använda Holt s-versionen som har separata utjämningskonstanter för nivå och trend. Prognosprocessen fortskrider enligt följande. Första gången är data säsongrensade ii, sedan genereras prognoser för Säsongsrensade data via linjär exponentiell utjämning och iii fin allierade är de säsongsrensade prognoserna resesasonalized för att få prognoser för originalserien. Säsongsjusteringsprocessen utförs i kolumnerna D till och med G. Det första steget i säsongjustering är att beräkna ett centrerat rörligt medelvärde som görs här i kolumn D Detta kan göras av Tar medeltalet av två års övergripande medelvärden som kompenseras av en period i förhållande till varandra. En kombination av två offsetmedelvärden i stället för ett enda genomsnitt är nödvändigt för centreringsändamål när antalet årstider är jämnt. Nästa steg är att beräkna förhållandet till glidande medelvärdet - de ursprungliga uppgifterna dividerat med det glidande medeltalet i varje period - vilket här görs i kolumn E Detta kallas också trendcykelkomponenten i mönstret, i den mån trend och konjunkturseffekter kan Anses vara allt som förblir efter medeltal över ett heltårs värde av data. Naturligtvis kan förändringar i månad till månad som inte beror på säsongsbestämning bestämmas av många andra faktorer S, men tolvmånadersgenomsnittet släpper i stor utsträckning Det beräknade säsongsindexet för varje säsong beräknas genom att medeltalvärda alla förhållanden för den aktuella säsongen, vilket görs i cellerna G3-G6 med en AVERAGEIF-formel. Medelvärdena Återkallas sedan så att de sammanfaller till exakt 100 gånger antalet perioder i en säsong, eller 400 i detta fall, vilket görs i cellerna H3-H6 Nedan i kolumn F används VLOOKUP-formler för att infoga lämpligt säsongsindexvärde i varje rad i datatabellen, enligt kvartalet representerar den det centrerade glidande medlet och de säsongrensade uppgifterna ser ut så här. Notera att det glidande medlet oftast ser ut som en mjukare version av den säsongrensade serien och det Är kortare i båda ändarna. Ett annat arbetsblad i samma Excel-fil visar tillämpningen av den linjära exponentiella utjämningsmodellen till säsongrensade data, som börjar i kolumn GA-värdet för utjämningskonstanten alfa är en tered ovanför prognoskolonnen här i cell H9 och för att få det tilldelas det namnet Alfabet Namnet är tilldelat med kommandot Infoga namn Skapa LES-modellen initieras genom att ställa in de första två prognoserna lika med det första verkliga värdet av säsongsmässigt justerad serie Formeln som används här för LES-prognosen är recursiv form av Brown s-modellen. Denna formel är inmatad i cellen som motsvarar den tredje perioden här, cell H15 och kopieras därifrån Observera att LES-prognosen för Aktuell period avser de två föregående observationerna och de två föregående prognosfelen, liksom värdet av alfa. Således refererar prognosformeln i rad 15 endast till data som var tillgängliga i rad 14 och tidigare. Om vi ​​naturligtvis önskade att använd enkel istället för linjär exponentiell utjämning, kunde vi ersätta SES-formeln här istället Vi kunde också använda Holt s snarare än Brown s LES-modell, vilket skulle kräva ytterligare två kolumner av formu Las för att beräkna nivån och trenden som används i prognosen. Felen beräknas i nästa kolumn här, kolumn J genom att subtrahera prognoserna från de faktiska värdena. Röda medelkvadratfelet beräknas som kvadratroten av variansen hos Fel plus kvadraten av medelvärdet Detta följer av den matematiska identiteten MSE VARIANCE-fel AVERAGE-fel 2 Vid beräkning av medelvärdet och variansen av fel i denna formel är de två första perioderna uteslutna eftersom modellen inte faktiskt börjar prognoser förrän den tredje perioden Rad 15 på kalkylbladet Det optimala värdet av alfa kan hittas antingen genom att manuellt byta alfa tills det minsta RMSE hittas, annars kan du använda Solver för att utföra en exakt minimering. Värdet av alfabetet som Solver hittat visas här alfa 0 471. Det är vanligtvis en bra idé att plotta felet i modellen i transformerade enheter och även att beräkna och plotta sina autokorrelationer vid lags på upp till en säsong. Här är en tidsserie plot av säsongrensade fel. Felautokorrelationerna beräknas med hjälp av CORREL-funktionen för att beräkna korrelationerna av felen med sig självfördröjda av en eller flera perioder - detaljer visas i kalkylbladsmodellen. Här är en plot av autokorrelationerna i Fel i de första fem lagsna. Autokorrelationerna vid lags 1 till 3 ligger mycket nära noll, men spetsen vid Lags 4 vars värde är 0 35 är lite besvärligt - det tyder på att säsongsjusteringsprocessen inte har blivit helt framgångsrik. Det är faktiskt bara marginellt signifikant 95 signifikansband för att testa om autokorrelationer är signifikant olika från noll är ungefär plus-eller-minus 2 SQRT nk, där n är provstorleken och k är lagret här n är 38 och k varierar från 1 till 5, så att kvadratroten av minus-k är omkring 6 för dem alla, och därmed är gränserna för att testa den statistiska signifikansen av avvikelser från noll ungefär plus-eller-minus 2 6 eller 0 33 Om du varierar värdet av alfabetet för hand i denna Excel-modell kan du observera effekten på tidsserierna och autokorrelationsdiagrammen för felen, liksom på det roten-kvadratiska felet, vilket kommer att illustreras nedan. I botten av kalkylbladet , prognosformuläret startas upp i framtiden genom att bara ersätta prognoser för faktiska värden vid den punkt där den faktiska data löper ut, dvs där framtiden börjar. Med andra ord, i varje cell där ett framtida datavärde skulle uppstå, en cellreferens infogas som pekar på prognosen som gjorts för den perioden. Alla övriga formler kopieras helt enkelt nerifrån. Notera att felen för framtidsprognoser alla beräknas vara noll. Det betyder inte att de faktiska felen kommer att vara noll utan snarare det återspeglar bara det faktum att vi förutspår att framtida data kommer att motsvara prognoserna i genomsnitt. De resulterande LES-prognoserna för de säsongrensade uppgifterna ser ut som detta. Med denna speciella värdering E av alfa, vilket är optimalt för prognoser med ett tidsintervall, är den prognostiserade trenden något uppåt, vilket återspeglar den lokala trenden som observerades under de senaste 2 åren eller så. För andra värden av alfa kan en väldigt annorlunda trendprojekt erhållas Det är vanligtvis en bra idé att se vad som händer med den långsiktiga trendprojektionen när alfa varieras, eftersom det värde som är bäst för kortsiktiga prognoser inte nödvändigtvis är det bästa värdet för att förutsäga den mer avlägsna framtiden. Till exempel, här Är resultatet som erhålls om värdet av alfa manuellt ställs in på 0 25. Den prognostiserade långsiktiga trenden är nu negativ snarare än positiv Med ett mindre värde av alfa lägger modellen mer vikt vid äldre data vid uppskattningen av den nuvarande nivån och trenden och dess långsiktiga prognoser speglar den nedåtgående trend som observerats under de senaste 5 åren snarare än den senaste uppåtgående trenden. Detta diagram illustrerar också tydligt hur modellen med ett lägre värde av alfa är långsammare Att svara på vändpunkter i data och tenderar därför att göra ett fel på samma tecken för många perioder i rad. De 1-stegsprognosfel är större i genomsnitt än de som erhållits före RMSE på 34 4 i stället för 27 4 och starkt positiv autokorrelerad Lag-1-autokorrelationen av 0 56 överstiger värdet 033 beräknat ovan för en statistiskt signifikant avvikelse från noll. Som ett alternativ till att sänka värdet av alfa för att införa mer konservatism i långsiktiga prognoser, en trenddämpningsfaktor läggs ibland till modellen för att göra den prognostiserade trenden utplattad efter några få år. Det sista steget i att bygga prognosmodellen är att rimliggöra LES-prognoserna genom att multiplicera dem med lämpliga säsongsindex. Således är de reseasonaliserade prognoserna I kolumn I är helt enkelt produkten av säsongsindexen i kolumn F och de säsongrensade LES-prognoserna i kolumn H. Det är relativt lätt att beräkna förtroende Intervaller för enstegs-prognoser gjorda av denna modell beräknar först RMSE root-mean-squared-felet, vilket är bara kvadratroten i MSE och beräknar sedan ett konfidensintervall för den säsongrensade prognosen genom att lägga till och subtrahera två gånger RMSE I allmänhet är ett 95 konfidensintervall för en prognos för en period framåt ungefär lika med punktprognosen plus-eller-minus-två gånger den uppskattade standardavvikelsen för prognosfel, förutsatt att felfördelningen är ungefär normal och provstorleken Är tillräckligt stor, säg 20 eller mer Här är RMSE snarare än standardprovfelens avvikelse den bästa uppskattningen av standardavvikelsen för framtida prognosfel eftersom det tar förskjutning med hänsyn till slumpmässiga variationer. Förtroendebegränsningarna för säsongsmässigt Justerad prognos anpassas sedan tillsammans med prognosen genom att multiplicera dem med lämpliga säsongsindex. I detta fall är RMSE lika med 27 4 och den säsongrensade prognos för den första framtida perioden Dec-93 är 273 2 så säsongrensat 95 konfidensintervall är från 273 2-2 27 4 218 4 till 273 2 2 27 4 328 0 Multiplicera dessa gränser före december s säsongsindex på 68 61 erhåller vi lägre och övre konfidensgränser på 149 8 och 225 0 kring prognosen för 93-procentiga prognoser om 187 4. Förutsättningsgränser för prognoser mer än en period framöver kommer i allmänhet att öka när prognoshorisonten ökar på grund av osäkerhet om nivå och trend också som säsongsfaktorer men det är svårt att beräkna dem generellt med analytiska metoder. Det lämpliga sättet att beräkna konfidensgränser för LES-prognosen är att använda ARIMA-teorin men osäkerheten i säsongsindex är en annan sak. Om du vill ha ett realistiskt självförtroende Intervall för en prognos mer än en period framåt, med hänsyn till alla felkällor, är det bästa att använda empiriska metoder, till exempel för att få ett konfidensintervall för en 2-stegs prognos, kan du skapa En annan kolumn i kalkylbladet för att beräkna en 2-stegs prognos för varje period genom att startrampa enstegsprognosen. Beräkna sedan RMSE för prognosfel med två steg framåt och använd detta som grund för ett 2-stegs - förtroendeintervall. Vidande medelvärde. Ett rörligt medelvärde är en metod för utjämning av tidsserier genom att medelvärde med eller utan vikter ett fast antal konsekutiva termer. Medelvärdet rör sig över tiden, eftersom varje datapunkt för serien i följd ingår i medelvärdet , medan den äldsta datapunkten i genomsnittets spänning är borttagen. Mer generellt är ju längre spänningen i genomsnittet, ju slätare är den resulterande serien. Flyttmedelvärden används för att jämföra fluktuationer i tidsserier eller för att identifiera tidsseriekomponenter, såsom trenden, cykeln, säsongens säsong osv. Ett glidande medel ersätter varje värde av en tidsserie med ett vägt genomsnitt av p föregående värden, det angivna värdet och f följer värdena i en serie Om pf det glidande medlet sägs vara b e rörligt medelvärde sägs vara symmetriskt om det är centrerat och om för varje k 1, 2, pf är vikten av det föregående värdet lika med vikten av den följande följande. Det glidande medlet definieras inte För de första p och de sista f-tidsserievärdena För att beräkna det glidande medlet för dessa värden måste serien backcastas och prognostiseras. Källa Task force på data och metadatapresentation för OECD: s kortsiktiga ekonomiska statistikgrupp STESWP, Paris, 2004.Koncept av stationaritet. Hypotetiskt kan den aktuella observationen bero på alla tidigare observationer. En sådan autoregressiv modell är omöjlig att uppskatta eftersom den innehåller för många parametrar. Om xt som en linjär funktion av alla tidigare lags kan det visas att Autoregressiv modell motsvarar xt som en linjär funktion av endast några tidigare chocker. I en glidande genomsnittsmodell beskrivs nuvärdet av xt som en linjär funktion av samtidigt chockfel och tidigare chockfel. Säsongsjustering Nt-resultat anses vara stabila om de är relativt resistenta mot att ta bort eller lägga till datapunkter i vardera slutet av serien. Stabilitet är en av de viktigaste egenskaperna hos SA-resultaten. Om tillägg eller fördröjning gör några observationer väsentligt förändrade säsongrensade serier eller beräknad trendcykel , tolkningen av den säsongrensade serien skulle vara opålitlig. Vad är SI-förhållandena. SI-förhållandena är värden för säsong-oregelbunden SI-komponent, beräknad som förhållandet mellan den ursprungliga serien och den beräknade trenden Med andra ord är SI-förhållandena uppskattningar av de avgränsade serierna SI-diagrammen är användbara för att undersöka huruvida kortsiktiga rörelser orsakas av säsongsmässiga eller oregelbundna fluktuationer. Diagrammet är ett diagnostiskt verktyg som används för att analysera säsongsbeteendet, flytta semestermönstren, utjämnare och identifiera säsongsbrott i serien. Justeringsprogrammet visar vanligen följande information om RegARIMA-modellen. Modellera urvalskriterierna Mationskriterier är åtgärder av den relativa godheten för passformen i en statistisk modell I säsongsjusteringsprogrammen används de för att välja den optimala ordningen för RegARMIA-modellen. För de givna informationskriterierna är den föredragna modellen den som har det minsta informationskriteriumvärdet. I iteration B, tabell B7, iteration C Tabell C7 och iteration D Tabell D7 och Tabell D12 extraheras Trend-cykelkomponenten från en uppskattning av den säsongrensade serien med hjälp av Henderson-glidmedelvärdena. Henderson-filtrets längd väljs automatiskt av X-12 - ARIMA i ett tvåstegsförfarande. Flyttande medelvärden. Fasförskjutning är skillnaden i att detektera vändpunkter mellan original och jämn data. Denna effekt är en nackdel, eftersom det medför en fördröjning av att detektera vändpunkterna för tidsserierna, särskilt i de flesta Aktuell period De symmetriska, centrerade rörliga medelvärdena är resistenta mot denna effekt Men i slutet och i början av tidsserierna kan symmetriska tidsserier inte Användas För att beräkna de jämnvärda värdena i de båda ändarna av tidsserierna används det asymmetriska filtret, men de orsakar faseffekten. Du kan klicka och dra i plottområdet för att zooma in. Du kan överföra data över data till se det faktiska värdet som är grafat. Om det finns en legendarisk låda, klicka på servernamnet för att dölja visa dem. Med hjälp av medelvärden används aritmetiska medelvärden för successiva tidsintervaller av seriens längd När de tillämpas på de ursprungliga tidsserierna producerar de en serie av medelvärden Den allmänna formeln för att flytta medelvärdet M av koefficienterna är. De rörliga medelvärdena koefficienterna kallas vikter Mängden pf 1 är den glidande genomsnittsordern. Det rörliga genomsnittet kallas centrerat om antalet observationer i det förflutna är lika med Nummerobservationen i framtiden, dvs om p är lika med f. Medelvärdena ersätter de ursprungliga tidsserierna med viktade medelvärden av de aktuella värdena, p-observationer före den aktuella observationen och observatorn Vi följer den nuvarande observationen. De används för att mjuka de ursprungliga tidsserierna. Tabellen visar antalet passagerare som flygtas av Finland under 2001. De samma uppgifterna presenteras på diagrammet. Typer av glidande medelvärden. På grundval av viktning mönster, rörliga medelvärden kan vara. Symmetrisk vägningsmönstret som används för att beräkna glidande medelvärden är symmetrisk om måldatapunkten Med hjälp av symmetriska rörliga medelvärden är det inte möjligt att erhålla de jämnda värdena för de första p - och sista p-observationerna för symmetriska rörliga medelvärden p f. Asymmetric det vägningsmönster som används för att beräkna glidande medelvärden är inte symmetrisk om måldatapunkten. Flyttande medelvärden kan också klassificeras enligt deras bidrag till slutvärdet as. Simple moving averagees, dvs. de rörliga genomsnittsvärdena för vilka alla vikter är Samma Vid enkla glidande medelvärden bidrar alla observationer lika med det slutliga värdet. Oftast är alla enkla glidande medelvärden syra Mmetric Formellt för symmetriskt glidande medelvärde av ordningen P 2p 1 är alla vikter lika med 1 P. Bilden nedan jämför hur stor utjämning som uppnåtts genom att tillämpa 3-siktiga och 7-siktiga glidande medelvärden. De extrema observationerna t. ex. april 2010 eller juni 2011 har lägre inverkan på det längre rörliga genomsnittet än på kortare. Inga enkla glidande medelvärden, det vill säga de glidande medelvärdena för vilka alla vikter inte är desamma. De speciella fallen med icke-enkla glidande medelvärden är de rörliga genomsnittsvärdena som erhålls genom komponera ett enkelt rörligt medelvärde av ordning P, vars koefficienter är alla lika med 1 P och ett enkelt glidande medelvärde av ordning Q, vars koefficienter är alla lika med 1 Q. Asymmetriska rörliga medelvärden. Egenskaper för rörliga medelvärden. De rörliga medelvärdena fördröjer tiden Serier. När de tillämpas på en tidsserie reducerar de amplituden för de observerade fluktuationerna och fungerar som ett filter som tar bort oregelbundna rörelser från den. De rörliga medelvärdena med lämpligt viktningsmönster kan användas D för att eliminera cykler av en viss längd i tidsserierna I X-12-ARIMA säsongsjusteringsmetod används olika typer av rörliga medelvärden för att uppskatta trendcykeln och säsongskomponenten. Om summan av koefficienterna är lika med 1, då det rörliga genomsnittet bevarar trenden. Flyttande medelvärden har två viktiga standardvärden. De är inte robusta och kan påverkas djupt av outliers. Utjämningen i slutet av serien kan inte göras utan med asymmetriska glidmedel som introducerar fasskift och fördröjningar i upptäckt av vändpunkter. I X11-metoden spelar symmetriska glidande medelvärden en viktig roll eftersom de inte introducerar någon fasförskjutning i den släta serien. För att undvika att förlora information vid serieändarna kompletteras de antingen av ad hoc-asymmetriska glidande medelvärden Eller tillämpas på serien som är färdigställd av prognoser.

No comments:

Post a Comment