Friday 8 December 2017

A prosty ruchomy średni model jest odpowiednio używany do trend prognozowania


LUB-Uwagi to seria wprowadzających uwag na tematy, które mieszczą się w szerokim polu badań operacyjnych (OR). Pierwotnie były używane przeze mnie w kursie wprowadzającym LUB kursie, który prowadzę w Imperial College. Są one teraz dostępne do użytku dla wszystkich uczniów i nauczycieli zainteresowanych OR, z zastrzeżeniem następujących warunków. Pełną listę tematów dostępnych w OR-Notes można znaleźć tutaj. Prognozowanie Wstęp Prognozowanie to oszacowanie wartości zmiennej (lub zbioru zmiennych) w pewnym momencie w przyszłości. W tej notatce rozważymy niektóre metody prognozowania. Zazwyczaj przeprowadza się prognozę, aby zapewnić pomoc w podejmowaniu decyzji i planowaniu przyszłości. Zazwyczaj wszystkie takie ćwiczenia działają na założeniu, że jeśli potrafimy przewidzieć, jaka będzie przyszłość, możemy zmodyfikować nasze zachowanie, aby być teraz w lepszej pozycji, niż w przeciwnym razie, gdy nadejdzie przyszłość. Aplikacje do prognozowania obejmują: kontrolę zapasów planowanie produkcji - prognozowanie zapotrzebowania na produkt pozwala nam kontrolować zapasy surowców i wyrobów gotowych, planować harmonogram produkcji, itp. Polityka inwestycyjna - prognozowanie informacji finansowych, takich jak stopy procentowe, kursy walut, ceny akcji , cena złota itd. Jest to dziedzina, w której nikt jeszcze nie opracował rzetelnej (konsekwentnie dokładnej) techniki prognozowania (lub przynajmniej, jeśli nikomu nie powiedzieli) polityki gospodarczej - prognozowania informacji gospodarczych, takich jak wzrost gospodarka, bezrobocie, stopa inflacji itp. są niezbędne zarówno dla rządu, jak i biznesu w planowaniu na przyszłość. Pomyśl przez chwilę, przypuśćmy, że dobra wróżka pojawiła się przed tobą i powiedziała ci, że ze względu na twoją dobroć, cnotę i czystość (no cóż, to jest bajka), postanowili dać ci trzy prognozy. Które trzy rzeczy w życiu osobistym najbardziej chciałbyś przewidzieć? Osobiście wybrałbym (w kolejności malejącej ważności): datę mojej śmierci zwycięskie liczby na następnej brytyjskiej loterii narodowej zwycięskie liczby na brytyjskiej loterii krajowej po tym wydarzeniu Jak widać z mojej listy niektóre prognozy mają konsekwencje dla życia lub śmierci. Oczywiste jest również, że niektóre prognozy, np. w dniu mojej śmierci moglibyśmy (pod nieobecność dobrej wróżki, aby nam pomóc) zebrać trochę danych, aby umożliwić bardziej świadomą, a więc i miejmy nadzieję dokładniejszą prognozę. Na przykład możemy przyjrzeć się oczekiwanej długości życia dla brytyjskich naukowców w średnim wieku (osoby niepalące, pijące, nigdy nie ćwiczące). Możemy również przeprowadzać testy medyczne. Należy podkreślić, że gromadzenie odpowiednich danych może prowadzić do lepszej prognozy. Oczywiście, że nie, mogłem zostać przejechany samochodem następnego dnia po tym napisaniu i dlatego już nie żyję. Rzeczywiście, na podstawie osobistej notatki uważam (niestety), że firmy oferujące nieśmiertelność w sieci (cyfrowej) będą dużym obszarem wzrostu biznesu na początku XXI wieku. Zapamiętaj, że widziałeś go tutaj pierwszy Typy metodologii prognozowania Jednym ze sposobów klasyfikacji problemów prognostycznych jest uwzględnienie skali czasowej związanej z prognozą, tj. Jak daleko w przyszłość próbujemy przewidzieć. Krótko, średnio i długoterminowo są to zwykle stosowane kategorie, ale rzeczywiste znaczenie każdego z nich będzie różne w zależności od badanej sytuacji, np. w prognozowaniu zapotrzebowania na energię w celu budowy elektrowni 5-10 lat byłoby krótkoterminowe, a 50 lat byłoby długoterminowe, podczas gdy w prognozowaniu popyt konsumpcyjny w wielu sytuacjach biznesowych do 6 miesięcy byłby krótkotrwały i przez kilka lat długoterminowych. Poniższa tabela pokazuje skalę czasową związaną z decyzjami biznesowymi. Podstawową przyczyną powyższej klasyfikacji jest stosowanie różnych metod prognozowania w każdej sytuacji, np. Metoda prognozowania odpowiednia do prognozowania sprzedaży w przyszłym miesiącu (prognoza krótkoterminowa) byłaby prawdopodobnie niewłaściwą metodą prognozowania sprzedaży za pięć lat (prognoza długoterminowa). W szczególności należy zauważyć, że wykorzystanie liczb (danych), do których stosuje się techniki ilościowe, zazwyczaj zmienia się od bardzo wysokich prognoz krótkoterminowych do bardzo niskich prognoz długoterminowych, gdy mamy do czynienia z sytuacjami biznesowymi. Metody prognozowania można podzielić na kilka różnych kategorii: metody jakościowe - w przypadku braku formalnego modelu matematycznego, często dlatego, że dostępne dane nie są reprezentatywne dla przyszłych metod regresji (prognozowania długoterminowego) - rozszerzenie regresji liniowej uważa się, że zmienna jest liniowo powiązana z wieloma innymi niezależnymi zmiennymi metodami wielokrotnych równań - gdzie istnieje szereg zmiennych zależnych, które współdziałają ze sobą za pomocą szeregu równań (jak w modelach ekonomicznych) metod szeregów czasowych - gdzie mamy pojedyncza zmienna, która zmienia się wraz z czasem i której przyszłe wartości są w jakiś sposób powiązane z jej przeszłymi wartościami. Rozpatrzymy każdą z tych metod po kolei. Metody jakościowe Metody tego typu są stosowane przede wszystkim w sytuacjach, w których ocenia się, że nie są to istotne dane z przeszłości (liczby), na których można oprzeć prognozę i zazwyczaj dotyczą prognozowania długoterminowego. Jednym z takich podejść jest technika Delphi. Starożytni Grecy mieli bardzo logiczne podejście do prognozowania i myśleli, że najlepszymi ludźmi, którzy pytają o przyszłość, są istoty nadprzyrodzone, bogowie. W wyroczni w Delfach w starożytnej Grecji na pytania do bogów odpowiedziano za pośrednictwem kobiety powyżej pięćdziesiątki, która żyła z dala od męża i ubrała się w strój panny. Jeśli chcesz odpowiedzieć na twoje pytanie, musisz: dostarczyć trochę ciasta, dostarczyć zwierzę na ofiarę i kąpać się w medium na wiosnę. Następnie medium będzie siedziało na statywie w piwnicy w świątyni, żuć liście laurowe i odpowiadać na twoje pytanie (często w niejednoznacznym wersecie). Uzasadnione jest zatem pytanie, czy w głębi jakiegoś pomieszczenia w suterenie znajduje się urzędnik rządowy żujący liść laurowy, który jest zatrudniony do prognozowania wzrostu gospodarczego, sukcesu wyborczego, itd. Być może na chwilę jest Refleks, czy wierzysz, że Dokonywanie prognoz w sposób stosowany w Delphi prowadzi do dokładnych prognoz lub nie Najnowsze badania naukowe (New Scientist, 1 września 2001) wskazują, że podłoże mogło być quotighquot w wyniku wdychania oparów węglowodorów, w szczególności etylenu, pochodzącego z uskoków geologicznych pod spodem Świątynia. W dzisiejszych czasach technika Delphi ma inne znaczenie. Polega ona na zwróceniu się do zespołu ekspertów o wypracowanie konsensusu co do przyszłości. U podstaw idei korzystania z ekspertów leży przekonanie, że ich pogląd na przyszłość będzie lepszy niż pogląd nie-ekspertów (takich jak osoby wybierane losowo na ulicy). Zastanów się - jakie typy ekspertów byś wybrał, gdybyś próbował przewidzieć, jaki będzie świat za 50 lat. W badaniu Delphi wszyscy eksperci są konsultowani osobno, aby uniknąć niektórych błędów, które mogą wyniknąć, gdyby wszystkie zostały zebrane razem, na przykład dominacja silną wolą jednostki, rozbieżne (ale ważne) poglądy nie są wyrażane ze strachu przed upokorzeniem. Typowe pytanie może brzmieć: w którym roku (jeśli w ogóle) można się spodziewać, że automatyczny szybki tranzyt stał się powszechny w większych miastach w Europie. Odpowiedzi są zestawiane w formie rozkładu lat, z dołączonymi uwagami i recyrkulowane, aby dostarczyć skorygowane dane szacunkowe. Proces ten powtarza się, aż pojawi się konsensus. Zasadniczo taka metoda ma wiele wad, ale z drugiej strony jest lepszy sposób na uzyskanie poglądu na przyszłość, jeśli brakuje nam odpowiednich danych (liczb), które byłyby potrzebne, gdybyśmy zastosowali niektóre z technik ilościowych. przykładem tego było studium Delphi opublikowane w Science Journal w październiku 1967 roku, które próbowało patrzeć w przyszłość (teraz, oczywiście, jesteśmy wiele lat po roku 1967, więc możemy zobaczyć, jak dobrze prognozują). Zadano wiele pytań, kiedy coś może się wydarzyć, a poniżej przedstawiono wybrane pytania. Na każde pytanie podajemy górną kwartylową odpowiedź, czas, w którym 75 ekspertów uznało, że coś by się stało. Zautomatyzowana szybka tranzyt, odpowiedź górnego kwartylu z 1985 r., Tj. 75 ekspertów pytanych w 1967 r. Myślało, że do 1985 r. Nastąpi powszechny zautomatyzowany szybki tranzyt w większości obszarów miejskich, powiedz o tym każdemu, kto mieszka w Londynie Powszechne stosowanie wyrafinowanych maszyn dydaktycznych, górny kwartyle odpowiedź z 1990 r., tj. 75 ekspertów pytanych w 1967 r. myślało, że do 1990 r. będzie powszechne korzystanie z wyrafinowanych maszyn dydaktycznych, powiedzcie to każdemu, kto pracuje w szkolnej nauce w Zjednoczonym Królestwie Powszechne korzystanie z usług robotów, górna odpowiedź kwartylowi z 1995 r., czyli 75 z Eksperci pytani w 1967 roku myśleli, że do roku 1995 powszechne będzie korzystanie z usług robotów. Jest oczywiste, że te prognozy były co najmniej bardzo niedokładne. Rzeczywiście, przeglądając cały zestaw prognoz, wiele z 25 prognoz (dotyczących wszystkich aspektów życia społecznego w przyszłości po 1967 r.) Było szalenie niedokładnych. To prowadzi nas do naszej pierwszej kluczowej kwestii, interesuje nas różnica między pierwotną prognozą a końcowym wynikiem, tj. W błędzie prognozy. Jednak już w 1967 roku, kiedy to badanie Delphi zostało wykonane, jakie inne alternatywne podejście mieliśmy, gdybyśmy chcieli odpowiedzieć na te pytania Pod wieloma względami problemem, który musimy rozwiązać w odniesieniu do prognozowania, nie jest to, czy dana metoda daje dobre (dokładne) prognozy ale czy jest to najlepsza dostępna metoda - jeśli jest to wtedy, jaki mamy wybór, jeśli chodzi o jej stosowanie To prowadzi nas do naszej drugiej kluczowej kwestii, musimy użyć najbardziej odpowiedniej (najlepszej) metody prognozowania, nawet jeśli o tym wiemy (historycznie ) nie podaje dokładnych prognoz. Metody regresji Prawdopodobnie już spotkałeś się z regresją liniową, w której do danych dopasowana jest linia prosta Y a bX. Możliwe jest rozszerzenie metody na obsługę więcej niż jednej niezależnej zmiennej X. Załóżmy, że mamy k zmiennych niezależnych X 1. X 2. X k następnie możemy dopasować linię regresji To rozszerzenie podstawowej techniki regresji liniowej jest znane jako regresja wielokrotna. Proste poznanie linii regresji pozwala nam prognozować Y podanych wartości dla X i i1,2. k. Metody wielokrotnego równania Metody tego typu są często wykorzystywane w modelowaniu ekonomicznym (ekonometria), gdzie istnieje wiele zmiennych zależnych, które oddziałują ze sobą za pośrednictwem szeregu równań, których postać jest określona przez teorię ekonomiczną. To jest ważna kwestia. Teoria ekonomii daje nam pewien wgląd w podstawowe zależności strukturalne między zmiennymi. Dokładna relacja numeryczna między zmiennymi często musi zostać wydedukowana poprzez badanie danych. Jako przykład rozważ następujący prosty model, pozwól: X dochód osobisty Y wydatki osobiste I inwestycja osobista r stopa procentowa Od teorii ekonomicznej załóżmy, że mamy i równanie bilansujące Tutaj mamy 3 równania w 4 zmiennych (X, Y, I, r ) i tak, aby rozwiązać te równania, jednej ze zmiennych należy nadać wartość. Tak wybrana zmienna jest znana jako zmienna egzogeniczna, ponieważ jej wartość jest określana poza układem równań, podczas gdy pozostałe zmienne nazywane są zmiennymi endogenicznymi, ponieważ ich wartości określa się w układzie równań, np. w naszym modelu możemy uważać oprocentowanie r za zmienną egzogeniczną i interesować się tym, w jaki sposób X, Y i I zmieniają się, gdy zmienimy r. Zazwyczaj stałe a 1, a 2, b 1, b 2 nie są dokładnie znane i muszą być oszacowane na podstawie danych (złożona procedura). Należy również zauważyć, że te stałe będą prawdopodobnie różne dla różnych grup ludzi, np. urbanrural, menomm, singlemarried, itp. Przykładem takiego modelu ekonometrycznego jest brytyjski model gospodarki skarbowej, który zawiera wiele zmiennych (każda z podskokiem czasu), skomplikowane równania, i służy do spojrzenia na efekt zainteresowania zmiany stóp, zmiany podatków, zmiany cen ropy itp. Na przykład równanie Skarbu Zjednoczonego Królestwa Nowy naukowiec, 31 października 1993 r. przewidujące wydatki konsumpcyjne wygląda następująco: t Okres (kwartał), o którym mowa, D zmiana zmiennej między tym kwartałem a ostatnim kwartałem C wydatki konsumenckie nietrwałe za dany kwartał U stopa bezrobocia Y realny dochód rozporządzalny skorygowany o spadek inflacji aktywów finansowych Wskaźnik inflacji P dla całkowitych wydatków konsumpcyjnych NFW netto aktywa finansowe sektora osobistego GPW brutto majątek fizyczny w sektorze prywatnym Po kliknięciu tutaj znajdziesz model, który pozwala grać z brytyjską gospodarką. Historycznie metody metod ekonometrycznych mają tendencję do dużych błędów prognostycznych podczas prognozowania gospodarek narodowych w średnim okresie. Przypomnijmy jednak jeden z naszych kluczowych punktów powyżej: musimy użyć najbardziej odpowiedniej (najlepszej) metody prognozowania, nawet jeśli wiemy, że (historycznie) nie podaje ona dokładnych prognoz. Można argumentować, że takie techniki są najodpowiedniejszym sposobem tworzenia prognoz ekonomicznych. Analiza metod szeregów czasowych Sposoby tego typu dotyczą zmiennej, która zmienia się wraz z upływem czasu, a którą można powiedzieć, że zależy tylko od bieżącego czasu i poprzednich wartości, które zajęły (tj. Nie zależy od żadnych innych zmiennych lub czynników zewnętrznych). Jeżeli Y t jest wartością zmiennej w czasie t, wówczas równanie dla Yt oznacza, że ​​wartość zmiennej w chwili t jest czysto pewną funkcją jej poprzednich wartości i czasu, nie ma znaczenia żaden inny współczynnik zmiennych. Celem analizy szeregów czasowych jest odkrycie natury funkcji f, a tym samym umożliwienie nam prognozowania wartości Yt. Metody szeregów czasowych są szczególnie dobre dla krótkoterminowego prognozowania, gdzie w granicach rozsądku wcześniejsze zachowanie danej zmiennej jest dobrym wskaźnikiem jej przyszłych zachowań, przynajmniej w krótkim okresie. Typowym przykładem jest krótkoterminowe prognozowanie popytu. Zwróć uwagę na różnicę między popytem a sprzedażą - popyt jest tym, czego oczekują klienci - sprzedaż jest tym, co sprzedajemy, a te dwa mogą być inne. W ujęciu graficznym wykres Y t na t jest pokazany poniżej. Celem analizy jest dostrzeżenie pewnego związku między obserwowanymi do tej pory wartościami Y t, aby umożliwić nam prognozowanie przyszłych wartości Y t. Będziemy szczegółowo omawiać dwie techniki analizy szeregów czasowych i krótko wspomnieć o bardziej wyrafinowanej metodzie. Średnia ruchoma Jedną z bardzo prostych metod prognozowania szeregów czasowych jest przyjęcie średniej ruchomej (znanej również jako ważona średnia ruchoma). Średnia krocząca (m t) w ostatnich L okresach kończących się w okresie t jest obliczana przez wzięcie średniej z wartości dla okresów t-L1, t-L2, t-L3. t-1, t tak, aby prognozować za pomocą średniej ruchomej, mówimy, że prognoza dla wszystkich okresów poza t jest po prostu mt (chociaż zwykle prognozujemy tylko na jeden okres do przodu, aktualizując średnią ruchomą, gdy faktyczna obserwacja dla tego okresu staje się dostępna ). Rozważmy następujący przykład: popyt na produkt przez 6 miesięcy pokazano poniżej - obliczyć trzymiesięczną średnią ruchomą dla każdego miesiąca i prognozować zapotrzebowanie na miesiąc 7. Teraz nie możemy obliczyć trzymiesięcznej średniej ruchomej, dopóki nie uzyskamy co najmniej 3 obserwacji - tzn. można obliczyć taką średnią tylko od 3 miesiąca. Średnia krocząca dla miesiąca 3 jest wyrażona przez: m 3 (42 41 43) 3 42, a średnią kroczącą dla pozostałych miesięcy podaje: Używamy m 6 jako prognozy dla 7. miesiąca. Stąd prognoza popytu na miesiąc 7 to 3670 sztuk. Dane wejściowe pakietu dla tego problemu przedstawiono poniżej. Dane wyjściowe z pakietu dla trzymiesięcznej średniej ruchomej przedstawiono poniżej. Wybór pomiędzy prognozami Jeden problem z tą prognozą jest prosty - jak dobry jest na przykład Na przykład możemy wygenerować prognozę popytu na miesiąc 7 przy użyciu średniej ruchomej z dwóch miesięcy. Dałoby to następujące: Czy ta prognoza (m 6 3600 jednostek) byłaby lepsza niż nasza obecna prognoza popytu na 3670 jednostek Zamiast próbować odgadnąć, która prognoza jest lepsza, możemy logicznie podejść do problemu. W rzeczywistości, jak stanie się widoczne poniżej, mamy już wystarczające informacje, aby dokonać logicznego wyboru między prognozami, jeśli odpowiednio spojrzymy na te informacje. Próbując zdecydować, jak dobra jest prognoza, mamy następującą logikę. Weź pod uwagę trzymiesięczną średnią kroczącą podaną powyżej i udawaj przez chwilę, że zażądaliśmy tylko danych za pierwsze trzy miesiące, wtedy obliczymy średnią ruchomą za 3 miesiąc (m 3) na 42 (patrz wyżej). To byłaby nasza prognoza na 4. miesiąc. Ale w 4 miesiącu wynik jest w rzeczywistości 38, więc mamy różnicę (błąd) zdefiniowaną przez: Uwaga, że ​​możemy równie dobrze zdefiniować błąd jako prognozę wyników. To po prostu zmieniłoby znak błędów, a nie ich wartości bezwzględne. Zwróć uwagę, że jeśli sprawdzasz wydajność pakietu, zobaczysz, że właśnie to robi. W 4 miesiącu mamy prognozę na miesiąc 5 m 4 40,7, ale wynik miesiąca 5 z 35 prowadzący do błędu 40,7-35 5,7. W miesiącu 5 mamy prognozę na 6 miesiąc m 5 38,7, ale wynik dla miesiąca 6 z 37 prowadzący do błędu 38,7-37 1,7. Stąd możemy skonstruować poniższą tabelę: Zbudowanie tej samej tabeli dla dwumiesięcznej średniej ruchomej mamy: Porównując te dwie tabele, widzimy, że warunki błędu dają nam miarę tego, jak dobre są metody prognozowania (dwu - lub trzymiesięczna średnia ruchoma) Gdybyśmy użyli ich, aby przewidzieć jeden okres (miesiąc) przed danymi historycznymi, które mamy. W idealnym świecie chcielibyśmy metody prognozowania, dla której wszystkie błędy są zerowe, dałoby to nam pewność (prawdopodobnie dużo pewności), że nasza prognoza na miesiąc 7 będzie prawdopodobnie poprawna. Najwyraźniej, w realnym świecie, nie jesteśmy w stanie uzyskać sytuacji, w której wszystkie błędy wynoszą zero. Naprawdę trudno jest spojrzeć (jak w tym przypadku) na dwie serie terminów związanych z błędami i je porównać. Jest to znacznie łatwiejsze, jeśli przyjmiemy jakąś funkcję terminów błędów, tj. Zredukujemy każdą serię do pojedynczej (łatwej do uchwycenia) liczby. Jedną z odpowiednich funkcji decydujących o dokładności metody prognostycznej jest: Logika polega na tym, że przez błędy kwadratury usuwamy znak (lub -) i rozróżniamy duże błędy (rezygnujemy z małych błędów, ale nie reagujemy na duże błędy). Idealnie średni błąd kwadratowy powinien wynosić zero (to jest idealna prognoza). W każdym razie preferujemy metodę prognozowania, która daje najniższy błąd średniej kwadratowej. Mamy to w przypadku trzymiesięcznej średniej kroczącej: średni błąd w kwadraturze 4sup2 5,7sup2 1,7sup23 17,13 i dla średniej z dwóch miesięcy: błąd średniokwadratowy (-1,5) sup2 4sup2 5,5sup2 (-0,5) sup24 12,19 Niższa z tych dwóch wartości jest związana z dwumiesięczną średnią ruchomą, więc wolimy tę metodę prognozowania (i dlatego preferujemy prognozę 3600 dla miesiąca 7 wyprodukowaną przez dwumiesięczną średnią ruchomą). Błąd średniokwadratowy jest technicznie znany jako średnie odchylenie kwadratowe (MSD) lub średni-kwadratowy błąd (MSE). Zauważmy, że faktycznie zrobiliśmy więcej niż rozróżnienie między dwiema różnymi prognozami (tj. Pomiędzy średnią z dwóch miesięcy a trzema miesiącami). Mamy teraz kryteria rozróżniania prognoz, jednak są one generowane - mianowicie preferujemy prognozę wygenerowaną przez technikę z najniższym MSD (historycznie najdokładniejszą techniką prognozowania danych, gdy stosowaliśmy ją konsekwentnie w czasie). Jest to ważne, ponieważ wiemy, że nawet nasz prosty pakiet zawiera wiele różnych metod prognozowania szeregów czasowych - jak poniżej. Pytanie - czy uważasz, że jedna z powyższych metod prognostycznych ZAWSZE daje lepsze wyniki niż inne, czy nie Pojedyncze wygładzanie wykładnicze Jedną z wad użycia średnich ruchomych do prognozowania jest to, że przy obliczaniu średniej wszystkie obserwacje mają taką samą wagę (1L), mając na uwadze, że spodziewamy się, że nowsze obserwacje będą lepszym wskaźnikiem przyszłości (i odpowiednio należy nadać im większą wagę). Również w średnich ruchomych używamy tylko ostatnich obserwacji, być może powinniśmy wziąć pod uwagę wszystkie poprzednie obserwacje. Jedna z technik określana jako wygładzanie wykładnicze (lub, dokładniej, wyrównywanie wykładnicze) nadaje większą wagę nowszym obserwacjom i bierze pod uwagę wszystkie poprzednie obserwacje. Zdefiniuj stałą mikro, gdzie 0 lt mikro lt 1 następnie (pojedyncza) wykładniczo wygładzona średnia krocząca dla okresu t (Mt powiedzmy) jest podana przez Tak więc widać tutaj, że wykładniczo wygładzona średnia ruchoma uwzględnia wszystkie poprzednie obserwacje, porównać średnią ruchomą, powyżej której uwzględniono tylko kilka z poprzednich obserwacji. Powyższe równanie jest trudne do użycia numerycznego, ale należy pamiętać, że: stąd wykładnicza wygładzona średnia ruchoma dla okresu t jest liniową kombinacją wartości prądu (Y t) i poprzedniej wykładniczo wygładzonej średniej ruchomej (M t-1). Stała mikro nazywana jest stałą wygładzania, a wartość mikro odzwierciedla wagę podaną aktualnej obserwacji (Yt) przy obliczaniu wykładniczo wygładzonej średniej ruchomej M t dla okresu t (która jest prognozą dla okresu t1). Na przykład jeśli mikro 0,2 oznacza to, że 20 ciężaru w generowaniu prognoz jest przypisane do najnowszej obserwacji, a pozostałe 80 do poprzednich obserwacji. Zauważ tutaj, że M t microY t (1- micro) M t-1 można również zapisać M t M t-1 - micro (M t-1 - Y t) lub aktualną prognozę poprzednia prognoza - mikro (błąd w poprzedniej prognozie) więc wygładzanie wykładnicze może być postrzegane jako prognoza stale aktualizowana przez właśnie popełniony błąd prognozy. Rozważmy następujący przykład: dla danych popytowych podanych w poprzednim rozdziale obliczono wykładniczo wygładzoną średnią ruchomą dla wartości stałej wygładzania mikro 0,2 i 0,9. Mamy dla mikro 0,2. Zauważ tutaj, że zwykle wystarczy pracować z dwoma lub trzema miejscami po przecinku podczas wygładzania wykładniczego. Używamy M 6 jako prognozy dla miesiąca 7, tj. Prognoza dla miesiąca 7 to 3938 jednostek. Mamy dla mikro 0.9. Tak jak poprzednio M 6 jest prognozą na 7 miesiąc, czyli 3684 jednostki. Dane wyjściowe pakietu dla mikro0.2 przedstawiono poniżej. Dane wyjściowe pakietu dla mikro0,9 przedstawiono poniżej. Aby wybrać najlepszą wartość mikro (z dwóch wartości 0,2 i 0,9) wybieramy wartość związaną z najniższym MSD (jak wyżej dla średnich ruchomych). Dla mikro0.2 mamy ten MSD (42-41) sup2 (41,80-43) sup2 (42.04-38) sup2 (41,23-35) sup2 (39,98-37) sup25 13,29 Dla mikro0,9 mamy ten MSD (42- 41) sup2 (41,10-43) sup2 (42,81-38) sup2 (38,48-35) sup2 (35,35-37) sup25 8,52 Należy zauważyć, że te wartości MSD zgadzają się (w granicach błędów zaokrąglania) z wartościami MSD podanymi w danych wyjściowych pakietu powyżej. Zatem w tym przypadku mikro0.9 wydaje się dawać lepsze prognozy niż mikro0,2, ponieważ ma mniejszą wartość MSD. Powyżej użyliśmy MSD, aby zredukować serię terminów błędów do łatwego do uchwycenia pojedynczego numeru. W rzeczywistości funkcje inne niż MSD, takie jak: średnie (średnie bezwzględne odchylenie) średni błąd błędu (błąd średni), znany również jako błąd zbiorczej prognozy, który można również wykorzystać do zredukowania serii terminów błędów do pojedynczej liczby, tak aby ocenić, jak dobra jest prognoza. Na przykład, jak widać na powyższych wyjściach pakietów, pakiet podaje wiele takich funkcji, zdefiniowanych jako: W rzeczywistości dostępne są metody umożliwiające optymalną wartość stałej wygładzania (tj. Wartość mikro, która minimalizuje wybrane kryteria dokładności prognoz, takich jak średnie odchylenie kwadratu (MSD)), które można łatwo określić. Można to zobaczyć poniżej, gdzie pakiet wyliczył, że wartość mikro, która minimalizuje MSD wynosi mikro 0,86 (w przybliżeniu). Zauważ, że pakiet można wykorzystać do wykreślenia zarówno danych, jak i prognoz generowanych przez wybraną metodę. Poniżej pokazujemy to dla powyższego wyjścia (związanego z wartością mikro, która minimalizuje MSD o wartości 0.86). Uwaga: tutaj wybór kryterium może mieć duży wpływ na wartość mikro np. Dla naszego przykładu wartość mikro, która minimalizuje MAD micro0.59 (w przybliżeniu) i wartość mikro minimalizująca odchylenie to micro1,0 (w przybliżeniu).Aby zilustrować zmianę MAD, odchylenie i MSD jako mikro zmiany, wykres poniżej MAD i odchylenie w stosunku do stałej wygładzania mikro i poniżej MSD w stosunku do mikro, poniżej przedstawiamy wartość prognozy dla mikro. Należy zwrócić uwagę na to, że dla tego przykładu dla stosunkowo szerokiego zakresu wartości dla mikro prognoza jest stabilna (np. dla 0,60 lt mikro 1,00 prognoza kłamie między 36,75 a 37,00) Można to zobaczyć poniżej - krzywa jest cytowana dla dużych wartości mikroprzedsiębiorstw. Należy zauważyć, że powyższe wykresy sugerują, że w znalezieniu dobrej wartości stałej wygładzania zwykle nie jest konieczne obliczanie w bardzo dużym stopniu dokładności (np. na przykład nie w granicach 0,001). Bardziej zaawansowane prognozowanie szeregów czasowych Istnieje szereg metod prognozowania szeregów czasowych bardziej zaawansowanych niż te, które są rozważane w naszym prostym pakiecie. Są one oparte na modelach AIM (Avertive M). Zasadniczo zakłada się, że szereg czasowy został wygenerowany przez proces prawdopodobieństwa z przyszłymi wartościami związanymi z przeszłymi wartościami, a także z wcześniejszymi błędami prognozy. Aby zastosować modele ARIMA, szereg czasowy musi być stacjonarny. Stacjonarne szeregi czasowe to te, których właściwości statystyczne, takie jak średnia, wariancja i autokorelacja, są stałe w czasie. Jeżeli początkowe szeregi czasowe nie są stacjonarne, może to oznaczać, że niektóre funkcje szeregów czasowych, np. biorąc różnice między kolejnymi wartościami, jest nieruchomy. Przy dopasowywaniu modelu ARIMA do danych szeregów czasowych zazwyczaj stosowana jest struktura ramowa typu Box-Jenkins. Ma to jednak tę wadę, że podczas gdy szereg technik szeregów czasowych jest w pełni zautomatyzowanych, w tym sensie, że prezenter nie musi wykonywać żadnego osądu poza wyborem techniki do użycia, technika Box-Jenkinsa wymaga od planisty oceny i w związku z tym jego użycie wymaga doświadczenia i wyroków sądowych po stronie prezentera. Istnieją pewne pakiety prognostyczne, które sprawiają, że te zapytania ofertowe są dla Ciebie dostępne. Więcej informacji o ARIMA i Box-Jenkins można znaleźć tutaj. tu i tu. Podaliśmy jedynie przegląd dostępnych metod prognozowania. Kluczem do prognozowania w dzisiejszych czasach jest zrozumienie różnych metod prognozowania i ich względnych zalet, a więc możliwość wyboru metody, która ma zastosowanie w konkretnej sytuacji (na przykład rozważenie, ile metod prognozowania szeregów czasowych jest dostępnych w pakiecie). Wszystkie metody prognozowania wiążą się z żmudnymi powtarzalnymi obliczeniami, a więc idealnie nadają się do wykonania przez komputer. Pakiety prognozujące, wiele interaktywnych (do użytku na szt.) Są dostępne dla prezentera. Niektóre przykłady prognozowania można znaleźć tutaj. Wprowadzenie do ARIMA: modele niesezonowe Równanie prognostyczne ARIMA (p, d, q): Modele ARIMA są w teorii najbardziej ogólną klasą modeli do prognozowania szeregów czasowych, które można przekształcić w 8220stationary8221 poprzez różnicowanie (jeśli to konieczne), być może w połączeniu z transformacjami nieliniowymi, takimi jak rejestracja lub deflacja (w razie potrzeby). Zmienna losowa, która jest szeregiem czasowym, jest nieruchoma, jeśli jej właściwości statystyczne są stałe w czasie. Seria stacjonarna nie ma trendu, jej wahania wokół średniej mają stałą amplitudę i poruszają się w spójny sposób. tj. jego krótkoterminowe wzorce czasu losowego zawsze wyglądają tak samo w sensie statystycznym. Ten ostatni warunek oznacza, że ​​jego autokorelacje (korelacje z jego własnymi wcześniejszymi odchyleniami od średniej) pozostają stałe w czasie, lub równoważnie, że jego widmo mocy pozostaje stałe w czasie. Zmienna losowa tej formy może być postrzegana (jak zwykle) jako kombinacja sygnału i szumu, a sygnał (jeśli jest widoczny) może być wzorem szybkiej lub wolnej średniej rewersji, lub sinusoidalnej oscylacji, lub szybkiej przemiany w znaku , a także może mieć składnik sezonowy. Model ARIMA może być postrzegany jako 8220filter8221, który próbuje oddzielić sygnał od szumu, a sygnał jest następnie ekstrapolowany w przyszłość w celu uzyskania prognoz. Równanie prognostyczne ARIMA dla stacjonarnych szeregów czasowych jest równaniem liniowym (to jest typu regresyjnym), w którym predyktory składają się z opóźnień zmiennej zależnej i opóźnień błędów prognoz. Oznacza to: Przewidywaną wartość Y stałej stałej lub ważoną sumę jednej lub więcej ostatnich wartości Y i lub ważoną sumę jednej lub więcej ostatnich wartości błędów. Jeśli predykatory składają się tylko z opóźnionych wartości Y., jest to model czysto autoregresyjny (8220a-regressed8221), który jest tylko szczególnym przypadkiem modelu regresji i który może być wyposażony w standardowe oprogramowanie regresyjne. Na przykład, autoregresyjny model pierwszego rzędu (8220AR (1) 8221) dla Y jest prostym modelem regresji, w którym zmienna niezależna jest po prostu Y opóźniona o jeden okres (LAG (Y, 1) w Statgraphics lub YLAG1 w RegressIt). Jeśli niektóre z predyktorów są opóźnieniami błędów, to model ARIMA NIE jest modelem regresji liniowej, ponieważ nie ma sposobu, aby określić 8220last okres8217s błąd8221 jako zmienną niezależną: błędy muszą być obliczane na podstawie okresu do okresu kiedy model jest dopasowany do danych. Z technicznego punktu widzenia problem z używaniem opóźnionych błędów jako predyktorów jest taki, że przewidywania model8217 nie są liniowymi funkcjami współczynników. mimo że są liniowymi funkcjami przeszłych danych. Współczynniki w modelach ARIMA, które zawierają opóźnione błędy, muszą być oszacowane przez nieliniowe metody optymalizacji (8220hill-climbing8221), a nie przez samo rozwiązanie układu równań. Akronim ARIMA oznacza Auto-Regressive Integrated Moving Average. Lagi z stacjonarnej serii w równaniu prognostycznym nazywane są "wartościami dodatnimi", opóźnienia błędów prognoz są nazywane "przesunięciem średniej", a szeregi czasowe, które muszą być różnicowane, aby stały się stacjonarne, są uważane za "podzielone" wersje stacjonarnej serii. Modele random-walk i random-tendencja, modele autoregresyjne i modele wygładzania wykładniczego są szczególnymi przypadkami modeli ARIMA. Niesezonowy model ARIMA jest klasyfikowany jako model DAIMIMA (p, d, q), gdzie: p to liczba terminów autoregresyjnych, d to liczba niesezonowych różnic potrzebnych do stacjonarności, a q to liczba opóźnionych błędów prognozy w równanie predykcji. Równanie prognostyczne jest skonstruowane w następujący sposób. Po pierwsze, niech y oznacza różnicę d Y. Oznacza to: Zwróć uwagę, że druga różnica Y (przypadek d2) nie jest różnicą od 2 okresów temu. Jest to raczej różnica między pierwszą a różnicą. który jest dyskretnym analogiem drugiej pochodnej, tj. lokalnym przyspieszeniem szeregu, a nie jego lokalnym trendem. Pod względem y. ogólne równanie prognostyczne jest następujące: Tutaj parametry średniej ruchomej (9528217 s) są zdefiniowane w taki sposób, że ich znaki są ujemne w równaniu, zgodnie z konwencją wprowadzoną przez Box i Jenkinsa. Niektórzy autorzy i oprogramowanie (w tym język programowania R) definiują je, aby zamiast tego mieli znaki plus. When actual numbers are plugged into the equation, there is no ambiguity, but it8217s important to know which convention your software uses when you are reading the output. Often the parameters are denoted there by AR(1), AR(2), 8230, and MA(1), MA(2), 8230 etc. To identify the appropriate ARIMA model for Y. you begin by determining the order of differencing (d) needing to stationarize the series and remove the gross features of seasonality, perhaps in conjunction with a variance-stabilizing transformation such as logging or deflating. If you stop at this point and predict that the differenced series is constant, you have merely fitted a random walk or random trend model. However, the stationarized series may still have autocorrelated errors, suggesting that some number of AR terms (p 8805 1) andor some number MA terms (q 8805 1) are also needed in the forecasting equation. The process of determining the values of p, d, and q that are best for a given time series will be discussed in later sections of the notes (whose links are at the top of this page), but a preview of some of the types of nonseasonal ARIMA models that are commonly encountered is given below. ARIMA(1,0,0) first-order autoregressive model: if the series is stationary and autocorrelated, perhaps it can be predicted as a multiple of its own previous value, plus a constant. The forecasting equation in this case is 8230which is Y regressed on itself lagged by one period. This is an 8220ARIMA(1,0,0)constant8221 model. If the mean of Y is zero, then the constant term would not be included. If the slope coefficient 981 1 is positive and less than 1 in magnitude (it must be less than 1 in magnitude if Y is stationary), the model describes mean-reverting behavior in which next period8217s value should be predicted to be 981 1 times as far away from the mean as this period8217s value. If 981 1 is negative, it predicts mean-reverting behavior with alternation of signs, i. e. it also predicts that Y will be below the mean next period if it is above the mean this period. In a second-order autoregressive model (ARIMA(2,0,0)), there would be a Y t-2 term on the right as well, and so on. Depending on the signs and magnitudes of the coefficients, an ARIMA(2,0,0) model could describe a system whose mean reversion takes place in a sinusoidally oscillating fashion, like the motion of a mass on a spring that is subjected to random shocks. ARIMA(0,1,0) random walk: If the series Y is not stationary, the simplest possible model for it is a random walk model, which can be considered as a limiting case of an AR(1) model in which the autoregressive coefficient is equal to 1, i. e. a series with infinitely slow mean reversion. The prediction equation for this model can be written as: where the constant term is the average period-to-period change (i. e. the long-term drift) in Y. This model could be fitted as a no-intercept regression model in which the first difference of Y is the dependent variable. Since it includes (only) a nonseasonal difference and a constant term, it is classified as an quotARIMA(0,1,0) model with constant. quot The random-walk - without - drift model would be an ARIMA(0,1,0) model without constant ARIMA(1,1,0) differenced first-order autoregressive model: If the errors of a random walk model are autocorrelated, perhaps the problem can be fixed by adding one lag of the dependent variable to the prediction equation--i. e. by regressing the first difference of Y on itself lagged by one period. This would yield the following prediction equation: which can be rearranged to This is a first-order autoregressive model with one order of nonseasonal differencing and a constant term--i. e. an ARIMA(1,1,0) model. ARIMA(0,1,1) without constant simple exponential smoothing: Another strategy for correcting autocorrelated errors in a random walk model is suggested by the simple exponential smoothing model. Recall that for some nonstationary time series (e. g. ones that exhibit noisy fluctuations around a slowly-varying mean), the random walk model does not perform as well as a moving average of past values. In other words, rather than taking the most recent observation as the forecast of the next observation, it is better to use an average of the last few observations in order to filter out the noise and more accurately estimate the local mean. The simple exponential smoothing model uses an exponentially weighted moving average of past values to achieve this effect. The prediction equation for the simple exponential smoothing model can be written in a number of mathematically equivalent forms. one of which is the so-called 8220error correction8221 form, in which the previous forecast is adjusted in the direction of the error it made: Because e t-1 Y t-1 - 374 t-1 by definition, this can be rewritten as: which is an ARIMA(0,1,1)-without-constant forecasting equation with 952 1 1 - 945. This means that you can fit a simple exponential smoothing by specifying it as an ARIMA(0,1,1) model without constant, and the estimated MA(1) coefficient corresponds to 1-minus-alpha in the SES formula. Recall that in the SES model, the average age of the data in the 1-period-ahead forecasts is 1 945. meaning that they will tend to lag behind trends or turning points by about 1 945 periods. It follows that the average age of the data in the 1-period-ahead forecasts of an ARIMA(0,1,1)-without-constant model is 1(1 - 952 1 ). So, for example, if 952 1 0.8, the average age is 5. As 952 1 approaches 1, the ARIMA(0,1,1)-without-constant model becomes a very-long-term moving average, and as 952 1 approaches 0 it becomes a random-walk-without-drift model. What8217s the best way to correct for autocorrelation: adding AR terms or adding MA terms In the previous two models discussed above, the problem of autocorrelated errors in a random walk model was fixed in two different ways: by adding a lagged value of the differenced series to the equation or adding a lagged value of the forecast error. Which approach is best A rule-of-thumb for this situation, which will be discussed in more detail later on, is that positive autocorrelation is usually best treated by adding an AR term to the model and negative autocorrelation is usually best treated by adding an MA term. In business and economic time series, negative autocorrelation often arises as an artifact of differencing . (In general, differencing reduces positive autocorrelation and may even cause a switch from positive to negative autocorrelation.) So, the ARIMA(0,1,1) model, in which differencing is accompanied by an MA term, is more often used than an ARIMA(1,1,0) model. ARIMA(0,1,1) with constant simple exponential smoothing with growth: By implementing the SES model as an ARIMA model, you actually gain some flexibility. First of all, the estimated MA(1) coefficient is allowed to be negative . this corresponds to a smoothing factor larger than 1 in an SES model, which is usually not allowed by the SES model-fitting procedure. Second, you have the option of including a constant term in the ARIMA model if you wish, in order to estimate an average non-zero trend. The ARIMA(0,1,1) model with constant has the prediction equation: The one-period-ahead forecasts from this model are qualitatively similar to those of the SES model, except that the trajectory of the long-term forecasts is typically a sloping line (whose slope is equal to mu) rather than a horizontal line. ARIMA(0,2,1) or (0,2,2) without constant linear exponential smoothing: Linear exponential smoothing models are ARIMA models which use two nonseasonal differences in conjunction with MA terms. The second difference of a series Y is not simply the difference between Y and itself lagged by two periods, but rather it is the first difference of the first difference --i. e. the change-in-the-change of Y at period t. Thus, the second difference of Y at period t is equal to (Y t - Y t-1 ) - (Y t-1 - Y t-2 ) Y t - 2Y t-1 Y t-2 . A second difference of a discrete function is analogous to a second derivative of a continuous function: it measures the quotaccelerationquot or quotcurvaturequot in the function at a given point in time. The ARIMA(0,2,2) model without constant predicts that the second difference of the series equals a linear function of the last two forecast errors: which can be rearranged as: where 952 1 and 952 2 are the MA(1) and MA(2) coefficients. This is a general linear exponential smoothing model . essentially the same as Holt8217s model, and Brown8217s model is a special case. It uses exponentially weighted moving averages to estimate both a local level and a local trend in the series. The long-term forecasts from this model converge to a straight line whose slope depends on the average trend observed toward the end of the series. ARIMA(1,1,2) without constant damped-trend linear exponential smoothing . This model is illustrated in the accompanying slides on ARIMA models. It extrapolates the local trend at the end of the series but flattens it out at longer forecast horizons to introduce a note of conservatism, a practice that has empirical support. See the article on quotWhy the Damped Trend worksquot by Gardner and McKenzie and the quotGolden Rulequot article by Armstrong et al. for details. It is generally advisable to stick to models in which at least one of p and q is no larger than 1, i. e. do not try to fit a model such as ARIMA(2,1,2), as this is likely to lead to overfitting and quotcommon-factorquot issues that are discussed in more detail in the notes on the mathematical structure of ARIMA models. Spreadsheet implementation: ARIMA models such as those described above are easy to implement on a spreadsheet. The prediction equation is simply a linear equation that refers to past values of original time series and past values of the errors. Thus, you can set up an ARIMA forecasting spreadsheet by storing the data in column A, the forecasting formula in column B, and the errors (data minus forecasts) in column C. The forecasting formula in a typical cell in column B would simply be a linear expression referring to values in preceding rows of columns A and C, multiplied by the appropriate AR or MA coefficients stored in cells elsewhere on the spreadsheet. Forecasting with time series analysis What is forecasting Forecasting is a method that is used extensively in time series analysis to predict a response variable, such as monthly profits, stock performance, or unemployment figures, for a specified period of time. Prognozy są oparte na wzorcach w istniejących danych. Na przykład kierownik magazynu może modelować ilość produktu do zamówienia na kolejne 3 miesiące w oparciu o poprzednie 12 miesięcy zamówień. Możesz użyć różnych metod szeregów czasowych, takich jak analiza trendów, dekompozycja lub pojedyncze wygładzanie wykładnicze, do modelowania wzorców w danych i ekstrapolowania tych wzorców do przyszłości. Wybierz metodę analizy, określając, czy wzory są statyczne (stałe w czasie), czy dynamiczne (zmiana w czasie), charakter trendu i komponenty sezonowe oraz to, jak daleko chcesz przewidzieć. Zanim zaczniesz tworzyć prognozy, dopasuj do danych kilka modeli kandydatów, aby określić, który model jest najbardziej stabilny i dokładny. Prognozy dla analizy średniej ruchomej Dopasowana wartość w czasie t jest niecentrującą średnią ruchomą w czasie t -1. Prognozy są dopasowanymi wartościami przy przewidywanym pochodzeniu. Jeśli prognozujesz 10 jednostek czasu z wyprzedzeniem, prognozowana wartość dla każdego czasu będzie dopasowaną wartością w punkcie początkowym. Dane do początku są używane do obliczania średnich ruchomych. Możesz zastosować metodę średnich wartości ruchu liniowego, obliczając kolejne średnie ruchome. Metoda średnich liniowych ruchomych jest często stosowana, gdy istnieje trend w danych. Najpierw obliczyć i zapisać średnią ruchomą z oryginalnej serii. Następnie obliczyć i zapisać średnią ruchomą poprzednio zapisanej kolumny, aby uzyskać drugą średnią ruchomą. W prognozowaniu naiwnym prognoza czasu t jest wartością danych w czasie t -1. Stosując średnią ruchomą z ruchomą średnią długości daje się naiwną prognozę. Prognozy dla pojedynczej wykładniczej analizy wygładzania Dopasowana wartość w czasie t jest wygładzoną wartością w czasie t-1. Prognozy są dopasowaną wartością przy przewidywanym pochodzeniu. Jeśli prognozujesz 10 jednostek czasu z wyprzedzeniem, prognozowana wartość dla każdego czasu będzie dopasowaną wartością w punkcie początkowym. Dane do początku są używane do wygładzania. W prognozowaniu naiwnym prognoza czasu t jest wartością danych w czasie t-1. Wykonywanie pojedynczego wygładzania wykładniczego z wagą jednego do naiwnego prognozowania. Prognozy dla podwójnej wykładniczej analizy wygładzania Podwójne wykładnicze wygładzanie wykorzystuje komponenty poziomu i trendu do generowania prognoz. Prognoza dla m okresów przed punktem w czasie t wynosi L t mT t. gdzie L t jest poziomem, a T t jest trendem w czasie t. Do wygładzania zostaną wykorzystane dane do prognozy czasu początkowego. Prognozy dla metody Winters Metoda Winters wykorzystuje komponenty poziomu, trendu i sezonowości do generowania prognoz. Prognoza dla m okresów wyprzedzających od punktu w czasie t wynosi: gdzie L t jest poziomem, a T t jest trendem w czasie t, pomnożonym przez (lub dodanym do modelu addytywnego) składową sezonową dla tego samego okresu od Poprzedni rok. Metoda Winters wykorzystuje dane do prognozowanego czasu rozpoczęcia, aby wygenerować prognozy.

No comments:

Post a Comment