Jedną
z funkcjonalności związaną z analizowaniem szeregów czasowych w Tableau jest prognozowanie ich zachowania w przyszłości, czyli tzw. Forecast. Jeśli interesuje Cię badanie zmiennej
liczbowej w czasie (np. sprzedaży) na wykresie liniowym i chciałbyś zobaczyć
jak w oparciu o historyczne dane proces ten może wyglądać w przyszłości, zachęcam
do zgłębienia wiedzy na temat Forecastingu w Tableau!
W
niniejszym artykule zostanie omówiony krok po kroku proces tworzenia
Forecastingu w Tableau oraz metody predykcyjne zaimplementowane w T ableau (tzw.
„exponential smoothing”).
JAK STWORZYĆ FORECASTING W TABLEAU?
1) Pracę należy rozpocząć od zbudowania wykresu
liniowego, ukazującego zależność wybranej miary od czasu.
Nie ma
znaczenia czy do budowy wizualizacji użyjemy daty typu dyskretnego czy
ciągłego. Ja na przykład przedstawiłam na wykresie liniowym zmienne Sales i
Profit ze zbioru Superstore Subset (dostępnym w katalogu My Tableau Repository
po zainstalowaniu Tableau) w zależności od daty typu ciągłego, wyrażonej z
dokładnością do miesięcy. Ponadto przeciągnęłam zmienną Measure Names na ikonkę
Color, by oznaczyć innymi kolorami linie odpowiadające poszczególnym zmiennym.
2) Następnie z zakładki Analysis wybieramy
opcję Forecast -> Show Forecast lub poprzez kliknięcie prawym
przyciskiem myszy na nasz widok i wybór opcji Forecast -> Show
Forecast.
Przy miarach na
zakładce Rows pojawią nam się strzałki, które oznaczają, że Forecast został
dopasowany. Teraz w menu rozwiniętym przy mierze mamy dostępną opcję Show
Forecast, w której możemy wybrać formę wyświetlania naszej prognozy na
wizualizacji. Domyślnie jest to opcja Actual & Forecast, czyli
zestawienie danych historycznych oraz prognozy obok siebie na jednym widoku.
Automatycznie na ikonkę Color zostanie naniesiona nowo utworzona zmienna
Forecast Indicator, której znaczenie jest objaśnione na legendzie w lewym
dolnym rogu widoku: Actual (wartości historyczne), Estimate (wartości
wyestymowane).
3) Kolejny krok to dopasowanie opcji związanych z
Forecastingiem do naszym potrzeb.
Do kreatora związanego z
tworzeniem Forecastingu możemy dostać się poprzez wybór z zakładki Analysis
opcję Forecast -> Forecast Options lub poprzez kliknięcie
prawym przyciskiem myszy na nasz widok i wybór opcji Forecast -> Forecast
Options.
W sekcji Forecast Length
możemy określić dla jakiego okresu chcemy wykonać
Forecasting. W przypadku ciągłych miesięcy, jak na zamieszczonym przykładzie
domyślnie 13 miesięcy.
W kolejnej sekcji, czyli Source Data definiujemy poziom
agregacji Forecastingu. Na zamieszczonym przykładzie agregacja jest
automatycznie wykonana dla miesięcy, ponieważ data na widoku została
przedstawiona z dokładnością do miesięcy. Przy wykonaniu Forecastingu możemy również
zignorować część obserwacji (Ignore last), u mnie domyślnie ignorowany
jest ostatni miesiąc. Możemy również odhaczyć opcję Fill in missing values
in zeros, czyli zastępowanie braków danych zerami.
Sekcja Forecast Model dotyczy specyfikacji modelu
wykorzystanego do zbudowania prognozy. Domyślnie jest to opcja Automatic,
która uwzględnia trend i sezonowość w zachowaniu danych. Inna dostępna opcja to
Automatic without seasonality (z pominięciem sezonowości), która w
naszym przypadku czyni prognozę bezużyteczną (zobacz poniżej).
Ostatnia możliwość to Custom, gdzie samodzielnie kombinujemy
komponenty związane z trendem i sezonowością. Do wyboru mamy po trzy możliwości
dla każdego z nich:
- None (brak),
- Additive (addytywny),
- Multiplicative (multiplikatywny).
Należy wspomnieć, że nie wszystkie kombinacje mają sens w
przypadku badania konkretnych danych, np. na zaprezentowanym przeze mnie
przykładzie nie jest dostępny Forecast z multiplikatywnym trendem i addytywną
sezonowością.
Ostatnia opcja Show
prediction intervals dotyczy wyświetlania przedziałów ufności na naszym
widoku (zacieniowane obszary). Domyślnie są to przedziały oszacowane na
poziomie ufności 95%, najczęściej wykorzystywanym w statystyce.
4) Ostatnim krokiem jest sprawdzenie jakości
dopasowania modelu.
Szczegółowy
wydruk można uzyskać wybierając z zakładki Analysis opcję Forecast
-> Describe Forecast lub poprzez kliknięcie prawym przyciskiem myszy
na nasz widok i wybór opcji Forecast -> Describe Forecast.
Ze szczegółowym opisem poszczególnych wartości w wydruku
oraz sposobem ich interpretacji można zapoznać się w dokumentacji Tableau
Desktop, zamieszczonej na oficjalnej stronie Tableau:
http://onlinehelp.tableausoftware.com/v8.2/pro/online/windows/en-us/help.html#forecast_describe.html
MODELE FORECASTINGU
DOSTĘPNE W TABLEAU
Tableau automatycznie wybiera prognozę
najlepszej jakości spośród ośmiu modeli opartych o wykładnicze metody
wygładzania („exponential smoothing methods”):
- simple
exponential smoothing,
- Holts linear
method,
- Exponential
trend method,
- additive
damped trend method,
- multiplicative
damped trend method,
- additive
Holt-Winters method,
- multiplicative
Holt-Winters method,
- Holt-Winters
damped method.
Parametry
związane z wygładzaniem dla poszczególnych modeli są optymalizowane przez
Tableau. Poniżej zamieszczam tabelkę z legendą, w której można sprawdzić jakie
komponenty związane z trendem i sezonowością odpowiadają poszczególnym modelom
(zobacz więcej na https://www.otexts.org/fpp/7/6
).
Podsumowując, przechodząc do opcji
związanych z Forecastingiem w Tableau (o czym wspominałam wcześniej w punkcie
3.) możemy wybrać:
- dopasowanie automatyczne (Automatic),
- dopasowanie automatyczne z pominięciem
komponentu związanego z sezonowością (Automatic without seasonality),
- opcje zaawansowane (Custom) – możemy
samodzielnie kombinować komponenty związane z trendem i sezonowością, mamy
dziewięć różnych możliwości:
·
Trend:
None, Season: None,
·
Trend:
Additive, Season: None,
·
Trend:
Multiplicative, Season: None,
·
Trend:
None, Season: Additive,
·
Trend:
None, Season: Multiplicative,
·
Trend:
Additive, Season: Additive,
·
Trend:
Multiplicative, Season: Additive,
·
Trend:
Additive, Season: Multiplicative,
·
Trend:
Multiplicative, Season: Multiplicative.
Więcej
na temat metod związanych z Forecastingiem w Tableau można przeczytać w dokumentacji Tableau Desktop,
zamieszczonej na oficjalnej stronie Tableau:
FORECASTING
W TABLEAU VS. W INNYCH PROGRAMACH
Osobom,
które nie czują się przekonane do Forecastingu zaimplementowanego w Tableau
polecam przeczytanie artykułu “Comparing Tableau 8 and R: time series forecasting
features” na The
Analytics Compass Blog:
We
wspomnianym artykule została przeprowadzona analiza porównawcza jakości Forecastingu
wykonanego w Tableau oraz w R (open-source`owe środowisko do analiz
statystycznych i język programowania) na pewnym zbiorze danych. Jako kryterium
porównawcze zostały przyjęte cztery miary błędu związanego z dopasowaniem
modeli:
- Root Mean
Square Deviation (RMSE),
- Mean Absolute
Error (MAE),
- Mean Absolute
Scaled Error (MASE),
Wyniki w obu przypadkach są zbliżone, podczas gdy
Forecast w Tableau można wykonać za pomocą zaledwie kilku kliknięć myszką!
KOMENTARZE