Klasteryzacja oraz Cross-Database Join to kolejne nowe funkcjonalności w dziesiątej wersji Tableau.
Obie równie wyczekiwane, o dużych możliwościach.
Klasteryzacja jest świetnym rozszerzeniem prostych i intuicyjnych funkcji analitycznych. Cross-Database Join rozwiązuje wreszcie problemy związane z blendingiem danych i ograniczeniami z tym związanymi. Mamy możliwość utworzenia jednego źródła danych z wielu różnych baz danych (np. MS SQL z Oracle) czy plików płaskich. Omijamy tym samym problemy blendingu, które w określonych sytuacjach wprowadzały uciążliwe ograniczenia.
Klasteryzacja opiera się na modelu k-średnich, zaaplikowana jest w Tableau w sposób bardzo intuicyjny i maksymalnie uproszczony od strony konfiguracyjnej. Tableau klasteryzuje obserwacje automatycznie, stosując zmienne użyte w wizualizacji oraz samodzielnie dobiera liczbę klastrów.
Wybierzmy dwie miary i stwórzmy wykres typu scatter-plot. W naszym przypadku są to dane określające wielkość sprzedaży oraz wydatki marketingowe dla poszczególnych punktów sprzedaży.
Po podłączeniu możemy w sposób standardowy dodać nową zmienną "Populacja" do klasteryzacji edytując ikonę klastra.
Obie równie wyczekiwane, o dużych możliwościach.
Klasteryzacja jest świetnym rozszerzeniem prostych i intuicyjnych funkcji analitycznych. Cross-Database Join rozwiązuje wreszcie problemy związane z blendingiem danych i ograniczeniami z tym związanymi. Mamy możliwość utworzenia jednego źródła danych z wielu różnych baz danych (np. MS SQL z Oracle) czy plików płaskich. Omijamy tym samym problemy blendingu, które w określonych sytuacjach wprowadzały uciążliwe ograniczenia.
Klasteryzacja opiera się na modelu k-średnich, zaaplikowana jest w Tableau w sposób bardzo intuicyjny i maksymalnie uproszczony od strony konfiguracyjnej. Tableau klasteryzuje obserwacje automatycznie, stosując zmienne użyte w wizualizacji oraz samodzielnie dobiera liczbę klastrów.
Wybierzmy dwie miary i stwórzmy wykres typu scatter-plot. W naszym przypadku są to dane określające wielkość sprzedaży oraz wydatki marketingowe dla poszczególnych punktów sprzedaży.
Tworzymy klastry wybierając odpowiednią opcję z zakładki "Analytics".
Tableau tworzy klastry w oparciu o wybrane na wizualizacji miary - Sprzedaż oraz Wydatki marketingowe. Program wygenerował automatycznie dwa klastry, których parametry możemy podejrzeć klikając prawym przyciskiem myszy i wybierając opcję "Describe cluster".
Nasze klastry zostały zbudowane na podstawie relacji sprzedaży z wydatkami marketingowymi dla każdego punktu sprzedaży. Ze specyfiki danych wynika, że każdy punkty sprzedaży mieszci się w innym mieście. Chciałbym zbadać czy lokalizacja - miasto a raczej wielkość populacji danego miasta wpływa na efektywność danego punktu sprzedaży.
Dodam do zmiennych klastrujących populację danego miasta.
W tym celu wykorzystamy funkcjonalność Cross-Database Join, dołączając kolejny plik płaski do poprzedniego źródła danych z danymi sprzedażowymi.
Określamy relacje między źródłami aby poprawnie przygotować dane.
W odróżnieniu od blendingu, cross-database join pozwala na utworzenie jednego, kombinowanego źródła danych.
Jak widzimy, nowa zmienna pozwoliła na utworzenie 3 klastrów, dodając linie trendu jesteśmy w stanie określić, które punkty sprzedaży są warte naszych dalszych inwestycji w działania marketingowe, a których wydajność jest niska.
Klaster niebieski posiada linię trendu opisaną równaniem liniowym: Sprzedaż=7,31587*Wydatki marketingowe+22850,5.
W uproszczeniu i przy założeniu ceteris paribus jedna jednostka pieniężna wydana na działania marketingowe w punktach sprzedaży z klastra niebieskiego przyniesie ponad 7 jednostek pieniężnych sprzedaży. Relacja ta jest najkorzystniejsza. Pozostałe klastry opisują zbiory punktów sprzedaży w miejscach o niższej efektywności działań marketingowych.
A jak Wy korzystanie z klasteryzacji? Podzielicie się swoimi pomysłami?
KOMENTARZE