Rozkład Benforda

         Matematyczne Prawo Benforda głosi, że częstotliwość występowania pierwszej cyfry w rzeczywistych danych liczbowych nie jest przypadkowa. Prawdopodobieństwo wystąpienia cyfry k to:



Częstotliwość występowania różnych cyfr na pierwszej pozycji rozkłada się następująco:




         Prawo Benforda znajduje szerokie zastosowanie w ujawnianiu nieprawdziwych informacji w raportach, w tym np. sprawdzania poprawności zeznań podatkowych. Dowiedz się jak zastosować Prawo Benforda w Tableau!



         Zbadamy sprzedaż ze zbioru Superstore Subset. Pracę zaczynamy od wyciągnięcia z liczb pierwszej cyfry. Rzutujemy miarę „Sales” do napisu, za pomocą funkcji STR i wyciągamy z niego pierwszy znak od lewej, za pomocą funkcji LEFT.




         Następnie chcemy wyliczyć prawdopodobieństwo wystąpienia kolejnych cyfr. Zmienna „Pierwsza cyfra” jest teraz napisem, zatem w kalkulacji zamykamy ją w funkcji INT (rzutujemy do liczby całkowitej). Dzięki funkcji LOG możemy wyliczyć logarytm przy podstawie 10.




         Zliczamy liczbę wystąpień każdej cyfry na wykresie słupkowym. Przeciągamy zmienną „Pierwsza cyfra” na zakładkę Columns i zmienną „Number of Records” na zakładkę Rows oraz stosujemy kalkulację tabelaryczną Percent of Total.




         By wyświetlić etykiety możemy skorzystać z opcji Show Mark Labels (ikonka Abc). Jeśli chcemy, by etykiety wyświetlały się wewnątrz słupków, wybieramy opcje Label -> Alignment -> Vertical -> Middle.






         Przeciągamy kalkulację „Prawdopodobieństwo” na ikonkę Detail i agregujemy względem miary Minimum.




         Aby nałożyć na wykres obszary referencyjne, związane z rozkładem zmiennej „Prawdopodobieństwo”, wystarczy skorzystać z opcji Distribution, dostępnej w kreatorze tworzenia linii i obszarów referencyjnych. Klikamy prawym przyciskiem myszy na oś liczbową i wybieramy opcję Add Reference Line.




         W kreatorze tworzenia linii i obszarów referencyjnych wybieramy Distribution -> Computation -> Value -> Percentages i wskazujemy jaki procent wartości zmiennej „Prawdopodobieństwo” nas interesuje.










         Na wykresie możemy zaobserwować, że częstość występowania pierwszych cyfr w sprzedaży ze zbioru Superstore Subset mieści się w przedziale [90%, 110%] wartości częstości, wyznaczonych z rozkładu Benforda.

KOMENTARZE

Nazwa

Alteryx,8,astrafox,1,ASTRAFOX ACADEMY,16,case study,16,Data Science,44,Konferencje,31,Mapy i geokodowanie,6,Opinie,1,Przygotowane danych - ETL,4,R,4,Tableau,202,Tips & Tricks,61,Wizualizacja danych,50,
ltr
item
Polski blog Tableau - ASTRAFOX: Rozkład Benforda
Rozkład Benforda
https://2.bp.blogspot.com/-GHKx3GKAsHE/VkEci73nt7I/AAAAAAAAAUE/vm5U2AA9lUM/s320/image12.png
https://2.bp.blogspot.com/-GHKx3GKAsHE/VkEci73nt7I/AAAAAAAAAUE/vm5U2AA9lUM/s72-c/image12.png
Polski blog Tableau - ASTRAFOX
http://blog.tableau-software.pl/2015/05/rozkad-benforda.html
http://blog.tableau-software.pl/
http://blog.tableau-software.pl/
http://blog.tableau-software.pl/2015/05/rozkad-benforda.html
true
9139349578575077505
UTF-8
Załadowano wszytskie posty Nie znaleziono żadnych postów ZOBACZ WSZYSTKIE Czytaj więcej Odpowiedz Usuń komentarz Usuń Napisane przez Home STRONY POSTY Zobacz wszystko POLECANE ETYKIETA ARCHIWUM SZUKAJ WSZYSTKIE POSTY Nie znaleziono tematów ani postów pasujących do twoich kryteriów Powrót Niedziela Poniedziałek Wtorek Środa Czwartek Piątek Sobota Nd Pon Wt Śr Czw Pt Sob Styczeń Luty Marzec Kwiecień Maj Czewiec Lipiec Sierpień Wrzesień Październik Listopad Grudzień Styczeń Luty Marzec Kwiecień Maj Czerwiec Lipiec Sierpień Wrzesień Październik Listopad Grudzień teraz minutę temu $$1$$ minutes ago godzinę temu $$1$$ hours ago wczoraj $$1$$ days ago $$1$$ weeks ago ponad 5 tygodni temu Obserwujący Obserwuj TO JEST TREŚĆ PREMIUM Udostępnij, by odblokować Kopiuj cały kod Zaznacz cały kod Cały kod został skopiowany Nie można skopiować kodu / tekstu, naciśnij [CTRL]+[C] (or CMD+C w Mac) by skopiować