Tereza Bártlová, Aleš Michl (Forbes Česko 18. 8 2021, rubrika Pop matematika)
Pojďme se podívat na tabulku počtu obyvatel jednotlivých zemí světa. Třeba na následující, kterou celou najdete na tomhle odkazu (externí odkaz).
A teď si položme otázku. Jaká je pravděpodobnost, že na první pozici čísla udávajícího počet obyvatel dané země bude jednička?
Bude to:
A) 11,1 procenta
B) 30,1 procenta
Máte rozmyšlenou odpověď?
Většina lidí, kteří mají nějaké povědomí o statistice, volí možnost A. Odůvodnění je totiž naprosto logické – máme na výběr devět čísel, která mohou být na první pozici. Žádné z těchto čísel není nijak důležitější, a tedy všechna mají stejnou pravděpodobnost ocitnout se na první pozici.
Pravděpodobnost je 1 ku 9 neboli 11,1 procenta.
Ale ono to ve skutečnosti tak není. Správně je B. Jedničkou bude začínat zhruba každé třetí číslo. Nevěříte? Zkuste si to. Tabulku s počty obyvatel si třeba vytiskněte, zakroužkujte si první číslici každého čísla a poté si spočítejte četnosti jednotlivých číslic.
Vyjde vám, že číslo 1 se na první pozici vyskytuje daleko nejčastěji, a to zhruba ve 30 procentech případů, číslo 2 zhruba v 17 procentech případů, číslo 3 ve 12 procentech a pravděpodobnost se stále snižuje. Číslici 9 pak najdeme na začátku pouze v necelých 5 procentech případů.
Popsanému jevu se říká Benfordův zákon a neplatí jen u tabulek s počty obyvatel. Stejné pravidlo bude platit třeba u délek řek, měrného skupenského tepla chemických sloučenin, ceny akcií, volebních výsledků, čísel obsažených v účetních záznamech, daňových přiznáních a v mnoha dalších případech. Nezáleží na původu dat nebo jejich jednotkách, jedinou podmínkou je, že musejí být v minimálním rozsahu tří desítkových řádů.
A k čemu je Benfordův zákon v praxi dobrý?
Můžeme díky němu například kontrolovat účetní záznamy. Pokud totiž lidé vědomě data falšují a čísla si vymýšlejí, či zpětně upravují, přijde jim věrohodnější, pokud používají na začátku všechny číslice zhruba stejně často. Domnívají se, že právě tak to bude vypadat nenápadně.
Opak je ale pravdou. Právě na nadměrném, či naopak méně častém výskytu počátečních čísel, která by podle Benfordova zákona takové zastoupení neměla mít, se dá se značnou mírou pravděpodobnosti vytipovat podezřelá statistika.
Benfordova zákona například využila v roce 2011 čtveřice německých ekonomů, když kontrolovala ekonomické statistiky všech zemí EU za předchozích deset let.
Výsledky studie byly později publikované v odborném měsíčníku German Economic Review (externí odkaz) a ukazují, že ekonomická data některých zemí vyvolávají značné pochybnosti.
Za „problematické“ můžeme označit zejména období, kdy se blížil vstup země EU do eurozóny. Například v letech 1999 až 2001, tedy v době zavádění eura, byla nalezena sporná data u Řecka, Rakouska, Portugalska, Lucemburska, Finska a Francie. Po zavedení eura se už statistiky většiny zemí vrátily do normálu.
Díky Benfordovu zákonu byly také zpochybněny výsledky voleb v Íránu v roce 2005.
Avšak pozor. Matematika nám pomáhá, ale nesoudí. K výsledkům podobných studiích je třeba přistupovat opatrně a se selským rozumem, neboť nám ukazují pouze to, které statistiky jsou v souladu s Benfordovým zákonem a které ne.
Otázka, proč vlastně statistiky vykazují nesrovnalosti, zůstává pak podnětem pro další zkoumání. Důvody totiž mohou být různé – od záměrné manipulace s daty přes neúmyslnou manipulaci (například vlivy lidských chyb) po zásadní změnu metodiky a další.
Každopádně je vidět, kouzlení s čísly, statistikami a ekonomickými daty je poměrně populární disciplína.