Aleš Michl (Mladá fronta DNES 7. 2. 2022 strana 9, rubrika Názory)
S Terezou Bártlovou z matfyzu jsme sepsali pár článků popularizující matematiku.
Pod hlavičkou „POP matematika“ jsou na webu ČNB. Tady je ochutnávka. Představte si tabulku počtu obyvatel jednotlivých zemí světa. Otázka zní: Jaká je pravděpodobnost, že na první pozici čísla udávajícího počet obyvatel dané země bude jednička? A) 11,1 procenta, nebo B) 30,1 procenta?
Většina lidí, kteří mají nějaké povědomí o statistice, volí možnost A. Odůvodnění je totiž naprosto logické – máme na výběr devět čísel, která mohou být na první pozici. Žádné z těchto čísel není nijak důležitější.
Všechna mají stejnou pravděpodobnost ocitnout se na první pozici. Pravděpodobnost je 1 ku 9 neboli 11,1 procenta. Správně je ale B. Jedničkou bude začínat zhruba každé třetí číslo. Nevěříte? Zkuste si to.
Tabulku s počty obyvatel si třeba vytiskněte, zakroužkujte si první číslici každého čísla a poté si spočítejte četnosti jednotlivých číslic. Vyjde vám, že číslo 1 je na první pozici zhruba ve 30 procentech případů. Číslo 2 zhruba v 17 procentech případů, číslo 3 ve 12 procentech. A pravděpodobnost se stále snižuje. Číslici 9 pak najdeme na začátku pouze v necelých 5 procentech případů. Popsanému jevu se říká Benfordův zákon a neplatí jen u tabulek s počty obyvatel. Jedinou podmínkou je, že ta kupa čísel musí být v minimálním rozsahu tří desítkových řádů.
Pomocí Benfordova zákona můžete dobře posoudit dva datové soubory, kdy jeden z nich obsahuje úmyslně pozměněná data. Respektive v praxi se dají díky tomu kontrolovat náhodně třeba účetní záznamy. Pokud totiž lidé vědomě data falšují a čísla si vymýšlejí či zpětně upravují, přijde jim věrohodnější, pokud používají na začátku všechny číslice zhruba stejně často. Domnívají se, že právě tak to bude vypadat nenápadně.
Opak je ale pravdou. Právě na nadměrném, či naopak méně častém výskytu počátečních čísel, která by podle Benfordova zákona takové zastoupení neměla mít, se dá se značnou mírou pravděpodobnosti vytipovat podezřelý soubor dat nebo statistika.
Až poleví covid, rozjedu se znovu do středních škol. Dal jsem si závazek, že budu po celé zemi během školního roku 24krát debatovat se studenty. Zbývá jedenáct zastávek. Tento krásný příklad popularizující matematiku se mnou budou řešit třeba i vaše děti.