Na začátek je vhodné uvést menší úvod do problematiky. Mnozí z vás jistě tuší o čem je řeč, proto pouze v rychlosti. Představte si, že máte 60000 podpisů a nemáte prostředky na to, abyste ověřovali věrohodnost každého jednotlivého z nich. Uděláte proto vzorek 8500 podpisů a pokud mezi nimi bude méně než 3% neplatných, tak zkrátka jenom vyšktnete tyto konkrétní podpisy a dál už nic nekontrolujete. Pokud však bude chybovost větší, řekněme 19%, tak uděláte druhý vzorek a pokud i tam bude chybovost větší, řekněme 21%, odečtete nejen tyto podpisy, ale procentuální podíl, který odpovídá chybovosti obou vzorků. Člověk má takové nutkání to zprůměrovat a odečíst 20%, vykukové z ministerstva se to však rozhodli sečíst a v našem případě by jim vyšlo 40%, což zjevně naprosto neodpovídá realitě.
Nechci se dohadovat, jestli bylo správné použít tento postup nebo ne, když ho ministerstvo avizovalo dlouho dopředu, jenom bych rád ukázal, jakou metodu bych navrhl třeba já sám. A není to pouhý průměr, protože ten může být zatížen statistickou odchylkou.
Nejlepší bude, budu-li pracovat už s konkrétními čísly. Použiji proto data z rozhodnutí o odmítnutí kandiátní listiny pana Vladimíra Dlouhého. Ten odevzdal 59165 podpisů, v prvním vzorku jich bylo 1381 neplatných, ve druhém vzorku jich bylo 1561. Velikost obou vzorků byla 8 500. To tedy znamená, že ze 17000 podpisů bylo neplatných 2942, tzn. 17,3%. Nabízí se otázka s jakou pravděpodobností bylo z celkových 59165 podpisů alespoň 9166 (15,5%) neplatných. Tuto úlohu vám vypočítá student druhého ročníku libovolné ekonomické fakulty, není to vůbec nic těžkého.
Poznámka pro zájemce: To podivné rozpůlené kolečko je řecké písmeno fí, zde značí distribuční funkci standardizovaného normálního rozdělení. Velké P je pravděpodobnost, význam ostatních znaků je patrný z výpočtu. Nechci zbytečně znechutit běžné čtenáře, proto vás odkážu na wikipedii, kde jsou tato témata vcelku dobře popsána.
Poznámka pro matematiky: Ano, aproximace binomického rozdělení pomocí normálního rozdělení má jisté předpoklady, můžete si je ověřit. Pokud bude chybovost větší než zhruba dvacetina procenta, budou splněny.
Tedy pravděpodobnost, že měl méně než 50000 platných podpisů, je takřka stoprocentní. Pokud bychom stejný výpočet aplikovali na pana Okamuru, dostaneme opět stejný výsledek, tzn. téměř na 100% nemá potřebný počet platných podpisů. Poslední kandidát, kterému mohla nešikovná metodika způsobit potíže, byla paní Bobošíková. U ní dostáváme výsledek naprosto opačný - s téměř 100% pravděpodobností měla oněch požadovaných 50000 podpisů.
Můžete si všimnout, že touto metodou dostáváme vcelku extrémní hodnoty. Je to pochopitelné, 17000 je poměrně velký vzorek a lze tedy očekávat hodnoty velmi blízké 0 nebo 1. Kdybychom si řekli, že pokud nám u někoho pravděpodobnost, že nemá 50000 podpisů vyjde menší, než 1%, pak uznáme jeho kandidaturu, prošli by všichni současní kandidáti i paní Bobošíková. Kandidaturu Tomia Okamury a Vladimíra Dlouhého už zřejmě nic nezachrání, jak ukazují mé přechozí výpočty.
Na závěr chci říct, že nejsem zastáncem paní Bobošíkové a tento článek jsem nenapsal na její podporu. Nelíbí se mi však vágní přístup státních úředníků a zákonodárců. Jsou zde známé, funkční a v praxi používané matematické metody, pomocí kterých by šel počet platných a neplatných podpisů snadno vyhodnotit a vyvodit z toho závěry. Proč se tedy postup výpočtu nekonzultoval s nějakým statistikem? Proč si matematicky nevzdělaní státní úředníci vymýšlí vlastní postupy? Jsem si jistý, že několik set korun na dvě nebo tři hodiny konzultace s odborníkem by si ministerstvo dovolit mohlo.
Zdroje:
http://www.mvcr.cz/clanek/rozhodnuti.aspx
EDIT: V diskuzi pod článkem jsem se dozvěděl pár zajímavých informací, z kterých vyplývá, že mé závěry v tomto článku jsou chybné, ministerstvo totiž použilo pro kontrolu duplicit jinou metodiku, než jsem si myslel. Rád bych případné budoucí čtenáře proto odkázal na http://paragraphos.pecina.cz/2012/11/jak-je-to-s-duplicitami-aneb-mala-nocni.html, kde pan Pecina používá lepší výpočet s ohledem na způsob kontroly. Tímto způsobem se ukazuje, že paní Bobošíková by velice pravděpodobně neuspěla.