diff --git a/README.md b/README.md new file mode 100644 index 0000000..2a36495 --- /dev/null +++ b/README.md @@ -0,0 +1,61 @@ +Jednoduchá vizualizace sčítání výsledků voleb +=== + +Chtěl jsem věc, která bude i zobrazovat, kolik hlasů je nesečtených. PoC bylo napsáno přes noc, možná vziknou i další úpravy. + +První verze je psána jen s ohledem na prezidentské volby. + +Závislosti: matplotlib, requests + +__[Povinné](https://www.czso.cz/csu/czso/podminky_pro_vyuzivani_a_dalsi_zverejnovani_statistickych_udaju_csu) +informace:__ Zdrojem dat jsou otevřená data ČSÚ o volbách, dostupná +[zde](https://www.volby.cz/opendata/opendata.htm). + +## Základní myšlenka + +Průběžné výsledky voleb na různých stránkách a jiných zdrojích typicky pracují +pouze s poměrem platných a již sečtených hlasů. Tento poměr se ale v průběhu +sčítání se mění a pro dělání závěrů je tedy žádoucí i znát případný potenciál +pro to, jak moc se může měnit. Tento potenciál navíc nezávisí na počtu +_okrsků_, ale přímo _voličů_, což je další informace, kterou je z běžně +zveřejňovaných dat těžké vyčíst a snadno se dezinterpretuje. + +Tato vizualizace se tento problém snaží řešit tím, že „koláčový graf“ výsledků +vždy počítá z nějakého odhadu celkového počtu voličů a zobrazuje i zastoupení +neznámých výsledků. Pro úplnost a zachování invariantů také ve výchozím stavu +zobrazujeme i další možné postupy voličů, tedy i zastoupení neplatných hlasů a +neúčasti ve volbách. Tím je zaručeno, že celý koláč odpovídá stále stejnému +počtu voličů a že se velikosti všech výsečí kromě nejistoty mohou jen +zvětšovat. + +### Příklad + +Pokud v určitý okamžik sčítání voleb má Alice 600 hlasů a Bob 400 a +je sečteno 75 % okrsků, zdá se, že výsledek je velmi příznivý pro Alici. Nicméně +se může stát, že posledních 10% okrsků bude silně nakloněno Bobovi, čímž by Bob +volby mohl vyhrát. Navíc tyto okrsky mohou být větší, takže se v nich může +snadno nacházet i 33 % voličů. + +V tomto případě tedy průměrná velikost dříve zpracovaného procenta okrsků je 13 +osob a u později sečtených okrsků 20 osob. Bob vyhraje v případě, že v těchto +okrscích získá o 200 hlasů víc, což by při 100% volební účasti znamenalo 70% +podporu Boba. + +Běžné zdroje nicméně často mylně vyvolávají dojem, že Alice „má výhru v kapse“, +což pak snadno může vést k předčasným radostem a smutkům a následnému +případnému zklamání, a zejména nedávají plnou informaci o tom, jak sčítání +skutečně postupuje. + +## Známé problémy + +Nenašel jsem zdroj dat, který by uváděl celkové počty oprávněných voličů před +zahájením sčítání. Proto se počet nezapočítaných hlasů opírá o nějaký odhad +počtu voličů a může se stát, že vizualizace ukazuje nějaké nezapočítané hlasy i +v okamžiku ukončení voleb – to značí, že tento odhad byl moc velký. + +V závislosti na nepřesnosti odhadu počtu voličů v seznamech se zobrazované +poměry liší od skutečnosti. Speciálně pokud je odhad menší než skutečný počet +voličů, začne vizualizace trpět stejnými problémy; pro nulový odhad je +vizualizace ekvivalentní s daty v ostatních zdrojích. + +_TODO: write English summary of what this is._