Vizualizace dat

Jak zobrazit data tak, aby se na to dalo dívat

Domů > Průvodce > Vizualizace dat

O co jde a k čemu to je

Před vypuštěním jakékoliv vizualizace dat do světa je dobré otestovat, zda je srozumitelná a pochopitelá.

Vizualizace je datový produkt a tak k němu můžete přistupovat. To znamená:

  • Chápat, kdo jsou uživatelé
  • Vcítit se do jejich situace
  • Zjišťovat (nebo aspoň odhadovat), co potřebují
  • Produkt dělat podle potřeb uživatelů
  • Produkt před vypuštěním do světa otestovat
  • Pak sbírat zpětnou vazbu a iterativně zlepšovat

Základním pojmem v této oblasti je tzv. prokletí poznání (curse of knowledge): uživatelé vaší vizualizace nevědí to, co vy, a pro vás je velmi těžké si představit, že to nevědí. Kroky, které v tomto návodu doporučujeme, vám kromě využití dobrých praxí v oboru vizualizace dat umožní také překonat toto prokletí (viz Xiong, Van Weelden, a Franconeri 2020).

Případová studie

Tento návod jsme vyvinuli a testovali s týmem OVE na MMR


Je to pro mě?

Tento návod vám pomůže, pokud platí některé z následujících tvrzení:

  • Máme signály o tom, že naše vizualizace jsou pro uživatele našich výstupů těžko srozumitelné.
  • Chceme si být jistější, že nepácháme žádné vizualizační hříchy.
  • Občas máme pocit, že grafy do zpráv a prezentací dáváme spíš jako signál, že pracujeme z daty, než jako skutečně informativní prvek.
  • Nejsme si při vytváření grafů a tabulek jistí, jestli využíváme vhodné formy zobrazení dat.
  • Nedaří se nám v týmu shodnout na tom, jaké vizualizace používat na jaká data.

Pokud si jste docela jistí v kramflecích, ale rádi byste stavěli na aktuálním poznání o tom, jak funguje vnímání vizualizací, podívejte se do literatury.

Pokud byste rádi rozšířili spektrum vizuálních forem, které pro vizualizaci dat využíváte, můžete se inspirovat některým z mnoha zdrojů – nebo možná potřebujete využít nějaký jiný nástroj než Excel: podívejte se na možnosti níže.


Jak na to

1. Udělejte si obrázek o uživatelích vaší vizualizace

Vytvořte karty uživatelů

  • Kdo to je, jaký*á je, co dělá? (jméno, věk, role, vzdělání, postoje, …)
  • Čeho potřebuje dosáhnout? (sepsat analýzu / přesvědčit paní X / vysvětlit téma T, …)
  • Co ho*ji trápí, čemu čelí, s čím se potýká („Jsem busy“ / „Nerad čtu data“ / „Špatně vidím“)
  • Co chce od vizualizace dat
    • Forma: přehled vs. detail, standard vs. inovace, …
    • Účel: Zaujmout, přesvědčit, prozkoumat, hledat vzorce…

Karta uživatele

2. Definujte sdělení

Podle typu dat, se kterými pracujete, a informace, kterou chcete předat, zvolte formu vizualizace

Zvažte:

  • co je hlavní informace, kterou chceme předat?
  • co s čím srovnáváme?
  • co očekáváme, že bude uživatel s vizualizací dělat? (rychle si ji prohlédne, bude v ní sám hledat informace a vzorce, bude zkoumat jednotlivé hodnoty… – )

Je potřeba tabulka, nebo graf?

Kdy použít tabulku

  • Porovnat údaje (point in time, území, skupiny)
  • Poskytnout hodnoty a měření (frekvence/počty, procenta/podíly, indexy)
  • Poskytnout souhrnné údaje (součty, průměry)
  • Zobrazit hodnoty velmi rozdílných velikostí (např. tisíce vs. miliony)

I tabulka je vizualizace: její rozložení, uspořádání a grafická úprava může usnadnit nebo zkomplikovat čtenáři život a navádět k různému čtení.

Kdy použít graf

  • Zobrazit vzorce/pravidelnosti (např. sezonalita)
  • Zvýraznit trendy (např. vývoj v čase) a rozdíly
  • Ukázat vztahy (např. korelace)

Grafy: čáry, body, sloupce, koláče

Jaké typy grafů využít pro různé typy vztahů, srovnání a souvislostí?

  • Sloupcový
    • rozdělení
    • řazení
    • variabilita, odlišnost
    • velikost
    • časová řada
  • Čarový
    • časová řada
    • korelace
  • Koláčový
    • část celku
  • Bodový
    • korelace

Další prvky grafů

  • Anotační vrstva: porozumění nebo zaměření na konkrétní momenty můžete pomoct tím, že do grafu umístíte šipky, popisky nebo návod na čtení
  • Osy, škály, legendy: samy nesou informaci (např. řazení) a mohou usnadnit čtení (např. vhodně umístěná legenda nebo přímé označení hodnot)
  • Nedatové prvky (vodítka, pozadí): mohou napomoci čtení, ale pokud nejsou vhodně zvoleny, mohou odvádět pozornost od informací
  • Titulek a podtitulek
    • Titulek = hlavní sdělení grafu: „Nárůst počtu uchazečů o zaměstnání“
    • Podtitulek = popis datové sady, území a časového úseku: „Vývoj počtu uchazečů o zaměstnání v Praze v období 2010-2022“
  • Zdroj

Celkové uspořádání grafu a formu jeho prvků tvořte tak, abyste minimalizovali nároky na tzv. pracovní paměť, tj. aby čtenář musel co nejméně přeskakovat mezi prvky grafu, srovnávat od sebe vzdálené hodnoty a podobně. Pamatujte, že lidem docela dobře jde rozeznat z grafu celkový trend. Naopak těžší je srovnávat jednotlivé hodnoty (Franconeri 2021). Stavte grafy tak, abyste jim tyto úkoly usnadnili. Pokud je v datech jasný trend, měl by být poznat z „tvaru“ grafu; pokud čekáte, že čtenáři budou srovnávat jednotlivé hodnoty, udělejte to tak, aby byly vedle blízko, podobné, dobře vizuálně porovnatelné.

4. Držte se dobrých praxí

Může k tomu použít třeba checklist níže

Tabulky

Sdělení

Uspořádání

Formátování

Seskupení, seřazení a hierarchizace

Součty, souhrny a zaokrouhlení

Titulky a popisky

Záhlaví (headers)

Fonty

Grafy

Volba typu grafu

Encoding

Titulky a popisky

Legenda

Anotace

Nedatové prvky: osy, vodicí linky, řazení

Špatné praxe

5. Otestujte srozumitelnost a pochopitelnost grafu

Otestujte graf na sobě:

  • Jak bych popsal/a graf nebo tabulku po telefonu?

Testujte graf na ostatních:

  • Čtení: Ukážu ti graf, komentuj prosím průběžně nahlas, jak ho postupně čteš, jak nad ním přemýšlíš, čemu nerozumíš, co si odvozuješ.
  • Sdělení: Projdi si, prosím, graf a zkus identifikovat, co je jeho hlavní myšlenkou, sdělením.

Pokuste se taky ukázat někomu graf na pouhých 5 vteřin a zeptejte se, co je jeho hlavní myšlenkou.

Tipy & triky a na co si dávat pozor

Většinu pastí jsme zachytili v checklistu – použijte jej.

Pár rad pro typické situace:

  1. Chci ukázat hodně dat, např. časovou řadu pro více entit
  • rozložte graf do více panelů (tzv. small multiples, viz Schwabish (2014))
  1. Nevím, jaké vybrat barvy
  • podívejte se, jestli vaše organizace nemá sestavené barevné schéma např. pro vizualizace
  • pro kvantitativní škály lze doporučit palety viridis (můžete využít např. tento generátor)
  • pro kvalitativní může pomoct nástroj ColorBrewer
  1. Nevím, jaký typ grafu použít

Použijte některou z pomůcek pro výběr grafu:

  1. Chci vyrobit graf, který Excel neumí

Můžete ho zkusit hacknout, neboli nějak to omezené obejít. Pomůže některá z příruček.

Anebo využít jiný nástroj. Máte dvě možnosti: využít nějaký mocný a flexibilní programovací jazyk (typicky Python nebo R) anebo naopak některý z online nástrojů na tvorbu grafů.