Dáta a investigatíva idú spolu ruka v ruke. Viete, čo spočíva v práci investigatívneho novinára?

Comment

Investigatívna žurnalistika je ako archeológia – musíte kopať dlho a na správnom mieste, aby ste niečo našli. Pochádza z anglického slova investigation, čo znamená skúmanie a vyšetrovanie. Na Slovensku síce nie sú ideálne podmienky pre tento druh žurnalistiky, no i tak si našla zázemie v niektorých redakciách. Po zavraždení Jána Kuciaka, ktorý patril medzi popredných slovenských investigatívnych novinárov, sa téma investigatívy na Slovensku prebudila k životu. Mnoho článkov o zosnulom Kuciakovi priblížilo aj bežným ľuďom, že za touto prácou je mnoho bádania a malých krokov, ktoré nakoniec vedú k veľkým zisteniam. V nasledujúcich riadkoch si priblížime ako títo novinári pracujú. Prvé pravidlo: potrebujete dáta, dáta a ešte ďalšie dáta!

Pri práci s dátami si treba uvedomovať kontext a pristupovať k nim z rôznych uhlov pohľadu.

Dátová gramotnosť

Naša schopnosť získavať znalosti, kriticky uvažovať a zrozumiteľne sa vyjadrovať prostredníctvom dát sa nazýva dátová gramotnosť. Musíme si odpovedať na otázky ako odkiaľ sa naše dáta vzali, čo presne hovoria alebo ako spoľahlivé sú. Dôveryhodnosť dát sa dá overiť rôznymi testami. Jedným z nich je Benfordov zákon, určený pre matematicky zdatných ľudí. Pri práci s dátami si treba uvedomovať kontext a pristupovať k nim z rôznych uhlov pohľadu. A v neposlednom rade si zistiť, či zdroj, z ktorého čerpám, uviedol všetky relevantné informácie.

Vedel prečítať matrix, v ktorom ostatní ľudia videli iba kopu nezmyselných čísel.“

Zosnulý Ján Kuciak, žurnalista webového portálu aktuality.sk, sa venoval investigatíve a jeho schopnosť vyznať sa v záplave dát bola jedinečná. Vedel prečítať matrix, v ktorom ostatní ľudia videli iba kopu nezmyselných čísel. V relácii Fair Play šéfredaktor aktualít Peter Bárdy charakterizoval jeho prácu takto: „Jano bol dátový žurnalista, nebol skúsený v písaní. Vedel nájsť informácie v registroch, vedel čítať zmluvy a hľadať prepojenia, ale nebol spisovateľ. Nerobil investigatívu takú, akú ju poznáte z filmov. Nechodil s diktafónom a kamerou za ľuďmi a nepýtal sa. Janova práca spočívala v práci s dátami. Hľadal, pátral, investigoval v otvorených zdrojoch. Pospájal si zmluvy, čerpanie fondov s konkrétnymi osobami. Dávali mu zmysel aj často nelogické konštrukcie. Preto bol nepopulárny u ľudí, ktorí sa snažili niečo skryť za komplikované prepojenia firiem, v ktorých sa strácali aj odborníci na daňových úradoch či polícii. Našiel to, čo sa oni snažili skryť.”

„Janova práca spočívala v práci s dátami. Hľadal, pátral, investigoval v otvorených zdrojoch. „

Získavanie informácií a internetové zdroje

Ako teda začať? Prvým krokom by určite malo byť hľadanie. Množstvo dát, ktoré sa nachádza na úradných weboch a weboch ministerstiev, je enormné. Háčik je, že sú tieto stránky veľakrát neprehľadné a vami požadované informácie sú skryté. V tomto prípade vám bude dobrým pomocníkom Datanest, zdroj verejných informácií vytvorený Alianciou Fair-play. Zameriava sa najmä na hospodárenie s verejnými peniazmi. Výhodou je výskyt veľkého množstva údajov na jednom mieste, čo vám uľahčí prácu.

Ďalšími pomocníkmi sú:

  • WHOIS register vlastníkov domén, IP adries a iných internetových objektov
  • operátori vo vyhľadávači Google funkcie, ktoré vás presmerujú na relevantné odkazy, napr. site:.sk vám ukáže iba stránky so slovenskou doménou (viac tipov hľadajte na Google Advanced Search)
  • Google Cache stránky, ktoré boli stiahnuté alebo zmenené, má Google uložené v tzv. medzipamäti, hľadanie funguje na základe URL adresy stránky
  • kataster nehnuteľností interaktívna katastrálna mapa Úradu geodézie, kartografie a katastra SR a ich projekt cica.vugk.sk
  • obchodné registre na webovej stránke orsr.sk, akcionári a účtovné výkazy na webovej stránke registeruz.sk, vzťahy v pozadí biznisu Notársky centrálny register záložných práv
  • archív webu skvelým nástrojom je Wayback Machine, vďaka ktorému si môžete pozrieť obsah webovej stránky v minulosti, stačí len zadať adresu a ak sa nachádza v archíve, môžete sa pohybovať v minulosti vďaka prehľadnému kalendáru
  • hľadanie podľa obrázka na stránke images.google.com stačí vložiť obrázok alebo URL obrázka a Google vám nájde relevantné stránky
  • Google Trends databáza štatistík často vyhľadávaných fráz

Webové stránky samé o sebe vám však neodhalia všetky prepojenia a dáta. Tie prácne musíte hľadať a selektovať. Za každým datasetom sa ukrýva príbeh.

,,Investigatívni novinári využívajú infozákon pravidelne a pre tento druh žurnalistiky je až nevyhnutnosťou, keďže sa opiera o relevantné fakty, čísla a dáta.“

Ak nebudete v prvom kroku úspešní, stále je tu možnosť kontaktovať úrad osobne. Webové stránky úradov väčšinou disponujú menným zoznamom zamestnancov a je už len na obojstrannej dohode, či sa dopracujete k potrebným informáciám. Poslednou možnosťou je obrátiť sa na infozákon a podať žiadosť o sprístupnenie informácií.

Vďaka nástroju Wayback Machine si môžete pozrieť obsah webovej stránky v minulosti.

Na aké informácie máme právo?

Zákon o slobode informácií č. 211/2000 presne určuje, ktoré subjekty majú povinnosť zverejňovať informácie a konkretizuje, aké. Patria sem štátne inštitúcie ako NRSR, kancelária prezidenta SR, vláda SR a ministerstvá, obce a mestá. V prípade, že tieto zdroje zlyhajú, musíte si podať žiadosť o sprístupnenie informácií. Je dôležité správne sformulovať, o aké informácie žiadate. Žiadosť musí obsahovať tieto náležitosti:

  • meno
  • adresu
  • čo žiadate
  • ako vám to majú poslať (elektronicky alebo poštou)
  • váš email

Na vybavenie žiadosti majú úradníci 8 dní. Túto lehotu si môžu predĺžiť maximálne o ďalších 8 dní. Môže sa stať, že vás úrad bude ignorovať. V tom prípade môžete podať odvolanie a pripraviť sa na vojnu paragrafov. Investigatívni novinári využívajú infozákon pravidelne a pre tento druh žurnalistiky je až nevyhnutnosťou, keďže sa opiera o relevantné fakty, čísla a dáta.

Scrapovanie dát

Pri hľadaní informácií väčšina ľudí strávi niekoľko hodín iba browsovaním webu. No existuje spôsob, ako si to uľahčiť a zrýchliť. Web scraping je počítačová softvérová technika získavania informácií (dát) z rozsiahlych webových stránok. Vytvorením a použitím programu, ktorý sa nazýva Web scraper, simulujete to, ako by ste si ich vy sami pracne vyhľadávali na webe. Tento program to spraví za vás a rýchlejšie vám ponúkne hľadanú informáciu z viacerých webových stránok. Ako zdroj využíva internetové stránky obyčajne napísané v jazyku HTML.

Ak si chcete napísať svoj scraper v jednom z programovacích jazykov (Python, Ruby alebo PHP), na internete je k dispozícii server ScraperWiki. Scrapovanie vám uľahčí vtedy, keď budete vedieť, ako vyzerá zdrojový kód stránky. Nájdete ho vo vývojárskych nástrojoch, ktoré má väčšina webových prehliadačov vstavané a sú voľne prístupné pre používateľov.

Dôležitým krokom je vybrať si správny spôsob vizualizácie. Závisí od množstva dát, ich zdroja alebo od vzájomného vzťahu textu a grafiky.“

No nezúfajte, existujú online scrapovacie nástroje, ktoré zvládnu aj ne-ITčkári. V dnešnej dobe asi najpoužívanejší webový prehliadač Google Chrome poskytuje rozšírenie Scraper. Ten je vhodný na kopírovanie tabuliek z webu. Ak by ste si ju skopírovali normálnym spôsobom, dáta by sa mohli poprehadzovať a nezachoval by sa formát, v akom boli. Pomocou Scraperu sa vám však otvoria ako súbor typu Excel v tabuľkovej forme. Pre Firefox existuje rozšírenie DownThemAll, ktoré vám uľahčí sťahovanie veľkého počtu súborov naraz.

Vizualizácia dát je ako ťažný kôň dátovej žurnalistiky.

Vizualizácia dát

Grafy, mapy, infografiky, animácie, interaktívne vizualizácie. To všetko môže pomôcť vášmu článku presvedčivo ilustrovať pointu alebo zbaviť text nadbytočných technických detailov. Dôležitým krokom je vybrať si správny spôsob vizualizácie. Závisí od množstva dát, ich zdroja alebo od vzájomného vzťahu textu a grafiky. Treba mať na pamäti, že niekedy je menej viac. Na záver pár tipov na užitočné nástroje pre vizualizáciu dát:

  • Datawrapper (interaktívne grafy alebo mapy)
  • Tableau (grafy)
  • Timeline JS (časové osi)
  • Infogram (grafy a infografiky)

 

Zopár pojmov na záver

Watchdog z angličtiny strážny pes, sú ním mimovládne organizácie, ktoré sa zaoberajú témami ako korupcia, klientelizmus a pod., sú tak skvelými zdrojmi pre žurnalistiku.

Watchdogs na Slovensku a ich práca:

Aliancia Fair-play Datanest, znasichdani.sk

Transparency International Slovensko otvorenesudy.sk, otvorenezmluvy.sk

INEKO vyhodnocuje dáta o školách, nemocniciach, samosprávach

Kryptológia kódovanie/šifrovanie informácií pomocou symetrických a asymetrických kryptovacích algoritmov

Matrix súbor údajov uložených v databázovej tabuľke, údaje sú kódované v číslach a písmenách, a tak sú čitateľné iba pre používateľov vzdelaných v oblasti IT

 

Autor článku: Daniela Miťková

Zdroj: Príručka dátovej žurnalistiky, http://www.changenet.sk

 

Tereza Šuveríková

Related Posts

Discussion about this post