Menu Zavřít

Blog

Pořádáme odborné akce od školení až po velké celodenní konference. Online i offline. Podívejte se na ně.

Michal Bláha (Hlidacstatu.cz): Novináři, kteří používají Hlídače, mají nejvíc exkluzivních zpráv

Celý kód Hlídače chci jednou zveřejnit jako open source, říká autor Hlídače státu a popisuje, jak vypadá technické pozadí této služby.
12. 10. 2018

Hlídač Státu oslavil dva roky fungování a postupně se pěkně rozrostl. V databázi má 120 milionů záznamů, 1,5 milionu smluv nebo 800 veřejných zakázek. Autor Hlídače Michal Bláha plánuje postupně zapojovat nové zdroje dat. Více se dozvíte v rozhovoru.

Hlídač Státu je po Atlas.cz tvůj další projekt, o kterém je v Česku poměrně dost slyšet. Atlas byl mimo jiné známý tím, že běžel na technologiích od Microsoftu. Jak k tomu přistupuješ nyní v Hlídačovi?

Podobně, ale Hlídač už je různorodější. Atlas byl do značné míry „Microsoft only“ a i u Hlídače je většina kódu napsaná v .NET, a to jak byznys logika, tak web. Ale například u databáze se jen velmi omezeně používá Microsoft SQL. Nasazené je jen na jednoduché věci, jako jsou data z obchodního rejstříku, správa uživatelů a pár maličkostí navíc. S drtivou většinou dat pak pracuje Elastic. Plus samozřejmě mám různé drobné věci, které jsou napsané v kde čem – něco v Javě, Pythonu, JavaScriptu (Node.js).

Dělal jsi před rozjezdem Hlídače nějaký větší náčrt celé architektury a promýšlel jsi, jak to všechno půjde k sobě, nebo službu skládáš postupně?

Úplně první verze Hlídače byla postavená na Solr. Ale tam byl problém, že to umělo pouze fulltextový engine a samotná data bych stejně musel mít někde uložená. Elastic mi současně data uloží a poskytne a také mi udělá indexy. Velice rychle jsem tedy přešel na Elastic a zjistil jsem, že je to zcela geniální a je to jedna z nejlepších technologií, kterou jsem poznal a umí toho mnohem více, než jsem původně tušil. A je velmi výkonná a škálovatelná. Smlouvy zpracovávám průběžně každou hodinu. Každou noc to vezmu všechno znova a doplním, co jsem nestihl během dne. Do Elasticu dělám tři tisíce dotazů za sekundu a Elastic to zvládá.

Pokračování rozhovoru najdete tady.

Osobně můžete potkat Michala Bláhu na konferenci WebTop100 – už 15. listopadu.

Čtěte dále

Jiří Olšanský, Oldřich Štěrba: Twitch je lepší než YouTube.…

Otto Bohuš píše jako pornomagnát, vy budete taky!

E-Business Forum: Ohlédnutí