Web scraping pro datovou analýzu v Pythonu
![Ilustrační obrázek](https://d33wubrfki0l68.cloudfront.net/355f40baced80cf5664b7ccf2c662bb180932a6b/1b6c0/img/ninja_350.jpg)
Náš kurz Vás naučí jak lze snadno získávat data z webových stránek, které můžete používat k následné analýze anebo reportingu. Příkladem může být analýza kurzu měn, recenzí kaváren nebo cen zboží. Náš kurz Vám ukáže celý postup od identifikace datového zdroje, navržení vhodného scrapingu a přípravy dat pro následnou analýzu.
Nedílnou součástí všech našich kurzů je práce na vlastním projektu (buď budete mít svůj nápad anebo Vám pomůžeme s vymyšlením projektu) pomocí které si ještě prohloubíte a posílíte získané znalosti.
Naučíte se:
- Strukturu HTML
- Jak získat obsah webových stránek (knihovna requests)
- Jak vybrat z tohoto obsahu jenom to, co nás zajímá (knihovna BeautifulSoup)
- Jak následně data zpracovat (knihovna pandas)
Naučím se pracovat s: | Requests, BeautifulSoup, Pandas |
---|---|
Co bych měl(a) umět? | Základy pythonu (skvělé materiály od pyladies zde). |
Co s sebou? | Hlavně dobrou náladu, ale taky notebook (po přijetí do kurzu vám pomůžeme nainstalovat všechny potřebné nástroje) |
Cena | Kontaktujte nás, pokud si přejete zorganizovat tento kurz. |
Napište nám | kurzy@sedlakovi.org |
O lektorech
Nasťa Sedláková Miluji vizualizaci dat! Z genetiky jsem postupně přešla na analyzu nejrůznějších dat, napřiklad burzovní a HR.
V současně době dělám na volné noze konzultanta v oblasti data science a machine learning.
Filip Sedlák Pomáhám firmám s DevOps a se zrychlením vývoje softwaru.
Startupům zase se stabilizací infrastruktury. V minulosti jsem spoluzakládal startup Neuron Soundware a ještě předtím
jsem vyvíjel chemické databáze pro farmaceutické firmy.
Společně se starají o malého zenového mistra (rozumějte syna). Nasťa a Filip během své kariéry pracovali s velkým množstvím různorodých dat: genetická, zvuková, burzovní a finanční.