Web scraping pro datovou analýzu v Pythonu
, Praha — učí Nasťa Sedláková, Filip SedlákNáš kurz Vás naučí jak lze snadno získávat data z webových stránek, které můžete používat k následné analýze anebo reportingu. Příkladem může být analýza kurzu měn, recenzí kaváren nebo cen zboží. Náš kurz Vám ukáže celý postup od identifikace datového zdroje, navržení vhodného scrapingu a přípravy dat pro následnou analýzu.
Nedílnou součástí všech našich kurzů je práce na vlastním projektu (buď budete mít svůj nápad anebo Vám pomůžeme s vymyšlením projektu) pomocí které si ještě prohloubíte a posílíte získané znalosti.
Naučíte se:
- Strukturu HTML
- Jak získat obsah webových stránek (knihovna requests)
- Jak vybrat z tohoto obsahu jenom to, co nás zajímá (knihovna BeautifulSoup)
- Jak následně data zpracovat (knihovna pandas)
Naučím se pracovat s: | Requests, BeautifulSoup, Pandas |
---|---|
Co bych měl(a) umět? | Základy pythonu (skvělé materiály od pyladies zde). |
Co s sebou? | Hlavně dobrou náladu, ale taky notebook (po přijetí do kurzu vám pomůžeme nainstalovat všechny potřebné nástroje) |
Cena | Kontaktujte nás, pokud si přejete zorganizovat tento kurz. |
Napište nám | kurzy@sedlakovi.org |
O lektorech
Nasťa Sedláková Miluji vizualizaci dat! Z genetiky jsem postupně přešla na analyzu nejrůznějších dat, napřiklad burzovní a HR. V současně době dělám na volné noze konzultanta v oblasti data science a machine learning.
Filip Sedlák Pomáhám firmám s DevOps a se zrychlením vývoje softwaru. Startupům zase se stabilizací infrastruktury. V minulosti jsem spoluzakládal startup Neuron Soundware a ještě předtím jsem vyvíjel chemické databáze pro farmaceutické firmy.
Společně se starají o malého zenového mistra (rozumějte syna). Nasťa a Filip během své kariéry pracovali s velkým množstvím různorodých dat: genetická, zvuková, burzovní a finanční.