Web scraping pro datovou analýzu v Pythonu

Ilustrační obrázek ,
Praha
— učí Nasťa Sedláková, Filip Sedlák

Náš kurz Vás naučí jak lze snadno získávat data z webových stránek, které můžete používat k následné analýze anebo reportingu. Příkladem může být analýza kurzu měn, recenzí kaváren nebo cen zboží. Náš kurz Vám ukáže celý postup od identifikace datového zdroje, navržení vhodného scrapingu a přípravy dat pro následnou analýzu.

Nedílnou součástí všech našich kurzů je práce na vlastním projektu (buď budete mít svůj nápad anebo Vám pomůžeme s vymyšlením projektu) pomocí které si ještě prohloubíte a posílíte získané znalosti.

Naučíte se:

  • Strukturu HTML
  • Jak získat obsah webových stránek (knihovna requests)
  • Jak vybrat z tohoto obsahu jenom to, co nás zajímá (knihovna BeautifulSoup)
  • Jak následně data zpracovat (knihovna pandas)

Naučím se pracovat s: Requests, BeautifulSoup, Pandas
Co bych měl(a) umět? Základy pythonu (skvělé materiály od pyladies zde).
Co s sebou? Hlavně dobrou náladu, ale taky notebook (po přijetí do kurzu vám pomůžeme nainstalovat všechny potřebné nástroje)
Cena

Kontaktujte nás, pokud si přejete zorganizovat tento kurz.

Napište nám kurzy@sedlakovi.org

O lektorech

Nasťa Sedláková Nasťa Sedláková Miluji vizualizaci dat! Z genetiky jsem postupně přešla na analyzu nejrůznějších dat, napřiklad burzovní a HR. V současně době dělám na volné noze konzultanta v oblasti data science a machine learning.

Filip Sedlák Filip Sedlák Pomáhám firmám s DevOps a se zrychlením vývoje softwaru. Startupům zase se stabilizací infrastruktury. V minulosti jsem spoluzakládal startup Neuron Soundware a ještě předtím jsem vyvíjel chemické databáze pro farmaceutické firmy.

Společně se starají o malého zenového mistra (rozumějte syna). Nasťa a Filip během své kariéry pracovali s velkým množstvím různorodých dat: genetická, zvuková, burzovní a finanční.