diff --git a/courses/info.yml b/courses/info.yml index 980c586e0a..a1490c92a2 100644 --- a/courses/info.yml +++ b/courses/info.yml @@ -1,4 +1,3 @@ order: - pyladies - mi-pyt -- pydata diff --git a/courses/pydata/info.yml b/courses/pydata/info.yml deleted file mode 100644 index 55bc0934cf..0000000000 --- a/courses/pydata/info.yml +++ /dev/null @@ -1,42 +0,0 @@ -title: Kurz datové analýzy -description: Naučte se využít Python a nástroje pro něj napsané k datové analytice -long_description: | - - Materiály pro kurz datové analytiky v Pythonu tvořené ve spolupráci komunit - PyLadies a PyData. Materiály předpokládají znalost Pythonu na úrovni absolventů - začátečnického kurzu (PyLadies). - -canonical: true -vars: - coach-present: false -plan: -- title: Instalace a práce s Jupyter notebookem - slug: install - materials: - - lesson: pydata/install - - lesson: pydata/notebook - -- title: Základy práce s tabulkovými daty - slug: pandas - materials: - - lesson: pydata/pandas - -- title: Explorační datová analýza a analýza jedné proměnné - slug: pandas - materials: - - lesson: pydata/univariate - -- title: EDA - Analýza více proměnných a vztahů - slug: pandas - materials: - - lesson: pydata/multivariate - -- title: EDA - Nulové hodnoty a odlehlá pozorování - slug: pandas - materials: - - lesson: pydata/null_and_outliers - -- title: EDA - Pandas profiling - slug: pandas_profiling - materials: - - lesson: pydata/profiling diff --git a/lessons/pydata/eda-univariate-timeseries/index.ipynb b/lessons/pydata/eda-univariate-timeseries/index.ipynb index 11415cfb99..d61643d676 100644 --- a/lessons/pydata/eda-univariate-timeseries/index.ipynb +++ b/lessons/pydata/eda-univariate-timeseries/index.ipynb @@ -83,9 +83,9 @@ "\n", "Takto vypadají náhledy dvou listů ze souboru `P1PRUZ01.xls`, který obsahuje historická data z meteorologických měření v Praze - Ruzyni. Data jsou poměrně nepěkně uspořádána. Ani v Excelu by se s těmito soubory nepracovalo dobře ...\n", "\n", - "![thumb_geografie.png](static/thumb_geografie.png \"Sheet 1\")\n", + "![thumb_geografie.png](static/thumb_geografie.png)\n", "\n", - "![thumb_teplota.png](static/thumb_teplota.png \"Sheet 2\")" + "![thumb_teplota.png](static/thumb_teplota.png)" ] }, { @@ -3341,7 +3341,7 @@ "* `mean` je střední hodnota, vypočítaná jako aritmetický průměr. \n", "* `std` je směrodatná odchylka, která ukazuje rozptyl dat - jak moc můžeme očekávat, že se data v souboru budou lišit od střední hodnoty.\n", "* `min` a `max` jsou nejmenší a největší hodnoty ve sloupci.\n", - "* Procenta označují kvantily, `25%` a `75%` je hodnota prvního a třetího \"kvartilu\". Pokud bychom sloupec seřadili podle podle velikosti, bude čtvrtina dat menší než hodnota prvního kvartilu a čtvrtina dat bude větší než hodnota třetího kvartilu. Konkrétně čtvrtina všech dní v našich datech měla minimální teplotu menší než 2.7 °C a čtvrtina dní zase měla maximální teplotu větší než 20.5 °C. \n", + "* Procenta označují kvantily, `25%` a `75%` je hodnota prvního a třetího \"kvartilu\". Pokud bychom sloupec seřadili podle podle velikosti, bude čtvrtina dat menší než hodnota prvního kvartilu a čtvrtina dat bude větší než hodnota třetího kvartilu. Konkrétně čtvrtina všech dní v našich datech měla minimální teplotu menší než -0.7 °C a čtvrtina dní zase měla maximální teplotu větší než 20.5 °C. \n", "* `50%` se označuje jako medián - polovina dat je menší než medián (a ta druhá polovina je samozřejmě zase větší než medián).\n", "\n", "Za chvilku si ještě ukážeme, jak tyto hodnoty souvisi s distribuční funkcí a vše ti bude hned jasnější :)"