Analýza informačních zdrojů
AIZ-5-MP
Název předmětu | Analýza informačních zdrojů (AIZ) |
Garant |
prof. Dr. Ing. Alexandr Štefek |
Katedra | Katedra informatiky a kybernetických operací |
Předmět specializace | NE |
Předmět profilujícího základu | ANO |
Teoretický předmět PZ | NE |
Státní zkouška | NE |
Vícesemestrální předmět |
ANO Navazující semestry předmětu (ročník/semestr): Analýza informačních zdrojů (3/5) Analýza informačních zdrojů (3/6) Analýza informačních zdrojů (4/7) Analýza informačních zdrojů (4/8) Analýza informačních zdrojů (5/9) Analýza informačních zdrojů (5/10) |
Předmět jiné školy | NE |
Volitelnost | Povinný |
Klasifikace | Zápočet |
Kredity | 4 |
Dop. roč./sem. | 4/8 |
Počet týdnů | 12 |
Celkem (h) | Př. | Cv. | Lab. | Sem. | Kurzy | Praxe | Stáže | Soustř. | Exkurze | Terén | SP | Konzultace | PV | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Kvantitativní exploratorní datová analýza (Exploratory data analysis - EDA). Charakteristiky středu, rozptýlenosti, kvantil (percentil, kvartil, decil). Variance, standardní odchylka. Kovariance, korelace.Vizuální (grafická) EDA (histogram, boxplot, bodový graf, bee swarm, ecdf). Uspořádání (tyding). Pivoting & Melting. Integrace a spojování (1:1, 1:N). Agregace a seskupování. | 12 | 4 | 0 | 8 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
Čištění dat pro analýzu. Vynechané hodnoty - doplnění. Redundantní data. Mimořádné hodnoty - detekce, vyhlazení. Příprava a čištění časových řad (vzorkování, frekvence, klouzavý průměr). | 10 | 2 | 0 | 8 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
Příprava datové matice (DataFrame). Indexování. Hierarchický index. Víceúrovňový index. | 8 | 2 | 0 | 6 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
Povinná:
Ondryhal, V. Analýza informačních zdrojů (části I – Databázové systémy (80s), II – Data mining (120s), III. – Algoritmy a datové struktury v Jazyce Python (60s)). Soubor elektronických příruček k předmětu, 260s, 2017
Doporučená:
Elmasri, R., Navathe, S., B., Database systems, Addison-Wesley, 2011. 1172s
Kamber, M., Han, J., Data Mining - Concepts and Techniques, Morgan Kaufmann Publishers, 2006, 770s
Russel, M., A., Mining the Social Web, O’Reilly, 2011, 333s
Marz, N., Warren, J., Big Data, Manning 2015, 308s
Goodrich, M., T., Tamassia, R., Goldwasser M., H., Data Structures & Algorithms, Wiley 2013, 747s
Bing, L. Sentiment Analysis, Cambridge 2015, 368s
Bing, L. Web Data Mining, Springer 2011, 624s
Raschka, S., Python Machine Learning, Packt Publishing 2015, 454s
Ondryhal, V. Analýza informačních zdrojů (části I – Databázové systémy (80s), II – Data mining (120s), III. – Algoritmy a datové struktury v Jazyce Python (60s)). Soubor elektronických příruček k předmětu, 260s, 2017
Doporučená:
Elmasri, R., Navathe, S., B., Database systems, Addison-Wesley, 2011. 1172s
Kamber, M., Han, J., Data Mining - Concepts and Techniques, Morgan Kaufmann Publishers, 2006, 770s
Russel, M., A., Mining the Social Web, O’Reilly, 2011, 333s
Marz, N., Warren, J., Big Data, Manning 2015, 308s
Goodrich, M., T., Tamassia, R., Goldwasser M., H., Data Structures & Algorithms, Wiley 2013, 747s
Bing, L. Sentiment Analysis, Cambridge 2015, 368s
Bing, L. Web Data Mining, Springer 2011, 624s
Raschka, S., Python Machine Learning, Packt Publishing 2015, 454s
5. semestr
Protokoly z LC. Samostatné úlohy v Python a PostreSQL (zápočet).
Zkouška (písemná a ústní část)
6. semestr
Protokoly z LC. Samostatné úlohy v CouchDB, Solr (zápočet)
7. semestr
Protokoly z LC. Samostatné úlohy v Python – Web Scraping (zápočet)
8. semestr
Protokoly z LC. EDA vybraného datového zdroje (zápočet)
9. semestr
Protokoly z LC. Vypracování semestrální úlohy (klasifikovaný zápočet)
10. semestr
Protokoly z LC. Vypracování semestrální úlohy (zápočet). Zkouška (písemná a ústní část)