Analýza informačních zdrojů AIZ-5-MP
Název předmětu Analýza informačních zdrojů (AIZ)
Garant prof. Dr. Ing. Alexandr Štefek
Katedra Katedra informatiky a kybernetických operací
Předmět specializace NE
Předmět profilujícího základu ANO
Teoretický předmět PZ NE
Státní zkouška NE
Vícesemestrální předmět ANO

Navazující semestry předmětu (ročník/semestr):
Analýza informačních zdrojů (3/5)
Analýza informačních zdrojů (3/6)
Analýza informačních zdrojů (4/7)
Analýza informačních zdrojů (4/8)
Analýza informačních zdrojů (5/9)
Analýza informačních zdrojů (5/10)
Předmět jiné školy NE
Volitelnost Povinný
Klasifikace Klasifikovaný zápočet
Kredity 4
Dop. roč./sem. 5/9
Počet týdnů 12
Celkem (h) Př. Cv. Lab. Sem. Kurzy Praxe Stáže Soustř. Exkurze Terén SP Konzultace PV
Data mining. Vzory v datech. Metody. Úlohy. Proces. Standardizace. Etika. 4 4 0 0 0 0 0 0 0 0 0 0 0 0
Nesupervizované učení. Seskupování. Segmentace. Reprezentace skupin. Algoritmy - k-means, k-mode, hierarchické seskupování, metody založené na hustotě (DBSCAN). Evaluace - koeficient Silhouette, indexy (Dunn, Davies-Bouldin). 10 2 0 8 0 0 0 0 0 0 0 0 0 0
Supervizované učení - klasifikace. Cílový atribut. Klasifikační modely. Rozhodovací stromy - algoritmus sestavení stromu, funkce impurity, informační zisk. Pravděpodobnostní (naivní bayesovský) klasifikátor. Logistická regrese - šance, logit, pravděpodobnost. Perceptron. SVM (Support Vector Machine). kNN (k-nearest neighbors). 20 6 2 12 0 0 0 0 0 0 0 0 0 0
Lineární regrese. Metoda nejmenších čtverců. Konfidenční intervaly. Bootstrap. Nelineární regrese. Regularizace. 6 2 0 4 0 0 0 0 0 0 0 0 0 0
Asociační pravidla (rule-based learning). Podpora a spolehlivost. Frekventovaná skupina. Algoritmus Apriori. 6 2 0 4 0 0 0 0 0 0 0 0 0 0
Evaluace analytických modelů. Trénovací a testovací množina, křížová validace, Leave-one-out, Matice záměn. Přesnost, úplnost. Celková úspěšnost, koeficient chyby. F-score, Kappa. ROC křivka. 14 4 2 8 0 0 0 0 0 0 0 0 0 0
Povinná:
Ondryhal, V. Analýza informačních zdrojů (části I – Databázové systémy (80s), II – Data mining (120s), III. – Algoritmy a datové struktury v Jazyce Python (60s)). Soubor elektronických příruček k předmětu, 260s, 2017

Doporučená:
Elmasri, R., Navathe, S., B., Database systems, Addison-Wesley, 2011. 1172s
Kamber, M., Han, J., Data Mining - Concepts and Techniques, Morgan Kaufmann Publishers, 2006, 770s
Russel, M., A., Mining the Social Web, O’Reilly, 2011, 333s
Marz, N., Warren, J., Big Data, Manning 2015, 308s
Goodrich, M., T., Tamassia, R., Goldwasser M., H., Data Structures & Algorithms, Wiley 2013, 747s
Bing, L. Sentiment Analysis, Cambridge 2015, 368s
Bing, L. Web Data Mining, Springer 2011, 624s
Raschka, S., Python Machine Learning, Packt Publishing 2015, 454s

5. semestr
Protokoly z LC. Samostatné úlohy v Python a PostreSQL (zápočet).
Zkouška (písemná a ústní část)
6. semestr
Protokoly z LC. Samostatné úlohy v CouchDB, Solr (zápočet)
7. semestr
Protokoly z LC. Samostatné úlohy v Python – Web Scraping (zápočet)
8. semestr
Protokoly z LC. EDA vybraného datového zdroje (zápočet)
9. semestr
Protokoly z LC. Vypracování semestrální úlohy (klasifikovaný zápočet)
10. semestr
Protokoly z LC. Vypracování semestrální úlohy (zápočet). Zkouška (písemná a ústní část)