Bölümler ve birimler bazında ayrıntılı içerik
Вовед, примери за примена на методите на податочно рударење. Типови на податоци. Мерки на сличност и растојание меѓу податоците. Резултати од учење: запознавање со податочното рударење и типовите податоци и со метриките за сличност/растојание меѓу податоците. Техники за претпроцесирање на податоци. Квалитет на податоци, чистење на множества податоци. Детекција и справување со отсутни вредности и атипични вредности (outliers). Интегрирање на податоци. Редукција на димензионалноста, трансформација и дискретизација на
податоци. Резултати од учење: студентите да се запознаат со техниките за претпроцесирање на податоци, справувањето со аномалии кај податоците, интегрирањето и редукција на димензионалноста на податоците. Модели за предикција, регресиони модели. Резултати од учење: запознавање со моделите за предикција и регресионите модели. Надгледувано и ненадгледувано учење. Резултати од учење: студентите да се запознаат со основните категории на учење што се применуваат кај податочното рударење. Кластерирање. Хиерархиско кластерирање. k-means кластерирање. Fuzzy c-means кластерирање. Евалуација на кластерирање. Резултати од учење: студентите да ги совладаат алгоритмите за кластерирање. Класификација. Класификација со дрва на одлучување. Бајесов класификатор. Машини со носечки вектори (SVMs) Асоцијациски правила. Евалуација на модели. Резултати од учење: студентите да ги совладаат техниките на класификацијата. Анализирање на временски серии податоци. Резултати од учење: студентите да се стекнат со знаење за анализа на временски серии податоци. Екстрахирање, трансформирање и зачувување на податоци (Extract, Transform, Load). Резултати од учење: студентите да го совладаат процесот на ETL (екстракција, трансформација и зачувување на податоците). Веб рударење. PageRank алгоритам. Резултати од учењето: студентите да се запознаат со концептите на веб рударењето и на алгоритмите за рангирање на веб страници. Вовед во аналитика на големи количества податоци. Теорија, методи, технологија и алатки за аналитика на големи количества податоци. Примери на MapReduce. Резултати од учење: студентите да се запознаат со својствата на големите количества податоци и аналитиката на големите количества податоци и MapReduce. Работа со актуелни софтверски пакети: Weka, Orange, RapidMiner, Matlab toolbox-и, R и R пакети, Hadoop, SAP HANA. Резултати од учење: студентите да научат да работат со актуелните софтверски пакети за податочно рударење и аналитика на големи количества податоци.
