Přednášky:
Úvod do problematiky informačních systémů.
Historie a vývoj vyhledávání v textech.
Rozdíly mezi faktografickými a dokumentografickými IS.
Algoritmy pro přesné vyhledávání v textech.
Triviální algoritmus.
Algoritmy pro dopředné vyhledávání.
Knuth-Morris-Prattův algoritmus.
Aho-Corasickové algoritmus.
Vyhledávání regulárních výrazů konečnými automaty.
Algoritmy pro nesousměrné vyhledávání.
Algoritmus Boyer-Moorův.
Algoritmus Commentz-Walterové.
Vyhledávací strategie v DIS.
Vektorový model
Pravděpodobnostní strategie
Rozšířená booleovská logika
Latentní sémantika
Neuronové sítě
Genetické algoritmy
Fuzzy množiny
Dokumentografické informační systémy.
Booleovskéké DIS.
Vektorové IS.
Signaturové metody.
Řetězené a vrstvené kódování signatur.
Indexace dokumentů.
Automatická indexace dokumentů.
Výběr indexačních termů.
Stanovení důležitosti termu.
Implementace indexových systémů.
Hypertextové systémy.
Textové a multimediální systémy.
Semistrukturované dokumenty (SGML, HTML, XML)
Indexování multimediálních dat, Extrakce vlastností
Vyhledávání na Webu.
Měření webu
Modelování webu
Vyhledávání pomocí agentů
Cvičení navazuje na přednášky praktickými příklady.
Téma projektu bude zadáno na začátku semestru.
Projekty:
Cíle projektu jsou následující:
1) přehled současného stavu
2) implementace vybraného problému
3) experimenty
4) vyhodnocení experimetů.
Součástí projektu je dokumentace, prezentace zdrojové kódy a data nad nimiž byly provedeny experimety.
Úvod do problematiky informačních systémů.
Historie a vývoj vyhledávání v textech.
Rozdíly mezi faktografickými a dokumentografickými IS.
Algoritmy pro přesné vyhledávání v textech.
Triviální algoritmus.
Algoritmy pro dopředné vyhledávání.
Knuth-Morris-Prattův algoritmus.
Aho-Corasickové algoritmus.
Vyhledávání regulárních výrazů konečnými automaty.
Algoritmy pro nesousměrné vyhledávání.
Algoritmus Boyer-Moorův.
Algoritmus Commentz-Walterové.
Vyhledávací strategie v DIS.
Vektorový model
Pravděpodobnostní strategie
Rozšířená booleovská logika
Latentní sémantika
Neuronové sítě
Genetické algoritmy
Fuzzy množiny
Dokumentografické informační systémy.
Booleovskéké DIS.
Vektorové IS.
Signaturové metody.
Řetězené a vrstvené kódování signatur.
Indexace dokumentů.
Automatická indexace dokumentů.
Výběr indexačních termů.
Stanovení důležitosti termu.
Implementace indexových systémů.
Hypertextové systémy.
Textové a multimediální systémy.
Semistrukturované dokumenty (SGML, HTML, XML)
Indexování multimediálních dat, Extrakce vlastností
Vyhledávání na Webu.
Měření webu
Modelování webu
Vyhledávání pomocí agentů
Cvičení navazuje na přednášky praktickými příklady.
Téma projektu bude zadáno na začátku semestru.
Projekty:
Cíle projektu jsou následující:
1) přehled současného stavu
2) implementace vybraného problému
3) experimenty
4) vyhodnocení experimetů.
Součástí projektu je dokumentace, prezentace zdrojové kódy a data nad nimiž byly provedeny experimety.