Skip to main content
Skip header
Terminated in academic year 2009/2010

Documentographic Information Systems

Type of study Follow-up Master
Language of instruction Czech
Code 456-0306/01
Abbreviation DOK
Course title Documentographic Information Systems
Credits 4
Coordinating department Department of Computer Science
Course coordinator prof. RNDr. Václav Snášel, CSc.

Subject syllabus

Přednášky:
Úvod do problematiky informačních systémů.
Historie a vývoj vyhledávání v textech.
Rozdíly mezi faktografickými a dokumentografickými IS.
Algoritmy pro přesné vyhledávání v textech.
Triviální algoritmus.
Algoritmy pro dopředné vyhledávání.
Knuth-Morris-Prattův algoritmus.
Aho-Corasickové algoritmus.
Vyhledávání regulárních výrazů konečnými automaty.
Algoritmy pro nesousměrné vyhledávání.
Algoritmus Boyer-Moorův.
Algoritmus Commentz-Walterové.
Vyhledávací strategie v DIS.
Vektorový model
Pravděpodobnostní strategie
Rozšířená booleovská logika
Latentní sémantika
Neuronové sítě
Genetické algoritmy
Fuzzy množiny
Dokumentografické informační systémy.
Booleovskéké DIS.
Vektorové IS.

Signaturové metody.
Řetězené a vrstvené kódování signatur.
Indexace dokumentů.
Automatická indexace dokumentů.
Výběr indexačních termů.
Stanovení důležitosti termu.
Implementace indexových systémů.
Hypertextové systémy.
Textové a multimediální systémy.
Semistrukturované dokumenty (SGML, HTML, XML)
Indexování multimediálních dat, Extrakce vlastností
Vyhledávání na Webu.
Měření webu
Modelování webu
Vyhledávání pomocí agentů

Cvičení navazuje na přednášky praktickými příklady.
Téma projektu bude zadáno na začátku semestru.


Projekty:
Cíle projektu jsou následující:
1) přehled současného stavu
2) implementace vybraného problému
3) experimenty
4) vyhodnocení experimetů.
Součástí projektu je dokumentace, prezentace zdrojové kódy a data nad nimiž byly provedeny experimety.

Literature

R. Baeza-Yates, B. Ribeiro-Neto. Modern Information Retrieval. Addison Wesley
1999.

Advised literature

R.R.Korfhage. Information Storage and Retrieval. Wiley Computer Publishing. 1997.

I.H.Witten, A.Moffat. T.C.Bell. Managing Gigabytes: Compressing
and Indexing Document and Images. Van Nostrand Reinhold 1994.