Přeskočit na hlavní obsah
Přeskočit hlavičku
Terminated in academic year 2009/2010

Dokumentografické informační systémy

Typ studia navazující magisterské
Jazyk výuky čeština
Kód 456-0306/01
Zkratka DOK
Název předmětu česky Dokumentografické informační systémy
Název předmětu anglicky Documentographic Information Systems
Kreditů 4
Garantující katedra Katedra informatiky
Garant předmětu prof. RNDr. Václav Snášel, CSc.

Subject syllabus

Přednášky:
Úvod do problematiky informačních systémů.
Historie a vývoj vyhledávání v textech.
Rozdíly mezi faktografickými a dokumentografickými IS.
Algoritmy pro přesné vyhledávání v textech.
Triviální algoritmus.
Algoritmy pro dopředné vyhledávání.
Knuth-Morris-Prattův algoritmus.
Aho-Corasickové algoritmus.
Vyhledávání regulárních výrazů konečnými automaty.
Algoritmy pro nesousměrné vyhledávání.
Algoritmus Boyer-Moorův.
Algoritmus Commentz-Walterové.
Vyhledávací strategie v DIS.
Vektorový model
Pravděpodobnostní strategie
Rozšířená booleovská logika
Latentní sémantika
Neuronové sítě
Genetické algoritmy
Fuzzy množiny
Dokumentografické informační systémy.
Booleovskéké DIS.
Vektorové IS.

Signaturové metody.
Řetězené a vrstvené kódování signatur.
Indexace dokumentů.
Automatická indexace dokumentů.
Výběr indexačních termů.
Stanovení důležitosti termu.
Implementace indexových systémů.
Hypertextové systémy.
Textové a multimediální systémy.
Semistrukturované dokumenty (SGML, HTML, XML)
Indexování multimediálních dat, Extrakce vlastností
Vyhledávání na Webu.
Měření webu
Modelování webu
Vyhledávání pomocí agentů

Cvičení navazuje na přednášky praktickými příklady.
Téma projektu bude zadáno na začátku semestru.


Projekty:
Cíle projektu jsou následující:
1) přehled současného stavu
2) implementace vybraného problému
3) experimenty
4) vyhodnocení experimetů.
Součástí projektu je dokumentace, prezentace zdrojové kódy a data nad nimiž byly provedeny experimety.

Literature

J.Pokorný, V.Snášel, D.Húsek.Dokumentografické informační systémy. Karolinum,
Skriptum MFF UK Praha, 1998, ISBN 80-7184-764-X. pp 158.
B.Melichar. Textové informační systémy. Skriptum ČVUT, Praha 1994.
R. Baeza-Yates, B. Ribeiro-Neto. Modern Information Retrieval. Addison Wesley
1999.

Advised literature

R.R.Korfhage. Information Storage and Retrieval. Wiley Computer Publishing. 1997.

I.H.Witten, A.Moffat. T.C.Bell. Managing Gigabytes: Compressing
and Indexing Document and Images. Van Nostrand Reinhold 1994.