Universidade Católica de Angola

Faculdade de Engenharia

Curso de Engenharia Informática

Bibliotecas Digitais

 2003

Docente:

 Joaquim Macedo

Programa resumido

 

O objectivo fundamental é permitir aos alunos   a compreensão dos fundamentos,  principais desafios  de investigação e aplicações da área  das Bibliotecas Digitais. Esta área multidisciplinar é cada vez mais importante, sendo objecto de investigação e interesse da indústria  já que se pode considerar que a informação WWW  acessível na Internet é uma Biblioteca Digital gigantesca. Serão abordados entre outros tópicos:

  Arquitectura  para BDs. Recuperação da Informação. Acesso e Busca da Informação em várias línguas. Busca de Informação Multimédia (Texto, Vídeo, Som, etc..). 

 

Conteúdos:

Parte Teórica Data da Sessão  Leituras& Referências WWW  Parte Prática
Aula 1: Bibliotecas Digitais , Introdução à Recolha de Informação       28/7 The Seven Ages of Information Retrieval, by Michael Lesk (1995) Aula 1: Busca na Web 1, Busca na Web 2
Aula 2: Texto      28/7 Ilustração da Lei de ZIPF

Algorimto de radicalização de Porter

Aula 3:  Modelos de Recolha de Informação 29/7

30/7

F. Crestani, M.Lalmas, C.J. Van Rijsbergen, I. Campbell, Is This Document Relevant ? ... Probably : A Survey of Probabilistic Models in Information Retrieval, ACM Computing Surveys, Vol 30, No. 4, December 1998.

Bayes Network Toolbox form MatLab HowTo

Aula 3: Teórico-Prática sobre Busca de Informação  Teorico-Prática sobre o Modelo Vectorial    Teorico-Prática sobre o Modelo Probabilístico

Exercícios do Prof. Berthier Ribeiro Neto 

Aula 5: Ficheiros Invertidos e Processamento de Interrogações 31/7  Aula 4: Teórica-Prática sobre Índices Invertidos
Aula 6: Avaliação na Busca de Informação 1/8  Aula 5: Teórica Prática sobre Avaliação
Aula 7:  Ranking e Crawling 4/8 Mercator: A Scalable, Extensible Web Crawler Graph Structure on the Web  The Anatomy of a Large-Scale Hypertextual Web Search Engine     PageRank ChangeDetection Hidden Web               Link struture analysis Aula 6: Exercício Page Rank 
Aula 8:  Busca de Informação Distribuída e Paralela  Um caso 5/8  Distributed Information Retrieval by Jamie Callan (2000), is Chapter 5 of Bruce Croft's Advances in Information Retrieval 
Generalizing GlOSS to Vector-Space Databases and Broker Hierarchies. by Gravano et al. (Stanford University Tech Note STAN-CS-TN-95-21, May 1995).
Methodologies for Distributed Information Retrieval, by de Krester et al. (ICDCS 1998)
Aula 8: 
Aula 9: Compressão Áudio, Processamento de Áudio, Busca de Audio   Overview of Audio IR Aula 11:
Aula 10:  Compressão de Imagem, Compressão de Vídeo, Processamento de Imagem e Vídeo, Busca de Imagem  e Vídeo   Image Retrieval Survey Image Retrieval Methods

Vídeo Indexing and Retrieval  Image and Video 

Content-based Video Retrieval: An overview

Aula 12: 

 Busca de Imagens 

Aula 11:  Busca de Informação Multilingue
Aula 12: Busca de Informação Multimédia

Avaliação: 

                  Trabalho Prático Frequência    Exame   Resultados da Avaliação

 

Bibliografia:

MG = Managing Gigabytes, by Witten, Moffat, and Bell. 
MIR = Modern Information Retrieval, by Baeza-Yates and Ribeiro-Neto. 

MSS = Multimedia Signals and Systems, Mrinal Mandal Kluwer Academic Publishers, 2003

Robert R. Korfhage. Information Storage and Retrieval, first edition. John Wiley and Sons, Inc. (1997 ).

INFORMATION RETRIEVAL, Livro em linha de    C. J. van RIJSBERGEN

Information Retrieval: Data Structures and Algorithms Edited by William B. Frakes and                                                                        Ricardo Baeza-yates, Prentice-Hall, 1992 ISBN: 0-13-463837-9 e código associado

Ferrramentas:


The Bow Toolkit -- http://www.cs.cmu.edu/~mccallum/bow/
   A library of C code useful for writing statistical text analysis, language modeling and information retrieval programs. The current distribution includes the library, as well as front-ends for document classification (rainbow), document retrieval (arrow) and document clustering (crossbow). [Free]

Bayes Net Toolbox for Matlab -- http://www.cs.berkeley.edu/~murphyk/bayes/bnt.html
   Supports several inference algorithms and learning algorithms. Allows simulation of static and dynamic networks, including HMMs, IOHMMs, and Kalman filters.

An Educational Software Tool for Speech Coding in MATLAB by Dr. Andreas Spanias
and Ted Painter at the Arizona State University Speech and Audio Processing Lab.

Speech Processing Demos using MATLAB from Tampere University of Technology, Finland.

Source Coding Matlab Toolbox   John Kieffer from the University of Minnesota has posted a nice library of Matlab code to be used for data compression

 

Busca de Imagens