Universidade Católica de Angola
Faculdade de Engenharia
Curso de Engenharia Informática
Bibliotecas Digitais
2003
Docente:
Joaquim Macedo
Programa resumido
O objectivo fundamental é permitir aos alunos a compreensão dos fundamentos, principais
desafios de investigação e aplicações da área das Bibliotecas Digitais. Esta área multidisciplinar é cada
vez mais importante, sendo objecto de investigação e interesse da indústria
já que se pode considerar que a informação WWW
acessível na Internet é uma Biblioteca Digital gigantesca. Serão
abordados entre outros tópicos:
Arquitectura para BDs. Recuperação
da Informação. Acesso e Busca da Informação em várias línguas. Busca de
Informação Multimédia (Texto, Vídeo, Som, etc..).
Conteúdos:
Parte Teórica |
Data da Sessão |
Leituras& Referências WWW |
Parte Prática |
Aula 1: Bibliotecas
Digitais , Introdução
à Recolha de Informação |
28/7 |
The
Seven Ages of Information Retrieval, by Michael Lesk (1995) |
Aula 1: Busca
na Web 1, Busca na Web 2 |
Aula 2: Texto |
28/7 |
Ilustração
da Lei de ZIPF
Algorimto de
radicalização de Porter |
|
Aula 3: Modelos
de Recolha de Informação |
29/7
30/7 |
F. Crestani, M.Lalmas, C.J. Van Rijsbergen, I.
Campbell, Is This Document
Relevant ? ... Probably : A Survey of Probabilistic Models in Information
Retrieval, ACM Computing Surveys, Vol 30, No. 4, December 1998.
Bayes
Network Toolbox form MatLab HowTo |
Aula 3: Teórico-Prática
sobre Busca de Informação Teorico-Prática
sobre o Modelo Vectorial Teorico-Prática
sobre o Modelo Probabilístico
Exercícios do Prof. Berthier
Ribeiro Neto
|
Aula 5: Ficheiros
Invertidos e Processamento
de Interrogações |
31/7 |
|
Aula 4: Teórica-Prática
sobre Índices Invertidos |
Aula 6: Avaliação
na Busca de Informação |
1/8 |
|
Aula 5: Teórica
Prática sobre Avaliação |
Aula 7: Ranking
e Crawling |
4/8 |
Mercator:
A Scalable, Extensible Web Crawler Graph
Structure on the Web The
Anatomy of a Large-Scale Hypertextual Web Search Engine
PageRank ChangeDetection
Hidden Web
Link struture
analysis |
Aula 6: Exercício
Page Rank |
Aula 8: Busca
de Informação Distribuída e Paralela Um
caso |
5/8 |
Distributed
Information Retrieval by Jamie Callan (2000), is Chapter 5 of Bruce
Croft's Advances in Information Retrieval
Generalizing
GlOSS to Vector-Space Databases and Broker Hierarchies. by Gravano et
al. (Stanford University Tech Note STAN-CS-TN-95-21, May 1995).
Methodologies
for Distributed Information Retrieval, by de Krester et al. (ICDCS
1998)
|
Aula 8: |
Aula 9: Compressão
Áudio, Processamento de Áudio, Busca de Audio |
|
Overview
of Audio IR |
Aula 11: |
Aula 10: Compressão
de Imagem, Compressão de Vídeo, Processamento de Imagem e Vídeo,
Busca de Imagem e Vídeo |
|
Image
Retrieval Survey Image
Retrieval Methods
Vídeo
Indexing and Retrieval Image
and Video
Content-based
Video Retrieval: An overview |
Aula 12:
Busca de
Imagens |
Aula 11: Busca
de Informação Multilingue |
|
|
|
Aula 12: Busca de Informação Multimédia |
|
|
|
Avaliação:
Trabalho Prático Frequência Exame
Resultados da Avaliação
Bibliografia:
MG = Managing Gigabytes, by Witten, Moffat, and Bell.
MIR = Modern
Information Retrieval, by Baeza-Yates and Ribeiro-Neto.
MSS = Multimedia
Signals and Systems,
Mrinal Mandal Kluwer
Academic Publishers, 2003
Robert R. Korfhage. Information Storage and Retrieval, first edition. John
Wiley and Sons, Inc. (1997 ).
Information Retrieval: Data Structures and Algorithms
Edited by William B. Frakes and
Ricardo Baeza-yates, Prentice-Hall, 1992 ISBN: 0-13-463837-9 e
código associado
Ferrramentas:
The Bow Toolkit -- http://www.cs.cmu.edu/~mccallum/bow/
A library of C code useful for writing statistical text
analysis, language modeling and information retrieval programs. The current
distribution includes the library, as well as front-ends for document
classification (rainbow), document retrieval (arrow) and document clustering (crossbow).
[Free]
Bayes Net Toolbox
for Matlab -- http://www.cs.berkeley.edu/~murphyk/bayes/bnt.html
Supports several inference algorithms and learning algorithms.
Allows simulation of static and dynamic networks, including HMMs, IOHMMs, and
Kalman filters.
An Educational
Software Tool for Speech Coding in MATLAB by Dr. Andreas Spanias
and Ted Painter at the Arizona State University Speech and Audio Processing Lab.
Speech Processing Demos
using MATLAB from Tampere University of Technology, Finland.
Source Coding
Matlab Toolbox John Kieffer from the University of Minnesota has
posted a nice library of Matlab code to be used for data compression
Busca de Imagens