Docente

Enquadramento

Objectivos

Programa

Organização da disciplina

Avaliação

Bibliografia

   

Informação em Rede


Ano lectivo 2001/2002

Docente



Cursos em que é leccionada:

    Mestrado em Informática (cadeira de opção)

    Curso de Especialização em Informática (cadeira de opção)



Enquadramento

O grande volume de informação produzidos pelas várias organizações e pelas pessoas individualmente, já não se compadece com os arquivos tradicionais em papel, quer pelo seu volume quer pelo tempo necessário para localizar e aceder. É muito mais atractivo armazenar e aceder a informação em suporte digital. A maior parte de informação que se produz todos os dias é disponibilizada em formato não estruturado ou semi-estruturado, que não se compadece com as Bases de Dados convencionais: texto, imagens video, som e documentos multimedia.

Isto faz com que esteja cada vez mais na ordem do dia as tecnologias de pesquisa de armazenamento de informação que até aqui estavam limitadas a uma utilização mais especializada.

Existem duas abordagens complementares à localização e acesso a informação que são a Pesquisa de Informação (Information Retrieval) e Filtragem de Informação (Information Filtering).

A pesquisa está preocupada com colecção e organização de documentos, a filtragem dedica-se à distribuição de documentos a grupos ou indivíduos.

Enquanto a pesquisa está tipicamente ligada com a selecção de documentos duma base de dados relativamente estática, a filtragem está preocupada com a seleccao ou eliminação de documentos dum fluxo dinâmico de dados.

A pesquisa preocupa-se com necessidades esporádicas de informação enquanto a filtragem cobre necessidades de informação mais permanentes.



Objectivos

A recuperação e armazenamento de texto não estruturado e mesmo de documentos multimédia constitui uma tecnologia por si independente, embora complementar, da tecnologia de bases de dados. Isto embora estas duas tecnologias sejam muitas vezes confundidas.

Esse aspecto está ilustrado na tabela 1 retirada de (Frakes and Baeza-Yates 1992, p. 9.)

 
Tabela 1:   Comparação entre Bases de Dados, Bases de Conhecimento e Sistemas de IR
  Objecto de dados Operação principal Tamanho da BD
IR documento Pesquisa (probablística) pequena a muito grande
Bases de Dados tabela Pesquisa (determinística) pequena a muito grande
Bases de Conhecimento regra Inferência normalmente pequena

Assim, torna-se necessário introduzir o seu estudo no curriculum dos vários cursos de informática. Os tópicos a estudar correspondem aos modelos subjacentes aos sistemas de recuperação de informação e técnicas usadas na sua concretização.

O objectivo desta disciplina é estudar a tecnologia de suporte à recuperação e à filtragem de informação.


Programa

    1.
    Introdução
    2.
    Modelos para recuperação de informação
    3.
    Avaliação da recuperação de informação
    4.
    Processamento de Interrogações
    5.
    Processamento de Textos
    6.
    Indexação
    7.
    Recuperação distribuída da informação
    8.
    Interfaces de utilização e visualização
    9.
    Recuperação de informação multimedia
    10.
    Recuperação de informação na Web
    11.
    Bibliotecas Digitais

Programa detalhado



Organização da Disciplina

A disciplina está organizada num conjunto de aulas teóricas e aulas práticas de laboratório.



Avaliação

Nota= 0.6 * NT + 0.4* NP

1.
Nota teórica (NT), por prova escrita, de acordo com regulamento em vigor.
2.
Nota prática (NP) de acordo com trabalhos práticos realizados



Bibliografia

  • Fundamental
    1.
    William B.Frakes and Ricardo Baeza-Yates, Editors, Modern Information Retrieval, Prentice Hall, 1998.
    2.
    Karen Sparck Jones and Peter Willet, Readings on Information Retrieval, Morgan Kauffman Publishers, 1997.
    3.
    Textos de apoio disponibilizados pelo docente.
  • Complementar
    1.
    Robert R. Korphage, Information Storage and Retrieval, John Wiley & Sons, 1997.
    2.
    William B.Frakes and Ricardo Baeza-Yates, Editors, Information Retrieval: Data Structures and Algorithms, Prentice Hall, 1992.
    3.
    Ian H. Witten, Alistair Moffat and Timothy C.Bell, Managing Gigabytes: Compressinga nd Indexing Documents and Images, International Thomson Publishing, 1994.
    4.
    Gerald Kowalski, Information Retrieval Systems: Theory and Implementation, Kluwer Academic Publishers, 1997.
    5.
    Peter Schaube, Multimedia Information Retrieval: Content Based Information Retrieval from Large Text and Audio Databases, Kluwer Academic Publishers, 1997.


Joaquim Macedo
3/7/2001