
Pesquisa e Publicação de Informação
Código
82043
Unidade Orgânica
Instituto Superior de Estatística e Gestão de Informação
Créditos
6.0
Professor responsável
Vítor Manuel Pereira Duarte dos Santos
Horas semanais
45.0
Língua de ensino
Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês
Objectivos
Esta unidade curricular visa familiarizar os alunos com os aspectos fundamentais da publicação de informação estruturada (linguagens de markup), bem como de pesquisa e recuperação da informação. No âmbito da publicação de informação, os alunos deverão ser capazes de especificar documentos XML, proceder à sua validação, estilização e transformação. No âmbito da pesquisa e recuperação de informação, os alunos deverão ser capazes de discutir e avaliar diferentes modelos de representação de colecções documentais, estar familiarizados com as noções básicas de pesquisa e indexação, e serem capazes de avaliar a performance de sistemas de pesquisa. Os alunos deverão ainda apreender as noções fundamentais sobre pesquisa, extracção e indexação de documentos na web, expansão de queries e análise de relevância de resultados. Finalmente, deverão ter noções básicas de processamento de linguagem natural para categorização documental.
Pré-requisitos
Não se aplica.
Conteúdo
Parte 1 - Publicação de informação
Linguagens de marcação SGML, XML
Exemplos de linguagem XML: XHTML, SVG, MathML e RSS
Validação de documentos XML utilizando uma DTD
Validação de documentos XML utilizando uma XML-Schema (XSD)
Estilização de documentos XML através de CSS
Linguagens de transformação para XML: XSL e XSL-FO
Parte 2 - Pesquisa de informação
Modelos matemáticos para representação de colecções de documentos de texto. Modelos Booleanos e de Espaços Vectoriais
Indexação e pesquisa de documentos de texto
Avaliação de sistemas de pesquisa de informação
Operações sobre queries: expansão de queries
Pesquisa na web
Extracção e indexação de documentos da WWW
Análise topológica de um grafo de documentos hiperligados para determinação de relevância documental.
Exploração de métodos relevantes do processamento da linguagem natural para a pesquisa de informação: aglomeração e categorização documental.
Bibliografia
Harold, E. R. e Means, W. S., XML is a Nutshell, O’Reilly, 2004, ISBN: 0-596-00764-7
Baeza-Yeates, R. e Ribeiro-Neto, B. Modern Information Retrieval, Addison-Wiley, New York, 1999, ISBN: 0-7923-8271-4
Mangano, S. XSLT Cookbook, O’Reilly, 2006 (2ª edição), ISBN: 0-596-00974-7
Método de ensino
A disciplina baseia-se em aulas teóricas e aulas práticas. A parte prática está orientada para a resolução de problemas e exercícios. Existem igualmente dois mini-projectos que deverão ser realizados em grupos de dois alunos fora do período das aulas. Algumas aulas práticas poderão ser usadas como aulas de apoio aos projectos.
Método de avaliação
Avaliação formativa ao longo da unidade curricular: dois testes (ou um exame) e dois mini-projectos a realizar no período de aulas com a ponderação de 1/4 cada um.