Apresentar os fundamentos da recuperação de informação, abordando questões relevantes à arquiteturas, dados e informação, análise de conteúdo, busca textual, indexação, processamento de texto e avaliação de sistemas de recuperação. Analisar e desenvolver ferramentas e aplicações, como as presentes em sistemas atuais, aplicando a teoria de modo prático.
Histórico e terminologia. Caracterização do problema da recuperação. O processo de recuperação. Modelos de recuperação. Avaliação de sistemas de recuperação textual. Indexação e busca textual. Processamento e agrupamento de documentos. Busca na web.
Histórico e terminologia. Caracterização do problema da recuperação: o problema de Recuperação de Informação; o sistema de Recuperação de Informação, a Web. O processo de recuperação. Modelos de recuperação: modelagem e ranking, o modelo clássico, modelos alternativos. Avaliação de sistemas de recuperação textual: métricas, coleções de referência, avaliação baseada em usuários. Indexação e busca textual. Processamento e agrupamento de documentos. Busca na web. Atividades de Extensão: Os estudantes podem realizar projetos em grupo para conscientização da população sobre algoritmos de recuperação de informação e seus impactos no uso da tecnologia do dia-a-dia, incluindo motores de busca, indexação textual, sistemas de recomendação em redes sociais, propagandas e anúncios. Há vários temas que podem ser vistos sob esta ótica. A realização de cursos para a sociedade, palestras e produção de conteúdo são candidatos. Carga horária: 10 horas.
Livros texto - Ricardo A. Baeza-Yates and Berthier Ribeiro-Neto. 2012. Modern Information Retrieval. 2nd edition. ACM Press Books. - Ricardo A. Baeza-Yates and Berthier Ribeiro-Neto. 2013. Recuperação de Informação - Conceitos e Tecnologia das Máquinas de Busca. 2a. edição. Bookman. Bibliografia complementar Artigos de conferências e periódicos da área.