Informações da Disciplina

 Preparar para impressão 

Júpiter - Sistema de Gestão Acadêmica da Pró-Reitoria de Graduação


Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto
 
Computação e Matemática
 
Disciplina: 5954037 - Fundamentos de Processamento Textual de Informações
Principles of textual information processing

Créditos Aula: 4
Créditos Trabalho: 2
Carga Horária Total: 120 h
Tipo: Semestral
Ativação: 15/07/2021 Desativação:

Objetivos
Capacitar o estudante a aplicar conceitos, metodologias, técnicas e ferramentas para o processamento, a representação e a classificação da informação textual.
 
 
 
Docente(s) Responsável(eis)
2523192 - Alessandra Alaniz Macedo
60683 - Evandro Eduardo Seron Ruiz
 
Programa Resumido
Conceitos gerais de repositório de dados ou informações.
Representação de documentos textuais: bag-of-words, contagens, TF-IDF, N-grams, representação distribuída de palavras. Estruturas de um arquivo invertido.
Avaliação de sistemas de recuperação de informação: coleções de referência, julgamento de relevância, medidas de avaliação.
Processamento básico de texto: expressão regular, tokenização de palavras (normalização textual, stemming, case folding, lematização, morfologia, segmentação de sentenças.
Classificação/indexação automática: árvore de decisão e outros classificadores.
 
 
 
Programa
Apresentação do plano da disciplina 
Avaliação diagnóstica 
Apresentação de conceitos gerais sobre repositório de dados e informações.
Apresentação de estruturas, técnicas e métodos de representação de documentos textuais: bag-of-words, contagens, TF-IDF, N-grams, representação distribuída de palavras. Estruturas de um arquivo invertido.
Apresentação de conceitos de recuperação de informação.
Apresentação de conceitos gerais sobre processamento de texto: expressão regular, tokenização de palavras (normalização textual, stemming, case folding, lematização, morfologia, segmentação de sentenças.
Apresentação de técnicas e métodos de indexação, categorização e classificação.
Realização de prática de representação de repositório ou coleções.
Realização de prática de representação de documentos ou informações textuais. Realização de prática de processamento textual.
Realização de prática de indexação, categorização ou classificação.
 
 
 
Avaliação
     
Método
Aulas teóricas e expositivas, complementadas com exercícios em sala de aula e trabalhos propostos.
Critério
Serão atribuídas notas a provas e a exercícios e/ou trabalhos práticos. A nota final será determinada pela composição das várias notas obtidas pelo aluno no decorrer do semestre, de acordo com critérios estabelecidos pelo docente ministrante, o qual deverá dar ciência aos discentes sobre estes critérios no início do semestre.
Norma de Recuperação
Uma prova escrita dentro do prazo regimental. A nota da segunda avaliação será a média aritmética entre a nota da prova de recuperação e a nota final da primeira avaliação. O aluno será aprovado se obtiver nota na segunda avaliação igual ou superior a 5,0 (cinco).
 
Bibliografia
     
1.	Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Modern Information Retrieval. Addison Wesley; 1st edition, 1999.
2.	Steven Bird, Ewan Klein, and Edward Loper. Natural Language Processing with Python– Analyzing Text with the Natural Language Toolkit, O'Reilly Media, 2009.
3.	Hsinchun Chen, Sherrilynne S. Fuller, Carol Friedman, William Hersh. Medical Informatics: Knowledge Management and Data Mining in Biomedicine, Springer; 1 edition, 2005.
4.	Brownlee, Jason. Deep Learning for Natural Language Processing: Develop Deep Learning Models for your Natural Language Problems. Machine Learning Mastery. ebook. 2017
 

Clique para consultar os requisitos para 5954037

Clique para consultar o oferecimento para 5954037

Créditos | Fale conosco
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP