Atividade

96019 - Métodos de Agrupamento em Processamento de Línguas Naturais (PLN) usando Python

Período:
Quarta 14:00 às 16:00
 
Descrição: Programa:

1. Dia 01 - 2 horas
- Ambiente Google Colab
- Instalação e configuração NLPNet

2. Dia 02 - 2 horas
- Introdução Pandas
- Introdução Scikit Learn
- Dataset PorSimplesSent

3. Dia 03 - 2 horas
- Gerando features: TFIDF e LSA
- K-Means
- Agglomerative Clustering
- Datasets PorSimplesSent e brWaC

4. Dia 04 - 2 horas
- Elbow Method
- Silhouette
- V-Measure
- Datasets PorSimplesSent e RastrOS

Bibliografia:
https://scikit-learn.org/stable/modules/clustering.html
https://pandas.pydata.org/pandas-docs/stable/getting_started/tutorials.html
http://nilc.icmc.usp.br/nlpnet/intro.html
https://jtemporal.com/kmeans-and-elbow-method/
https://machinelearningmastery.com/clustering-algorithms-with-python/
https://github.com/sidleal/porsimplessent
https://www.inf.ufrgs.br/pln/wiki/index.php?title=BrWaC
http://www.nilc.icmc.usp.br/nilc/index.php/rastros

Carga Horária:

8 horas
Tipo: Obrigatória
Vagas oferecidas: 90
 
Ministrantes: Sidney Evaldo Leal


 
 voltar

Créditos
© 1999 - 2020 - Superintendência de Tecnologia da Informação/USP