96019 - Métodos de Agrupamento em Processamento de Línguas Naturais (PLN) usando Python |
Período: |
|
||
|
|||
Descrição: | Programa:
1. Dia 01 - 2 horas - Ambiente Google Colab - Instalação e configuração NLPNet 2. Dia 02 - 2 horas - Introdução Pandas - Introdução Scikit Learn - Dataset PorSimplesSent 3. Dia 03 - 2 horas - Gerando features: TFIDF e LSA - K-Means - Agglomerative Clustering - Datasets PorSimplesSent e brWaC 4. Dia 04 - 2 horas - Elbow Method - Silhouette - V-Measure - Datasets PorSimplesSent e RastrOS Bibliografia: https://scikit-learn.org/stable/modules/clustering.html https://pandas.pydata.org/pandas-docs/stable/getting_started/tutorials.html http://nilc.icmc.usp.br/nlpnet/intro.html https://jtemporal.com/kmeans-and-elbow-method/ https://machinelearningmastery.com/clustering-algorithms-with-python/ https://github.com/sidleal/porsimplessent https://www.inf.ufrgs.br/pln/wiki/index.php?title=BrWaC http://www.nilc.icmc.usp.br/nilc/index.php/rastros |
||
Carga Horária: |
8 horas |
||
Tipo: | Obrigatória | ||
Vagas oferecidas: | 90 | ||
Ministrantes: |
Sidney Evaldo Leal |
![]() |
Créditos © 1999 - 2021 - Superintendência de Tecnologia da Informação/USP |