96019 - Métodos de Agrupamento em Processamento de Línguas Naturais (PLN) usando Python |
Período da turma: | 16/09/2020 a 07/10/2020
|
||||
|
|||||
Descrição: | Programa:
1. Dia 01 - 2 horas - Ambiente Google Colab - Instalação e configuração NLPNet 2. Dia 02 - 2 horas - Introdução Pandas - Introdução Scikit Learn - Dataset PorSimplesSent 3. Dia 03 - 2 horas - Gerando features: TFIDF e LSA - K-Means - Agglomerative Clustering - Datasets PorSimplesSent e brWaC 4. Dia 04 - 2 horas - Elbow Method - Silhouette - V-Measure - Datasets PorSimplesSent e RastrOS Bibliografia: https://scikit-learn.org/stable/modules/clustering.html https://pandas.pydata.org/pandas-docs/stable/getting_started/tutorials.html http://nilc.icmc.usp.br/nlpnet/intro.html https://jtemporal.com/kmeans-and-elbow-method/ https://machinelearningmastery.com/clustering-algorithms-with-python/ https://github.com/sidleal/porsimplessent https://www.inf.ufrgs.br/pln/wiki/index.php?title=BrWaC http://www.nilc.icmc.usp.br/nilc/index.php/rastros |
||||
Carga Horária: |
8 horas |
||||
Tipo: | Obrigatória | ||||
Vagas oferecidas: | 90 | ||||
Ministrantes: |
Sidney Evaldo Leal |
voltar |
Créditos © 1999 - 2024 - Superintendência de Tecnologia da Informação/USP |