Disciplina Discipline IBI5092
Introdução à Estatística de Redes

Introduction to Network Statistics

Área de Concentração: 95131

Concentration area: 95131

Criação: 09/12/2024

Creation: 09/12/2024

Ativação: 09/12/2024

Activation: 09/12/2024

Nr. de Créditos: 8

Credits: 8

Carga Horária:

Workload:

Teórica

(por semana)

Theory

(weekly)

Prática

(por semana)

Practice

(weekly)

Estudos

(por semana)

Study

(weekly)

Duração Duration Total Total
4 2 4 12 semanas 12 weeks 120 horas 120 hours

Docente Responsável:

Professor:

André Fujita

Objetivos:

O objetivo do curso é assegurar que os alunos compreendam os princípios de estatística de redes e os apliquem em redes empíricas.

Objectives:

The course aims to ensure that students understand and apply network statistics principles to network data.

Justificativa:

O número de coleções de redes vem aumentando drasticamente ao longo dos anos. Exemplos de redes empíricas são as conexões interpessoais (redes sociais), redes de computadores, compostos químicos, circuitos cerebrais e vias metabólicas. Freqüentemente analisamos essas redes usando métodos baseados na teoria dos grafos. O problema é que estas redes empíricas apresentam aleatoriedade, o que não consideramos nas análises computacionais usuais. Alternativamente, uma solução natural e mais apropriada seria analisar os grafos de forma estatística. Entretanto, grafos são objetos compostos de vértices e arestas, o que torna difícil sua manipulação estatística. Uma maneira de conectar a teoria estatística com a teoria dos grafos é utilizando o espectro dos grafos. O espectro do grafo é interessante porque codifica as propriedades estruturais do grafo. Assim, vamos examinar como podemos desenvolver métodos estatísticos sobre os grafos com base no seu espectro. Em seguida, responderemos perguntas como, como podemos verificar se duas subredes do cérebro estão associadas? Como podemos testar se duas ou mais redes sociais são iguais (em algum sentido)?

Rationale:

The number of network collections has increased drastically over the years. Empirical networks include interpersonal connections, computer networks, chemical compounds, brain circuits, and metabolic pathways. Frequently, we analyze these networks using methods grounded in graph theory. The problem is that empirical networks present randomness, which we do not consider in the usual computational analyses. Alternatively, a natural and more appropriate solution would be to analyze graphs statistically. However, graphs are objects composed of vertices and edges, which makes statistical manipulation difficult. Using the graph spectrum is one way to link statistical theory and graph theory. The graph spectrum is interesting because it codifies the structural properties of the graph. Thus, we will examine how we can develop statistical methods on graphs based on the graph spectrum. We will then answer questions such as, how can we verify whether two brain subnetworks are associated? How can we test whether two or more social networks are equal (in some sense)? The course aims to ensure that students understand and apply network statistics principles to network data.

Conteúdo:

Grafos: definição, conceitos e algoritmos básicos Métodos estatísticos para construir gráfos (medidas de dependência) Medidas de grafos Medidas de centralidade Modelos de grafos aleatórios Espectro do grafo e entropia espectral do grafo Estimador de parâmetros e seleção de modelos para modelos de grafos aleatórios Testes comparativos de dois ou mais (conjuntos de) grafos Correlação entre vetores de grafos Agrupamento de grafos Um teste estatístico para comparar a estrutura de agrupamento de conjuntos de grafos

Content:

Graphs: definition, concepts, and basic algorithms Statistical methods to construct graphs (dependence measures) Graph measures Centrality measures Random graph models Graph spectrum and graph spectral entropy Parameter estimator and model selection for random graph models Comparison tests of two or more (sets of) graphs Correlation between vectors of graphs Clustering of graphs A statistical test to compare the clustering structure of sets of graphs

Forma de Avaliação:

A forma de avaliação da aprendizagem será 100% remota e se dará pela média ponderada dos seguintes quesitos: 1. Desempenho didático e científico nos seminários (peso 3) 2. Participação nas discussões (peso 2) 3. Desempenho nos trabalhos práticos (peso 5) Será atribuída uma nota de 0 à 10 para cada um dos quesitos de 1 à 3 acima. A média final será calculada levando-se em conta os pesos. Os conceitos A, B e C serão atribuídos da seguinte forma. Média final entre 8.0 e 10 será atribuído o conceito A. Média final entre 6.5 e 7.9 será atribuída a nota B. Média final entre 5.0 e 6.4 será atribu

Observação:

O material e conteúdo da disciplina (notas de aula, artigos e capítulos de livro no formato PDF) serão disponibilizados via página da disciplina no eDisciplinas. As aulas serão ministradas via Google Meet. O controle de frequência se dará pela presença dos alunos no Google Meet. A disponibilidade de câmera não é obrigatória, mas a do microfone é obrigatória para apresentação de seminários e discussões.

Bibliografia:

1. Albert R and Barabási A-L. Statistical mechanics of complex networks. Reviews of Modern Physics. 74: 47, 2002. 2. Cormen TH, Leiserson CE, Rivest RL, Stein C. Introduction to Algorithms. Third edition. The MIT Press. Cambridge, Massachusetts, 2009. 3. Fujita A, Takahashi DY, Patriota AG, Sato JR. A non-parametric statistical test to compare clusters with applications in functional magnetic resonance imaging data. Statistics in Medicine. 33: 4949-4962, 2014. 4. Fujita A, Takahashi DY, Balardin JB, Vidal MC, Sato JR. Correlation between graphs with an application to brain network analysis. Computational Statistics & Data Analysis. 109: 76 - 92, 2016. 5. Fujita A, Vidal MC, Takahashi DY. A Statistical Method to Distinguish Functional Brain Networks. Frontiers in Neuroscience. 11: 66, 2017. 6. Fujita A, Lira E, Santos SS, Soares GE, Bando SY, Takahashi DY. A semi-parametric statistical test to compare complex networks. Journal of Complex Networks. 8: 2, 2020. 7. Kolaczyk R. Statistical Analysis of Network Data: Methods and Models. Springer, 1st Edition, 2009. 8. Rubinov M and Sporns O. Complex network measures of brain connectivity: uses and interpretations. NeuroImage. 52: 1059 – 1069, 2010. 9. Sato JR, Vidal MC, Siqueira SS, Massirer KB, Fujita A. Complex network measures in autism spectrum disorders. IEEE-ACM Transactions on Computational Biology and Bioinformatics. 15: 581 - 587, 2018. 10. Siqueira SS, Takahashi DY, Nakata A, Fujita A. A comparative study of statistical methods used to identify dependencies between gene expression signals. Briefings in Bioinformatics. 15: 906-918, 2013. 11. Takahashi DY, Sato JR, Ferreira CE, Fujita A. Discriminating different classes of biological networks by analyzing the graphs spectra distribution. PLoS ONE. 7: e49949, 2012. 12. Vidal MC, Sato JR, Balardin JB, Takahashi DY, Fujita A. ANOCVA in R: A software to compare clusters between groups and its application to the study of autism spectrum disorder. Frontiers in Neuroscience. 11: 16, 2017.

Bibliography:

1. Albert R and Barabási A-L. Statistical mechanics of complex networks. Reviews of Modern Physics. 74: 47, 2002. 2. Cormen TH, Leiserson CE, Rivest RL, Stein C. Introduction to Algorithms. Third edition. The MIT Press. Cambridge, Massachusetts, 2009. 3. Fujita A, Takahashi DY, Patriota AG, Sato JR. A non-parametric statistical test to compare clusters with applications in functional magnetic resonance imaging data. Statistics in Medicine. 33: 4949-4962, 2014. 4. Fujita A, Takahashi DY, Balardin JB, Vidal MC, Sato JR. Correlation between graphs with an application to brain network analysis. Computational Statistics & Data Analysis. 109: 76 - 92, 2016. 5. Fujita A, Vidal MC, Takahashi DY. A Statistical Method to Distinguish Functional Brain Networks. Frontiers in Neuroscience. 11: 66, 2017. 6. Fujita A, Lira E, Santos SS, Soares GE, Bando SY, Takahashi DY. A semi-parametric statistical test to compare complex networks. Journal of Complex Networks. 8: 2, 2020. 7. Kolaczyk R. Statistical Analysis of Network Data: Methods and Models. Springer, 1st Edition, 2009. 8. Rubinov M and Sporns O. Complex network measures of brain connectivity: uses and interpretations. NeuroImage. 52: 1059 – 1069, 2010. 9. Sato JR, Vidal MC, Siqueira SS, Massirer KB, Fujita A. Complex network measures in autism spectrum disorders. IEEE-ACM Transactions on Computational Biology and Bioinformatics. 15: 581 - 587, 2018. 10. Siqueira SS, Takahashi DY, Nakata A, Fujita A. A comparative study of statistical methods used to identify dependencies between gene expression signals. Briefings in Bioinformatics. 15: 906-918, 2013. 11. Takahashi DY, Sato JR, Ferreira CE, Fujita A. Discriminating different classes of biological networks by analyzing the graphs spectra distribution. PLoS ONE. 7: e49949, 2012. 12. Vidal MC, Sato JR, Balardin JB, Takahashi DY, Fujita A. ANOCVA in R: A software to compare clusters between groups and its application to the study of autism spectrum disorder. Frontiers in Neuroscience. 11: 16, 2017.

Tipo de oferecimento da disciplina:

Não-Presencial

Class type:

Não-Presencial