-
Apresentação
Apresentação
Esta cadeira tem como objetivo apresentar as técnicas e metodologias fundamentais para a análise de dados na perspectiva interdisciplinar de um Cientista de Dados. Na primeira parte da cadeira, os alunos aprendem sobre a natureza diversa dos dados e o poder simbólico das diferentes estruturas de dados para representar informação. Tal compreensão fundamental leva naturalmente a um segundo momento da cadeira no qual os alunos aprendem como interrogar e extrair informações dos dados e justificar suas escolhas. Durante esta segunda parte, os alunos aprendem sobre inferência estatística, testes de hipóteses, abordagens freqüentistas versus Bayesianas para pensar em dados, correlação e causalidade. Finalmente, na terceira parte do módulo, os alunos aprendem os fundamentos da aprendizagem de máquina por meio da teoria e prática dos métodos de regressão, classificação e redução de dimensionalidade.
-
Disciplina do curso
Disciplina do curso
-
Grau | Semestres | ECTS
Grau | Semestres | ECTS
Licenciado | Semestral | 5
-
Ano | Natureza | Lingua
Ano | Natureza | Lingua
3 | Obrigatório | Português
-
Código
Código
ULHT2531-22513
-
Pré-requisitos e co-requisitos
Pré-requisitos e co-requisitos
Não aplicável
-
Estágio Profissional
Estágio Profissional
Não
-
Conteúdos Programáticos
Conteúdos Programáticos
Introdução à Ciência de Dados e funções no campo Tipos de dados e estruturas de dados tabulares Estatística descritiva: tendência central e dispersão Visualização univariada: histogramas, KDE, boxplots, outliers, assimetria Análise bivariada: gráficos de dispersão e pares, relações lineares e não lineares Correlação: Pearson e Spearman, força vs significância Dados categóricos: tabelas de contingência, proporções, resumos agrupados Pipelines de Análise Exploratória de Dados (AED) e narrativa de dados Fundamentos de aprendizagem automática Regressão linear: ajuste do modelo, resíduos, R², sobreajuste, interpretação Regressão logística: classificação binária, sigmoide, log-odds, ROC, precisão, F1 Clustering: k-means, método do cotovelo, introdução ao clustering hierárquico, aplicações Validação e avaliação de modelos Pensamento estatístico Revisão e integração de conceitos
-
Objetivos
Objetivos
Caracterizar tipos e estruturas de dados em conjuntos tabulares Calcular e interpretar estatísticas descritivas Criar e interpretar visualizações univariadas e bivariadas Realizar uma análise exploratória de dados estruturada e comunicar conclusões Construir e avaliar modelos de base, incluindo regressão linear e logística Aplicar métodos não supervisionados como k-means para agrupamento Selecionar e interpretar métricas de avaliação, compreendendo o compromisso viés–variância Relacionar conceitos de pensamento estatístico com a prática de aprendizagem automática (ML)
-
Metodologias de ensino e avaliação
Metodologias de ensino e avaliação
Uso de vibe-coding, avalição a nível de processo, abordagem dialógica.
-
Bibliografia principal
Bibliografia principal
Grus, J. (2019). Data science from scratch: first principles with python. O'Reilly Media.
-
Horário de Atendimento
Horário de Atendimento
-
Mobilidade
Mobilidade
Não