filmeu

Disciplina Data Science

  • Apresentação

    Apresentação

    Esta cadeira tem como objetivo apresentar as técnicas e metodologias fundamentais para a análise de dados na perspectiva interdisciplinar de um Cientista de Dados. Na primeira parte da cadeira, os alunos aprendem sobre a natureza diversa dos dados e o poder simbólico das diferentes estruturas de dados para representar informação. Tal compreensão fundamental leva naturalmente a um segundo momento da cadeira no qual os alunos aprendem como interrogar e extrair informações dos dados e justificar suas escolhas. Durante esta segunda parte, os alunos aprendem sobre inferência estatística, testes de hipóteses, abordagens freqüentistas versus Bayesianas para pensar em dados, correlação e causalidade. Finalmente, na terceira parte do módulo, os alunos aprendem os fundamentos da aprendizagem de máquina por meio da teoria e prática dos métodos de regressão, classificação e redução de dimensionalidade.
  • Conteúdos Programáticos

    Conteúdos Programáticos

    Introdução à Ciência de Dados e funções no campo Tipos de dados e estruturas de dados tabulares Estatística descritiva: tendência central e dispersão Visualização univariada: histogramas, KDE, boxplots, outliers, assimetria Análise bivariada: gráficos de dispersão e pares, relações lineares e não lineares Correlação: Pearson e Spearman, força vs significância Dados categóricos: tabelas de contingência, proporções, resumos agrupados Pipelines de Análise Exploratória de Dados (AED) e narrativa de dados Fundamentos de aprendizagem automática Regressão linear: ajuste do modelo, resíduos, R², sobreajuste, interpretação Regressão logística: classificação binária, sigmoide, log-odds, ROC, precisão, F1 Clustering: k-means, método do cotovelo, introdução ao clustering hierárquico, aplicações Validação e avaliação de modelos Pensamento estatístico Revisão e integração de conceitos
  • Objetivos

    Objetivos

    Caracterizar tipos e estruturas de dados em conjuntos tabulares Calcular e interpretar estatísticas descritivas Criar e interpretar visualizações univariadas e bivariadas Realizar uma análise exploratória de dados estruturada e comunicar conclusões Construir e avaliar modelos de base, incluindo regressão linear e logística Aplicar métodos não supervisionados como k-means para agrupamento Selecionar e interpretar métricas de avaliação, compreendendo o compromisso viés–variância Relacionar conceitos de pensamento estatístico com a prática de aprendizagem automática (ML)
  • Bibliografia principal

    Bibliografia principal

      Grus, J. (2019). Data science from scratch: first principles with python. O'Reilly Media.  
INSCRIÇÃO AVULSO
Lisboa 2020 Portugal 2020 Small financiado eu 2024 prr 2024 republica portuguesa 2024 Logo UE Financed Provedor do Estudante Livro de reclamaões Elogios