filmeu

Disciplina Data Science

  • Apresentação

    Apresentação

    Esta cadeira tem como objetivo apresentar as técnicas e metodologias fundamentais para a análise de dados na perspectiva interdisciplinar de um Cientista de Dados. Na primeira parte da cadeira, os alunos aprendem sobre a natureza diversa dos dados e o poder simbólico das diferentes estruturas de dados para representar informação. Tal compreensão fundamental leva naturalmente a um segundo momento da cadeira no qual os alunos aprendem como interrogar e extrair informações dos dados e justificar suas escolhas. Durante esta segunda parte, os alunos aprendem sobre inferência estatística, testes de hipóteses, abordagens freqüentistas versus Bayesianas para pensar em dados, correlação e causalidade. Finalmente, na terceira parte do módulo, os alunos aprendem os fundamentos da aprendizagem de máquina por meio da teoria e prática dos métodos de regressão, classificação e redução de dimensionalidade.
  • Conteúdos Programáticos

    Conteúdos Programáticos

    Introdução à Ciência de Dados e funções no campo Tipos de dados e estruturas de dados tabulares Estatística descritiva: tendência central e dispersão Visualização univariada: histogramas, KDE, boxplots, outliers, assimetria Análise bivariada: gráficos de dispersão e pares, relações lineares e não lineares Correlação: Pearson e Spearman, força vs significância Dados categóricos: tabelas de contingência, proporções, resumos agrupados Pipelines de Análise Exploratória de Dados (AED) e narrativa de dados Fundamentos de aprendizagem automática Regressão linear: ajuste do modelo, resíduos, R², sobreajuste, interpretação Regressão logística: classificação binária, sigmoide, log-odds, ROC, precisão, F1 Clustering: k-means, método do cotovelo, introdução ao clustering hierárquico, aplicações Validação e avaliação de modelos Pensamento estatístico Revisão e integração de conceitos
  • Objetivos

    Objetivos

    Caracterizar tipos e estruturas de dados em conjuntos tabulares Calcular e interpretar estatísticas descritivas Criar e interpretar visualizações univariadas e bivariadas Realizar uma análise exploratória de dados estruturada e comunicar conclusões Construir e avaliar modelos de base, incluindo regressão linear e logística Aplicar métodos não supervisionados como k-means para agrupamento Selecionar e interpretar métricas de avaliação, compreendendo o compromisso viés–variância Relacionar conceitos de pensamento estatístico com a prática de aprendizagem automática (ML)
  • Metodologias de ensino

    Metodologias de ensino

    Uso de vibe-coding, avalição a nível de processo, abordagem dialógica.
  • Bibliografia principal

    Bibliografia principal

      Grus, J. (2019). Data science from scratch: first principles with python. O'Reilly Media.  
  • Avaliação

    Avaliação

     

    Descrição

    Data limite

    Ponderação

    Teste meio termo (teoria)

    Semana 7

    20% Teórica

    Frequência final (teoria)

    Data definida pela coordenação

    30% (Teórica)

    Teste I (Prática)

    Semana 5

    10% (Prática)

    Teste II (Prática) Semana 11 20% (Prática)
    Teste III (Prática) Semana 14 10% (Prática)
    Participação e presença nas aulas -- 10%

     

    Todas as avaliações são individuais. Não existe aprovação de componentes individuais, a cadeira é aprovada com 50% da nota obtida nas componenrtes vista como um todo. O exame de recurso e sempre só um, teórico-prático.

     

INSCRIÇÃO AVULSO
Lisboa 2020 Portugal 2020 Small financiado eu 2024 prr 2024 republica portuguesa 2024 Logo UE Financed Provedor do Estudante Livro de reclamaões Elogios