filmeu

Disciplina Data Science

  • Apresentação

    Apresentação

    Esta cadeira tem como objetivo apresentar as técnicas e metodologias fundamentais para a análise de dados na perspectiva interdisciplinar de um Cientista de Dados. Na primeira parte da cadeira, os alunos aprendem sobre a natureza diversa dos dados e o poder simbólico das diferentes estruturas de dados para representar informação. Tal compreensão fundamental leva naturalmente a um segundo momento da cadeira no qual os alunos aprendem como interrogar e extrair informações dos dados e justificar suas escolhas. Durante esta segunda parte, os alunos aprendem sobre inferência estatística, testes de hipóteses, abordagens freqüentistas versus Bayesianas para pensar em dados, correlação e causalidade. Finalmente, na terceira parte do módulo, os alunos aprendem os fundamentos da aprendizagem de máquina por meio da teoria e prática dos métodos de regressão, classificação e redução de dimensionalidade.

  • Conteúdos Programáticos

    Conteúdos Programáticos

    Descrição dos conteúdos

    1. Programação Python para Ciência de Dados
    2. Introdução à visualização da informação
    3. Álgebra Linear
    4. Noções básicas da teoria da probabilidade
    5. Inferência estatística e teste de hipóteses
    6. Introdução à aprendizagem de máquina
    7. Regressão logística
    8. Redução da dimensionalidade: MDS e PCA
    9. Redução da dimensionalidade: Fatoração de matriz não negativa
    10. Tópicos atuais em ciência de dados
  • Objetivos

    Objetivos

    1. Entender as principais técnicas e métodos de programação Python usados por cientistas de dados através da sua prática
    2. Introdução à teoria de visualização de informação, abordagens e técnicas de implementação
    3. Compreender a natureza dos dados desde a perspectiva da Ciência de Dados
    4. Fazer análises exploratórias de dados com implementação em Python
    5. Realizar inferência estatística por meio de testes de hipóteses
    6. Aprender os erros e falácias mais comuns em estatística, e como evitá-los
    7. Entender como um estatístico ou cientista de decisão pensa sobre a solução de problemas com dados
    8. Entender o que é aprendizagem automática: métodos supervisionados e não supervisionados
    9. Compreender e implementar métodos de regressão e classificação 
    10. Aprender os fundamentos das métricas de para avaliar o desempenho de um classificador
    11. Compreender e implementar vários métodos de redução de dimensionalidade com várias aplicações
  • Bibliografia principal

    Bibliografia principal

     

    • Grus, J. (2019). Data science from scratch: first principles with python. O'Reilly Media.

     

INSCRIÇÃO AVULSO
Lisboa 2020 Portugal 2020 Small financiado eu 2024 prr 2024 republica portuguesa 2024 Logo UE Financed Provedor do Estudante Livro de reclamaões Elogios