filmeu

Disciplina Data Mining

  • Apresentação

    Apresentação

    A disciplina de Data Mining tem como objectivo dar ao estudante competências essenciais na análise de dados, numa perspetiva multidisciplinar, como se trata a  Ciência de Dados. Através da apresentação de metodologias e técnicas fundamentais para tratar, transformar, construir e analisar os dados, é objectivo desta disciplina dar ao estudante capacidade para traduzir essa análise em conhecimento e valor, de modo sustentado para a tomada de decisão.   A componente prática é um dos aspetos fundamentais da disciplina, pelo que a capacidade de traduzir conhecimento em ações práticas e decisões de análise é particularmente valorizada. A ligação estreita ao mundo empresarial para resposta a perguntas de negócios será retratada nesta disciplina.
  • Conteúdos Programáticos

    Conteúdos Programáticos

    1. Introdução ao Data Mining: Importância e aplicações de Data Mining Worflow de Projectos: Exemplos Práticos Tipos de dados: Estruturados, Semi-estruturados e não estruturados Principais desafios em Data Mining   2. Python para Data Mining Setup: Jupyter notebook NumPy  Pandas Matplotlib   3. Pré-processamento de dados Limpeza e preparação de dados estruturados (data wrangling: slicing, grouby, pivoting, missing values, imputation, duplicates, outliers, etc) Tratamento de dados não estruturado - Texto (lemmatisation, stemming, etc.)   4. Introdução ao Machine Learning, modelos superviosionados e não superviosionados Conceitos base Regressão Linear Regressão Logística KNN Redução de Dimensionalidade (PCA) Clustering  Métricas de avaliação de desempenho de modelos
  • Objetivos

    Objetivos

     A disciplina tem como objetivos dar ao aluno as competências para:   OA1. Compreender a importância de Data Mining no mundo real OA2. Compreender a natureza dos dados OA3. Entender as principais técnicas e métodos de Data Mining, em programação Python, usados por cientistas de dados, através da sua prática OA4. Ser capaz de proceder a tarefas básicas de preparação e pré-processamento de dados OA5. Fazer análise exploratória de dados com implementação em Python OA6. Entender o fluxo de trabalho de um cientista de dados, e ser capaz de pensar sobre a solução de problemas com dados OA7. Entender e implementar métodos de aprendizagem automática, supervisionados e não supervisionados OA8. Conhecer as métricas de avaliação do desempenho de um modelo
  • Metodologias de ensino

    Metodologias de ensino

    Nas aulas, introduzem-se os conceitos teóricos que são complementados com exemplos práticos reais. Os alunos são incentivados a resolver exercícios assim como a apresentar quaisquer dúvidas. Para cada tópico é apresentado um conjunto de exercícios de aplicação dos conceitos teóricos, procedendo-se ao acompanhamento da resolução dos mesmos e apresentando-se a resolução final.   Materiais de apoio e exercícios com sugestões de resolução serão disponibilizados no Moodle.   Acredita-se que a avaliação contínua, adaptada de acordo com a evolução dos alunos, seja uma boa prática. O acompanhamento individual e a disponibilidade para esclarecer dúvidas, sempre que necessário, é essencial para o aluno e para o seu desempenho.
  • Bibliografia principal

    Bibliografia principal

    Slides e apontamentos das aulas. Grus, J. (2019). Dafa science from scratch: first princples with Python . O'ReiIIy Media. Provost, F., Fawcett T. (2013) Data Science for Business: What you need to know about data mining and data-analytic thinking, O'Reilly Media Inc.  
  • Avaliação

    Avaliação

    A avaliação é realizada em regime de avaliação contínua ou por exame final em época de recurso. A Avaliação contínua consiste na realização de 4 quizzes de 15 minutos (cuja média corresponde a 30% da nota final) e 2 trabalhos computacionais (cuja média corresponde a 30% da nota final) e em uma Frequência FInal (corresponde a 40% da nota final).

     

    É exigida a presença a um mínimo de 75% das aulas práticas para poderem fazer avaliação contínua; caso contrário, só se poderão apresentar a avaliação em época de recurso. Trabalhadores-estudantes não são contemplados com esta regra.

     

    Todas as componentes de avaliação contínua são obrigatórias.

     

     

    Descrição

    Data 

    Ponderação

    4 Quizzes

    2/10/2024

    30/10/2024

    20/11/2024

    11/12/2024

     

    30%

    2 Projectos Computacionais

    (a submter até uma semana após entrega do enunciado)

    14/10/2024 

    25/11/2024

     

    30%

    Frequência Final (Época Normal)

    06/01/2025

    40%

    Exame Final (Época de Recursol)

    20/01/2025

    100%

     

INSCRIÇÃO AVULSO
Lisboa 2020 Portugal 2020 Small financiado eu 2024 prr 2024 republica portuguesa 2024 Logo UE Financed Provedor do Estudante Livro de reclamaões Elogios entidade signataria