-
Apresentação
Apresentação
A disciplina de Data Mining tem como objectivo dar ao estudante competências essenciais na análise de dados, numa perspetiva multidisciplinar, como se trata a Ciência de Dados. Através da apresentação de metodologias e técnicas fundamentais para tratar, transformar, construir e analisar os dados, é objectivo desta disciplina dar ao estudante capacidade para traduzir essa análise em conhecimento e valor, de modo sustentado para a tomada de decisão. A componente prática é um dos aspetos fundamentais da disciplina, pelo que a capacidade de traduzir conhecimento em ações práticas e decisões de análise é particularmente valorizada. A ligação estreita ao mundo empresarial para resposta a perguntas de negócios será retratada nesta disciplina.
-
Disciplina do curso
Disciplina do curso
-
Grau | Semestres | ECTS
Grau | Semestres | ECTS
Licenciado | Semestral | 5
-
Ano | Natureza | Lingua
Ano | Natureza | Lingua
3 | Obrigatório | Português
-
Código
Código
ULHT12-15430
-
Pré-requisitos e co-requisitos
Pré-requisitos e co-requisitos
Não aplicável
-
Estágio Profissional
Estágio Profissional
Não
-
Conteúdos Programáticos
Conteúdos Programáticos
1. Introdução ao Data Mining: Importância e aplicações de Data Mining Worflow de Projectos: Exemplos Práticos Tipos de dados: Estruturados, Semi-estruturados e não estruturados Principais desafios em Data Mining 2. Python para Data Mining Setup: Jupyter notebook NumPy Pandas Matplotlib 3. Pré-processamento de dados Limpeza e preparação de dados estruturados (data wrangling: slicing, grouby, pivoting, missing values, imputation, duplicates, outliers, etc) Tratamento de dados não estruturado - Texto (lemmatisation, stemming, etc.) 4. Introdução ao Machine Learning, modelos superviosionados e não superviosionados Conceitos base Regressão Linear Regressão Logística KNN Redução de Dimensionalidade (PCA) Clustering Métricas de avaliação de desempenho de modelos
-
Objetivos
Objetivos
A disciplina tem como objetivos dar ao aluno as competências para: OA1. Compreender a importância de Data Mining no mundo real OA2. Compreender a natureza dos dados OA3. Entender as principais técnicas e métodos de Data Mining, em programação Python, usados por cientistas de dados, através da sua prática OA4. Ser capaz de proceder a tarefas básicas de preparação e pré-processamento de dados OA5. Fazer análise exploratória de dados com implementação em Python OA6. Entender o fluxo de trabalho de um cientista de dados, e ser capaz de pensar sobre a solução de problemas com dados OA7. Entender e implementar métodos de aprendizagem automática, supervisionados e não supervisionados OA8. Conhecer as métricas de avaliação do desempenho de um modelo
-
Metodologias de ensino
Metodologias de ensino
Nas aulas, introduzem-se os conceitos teóricos que são complementados com exemplos práticos reais. Os alunos são incentivados a resolver exercícios assim como a apresentar quaisquer dúvidas. Para cada tópico é apresentado um conjunto de exercícios de aplicação dos conceitos teóricos, procedendo-se ao acompanhamento da resolução dos mesmos e apresentando-se a resolução final. Materiais de apoio e exercícios com sugestões de resolução serão disponibilizados no Moodle. Acredita-se que a avaliação contínua, adaptada de acordo com a evolução dos alunos, seja uma boa prática. O acompanhamento individual e a disponibilidade para esclarecer dúvidas, sempre que necessário, é essencial para o aluno e para o seu desempenho.
-
Bibliografia principal
Bibliografia principal
Slides e apontamentos das aulas. Grus, J. (2019). Dafa science from scratch: first princples with Python . O'ReiIIy Media. Provost, F., Fawcett T. (2013) Data Science for Business: What you need to know about data mining and data-analytic thinking, O'Reilly Media Inc.
-
Avaliação
Avaliação
A avaliação é realizada em regime de avaliação contínua ou por exame final em época de recurso. A Avaliação contínua consiste na realização de 4 quizzes de 15 minutos (cuja média corresponde a 30% da nota final) e 2 trabalhos computacionais (cuja média corresponde a 30% da nota final) e em uma Frequência FInal (corresponde a 40% da nota final).
É exigida a presença a um mínimo de 75% das aulas práticas para poderem fazer avaliação contínua; caso contrário, só se poderão apresentar a avaliação em época de recurso. Trabalhadores-
estudantes não são contemplados com esta regra. Todas as componentes de avaliação contínua são obrigatórias.
Descrição
Data
Ponderação
4 Quizzes
2/10/2024
30/10/2024
20/11/2024
11/12/2024
30%
2 Projectos Computacionais
(a submter até uma semana após entrega do enunciado)
14/10/2024
25/11/2024
30%
Frequência Final (Época Normal)
06/01/2025
40%
Exame Final (Época de Recursol)
20/01/2025
100%
-
Mobilidade
Mobilidade
Não





