-
Apresentação
Apresentação
Esta Unidade Curricular tem como objectivo principal dar ao aluno as competências e ferramentas necessárias para a análise exploratória e descritiva dos dados. Pretende-se que o aluno consiga um entendimento básico de seus dados e das relações existentes entre as variáveis analisadas.
-
Disciplina do curso
Disciplina do curso
-
Grau | Semestres | ECTS
Grau | Semestres | ECTS
Licenciado | Semestral | 6
-
Ano | Natureza | Lingua
Ano | Natureza | Lingua
1 | Obrigatório | Português
-
Código
Código
ULHT6634-1790
-
Pré-requisitos e co-requisitos
Pré-requisitos e co-requisitos
Não aplicável
-
Estágio Profissional
Estágio Profissional
Não
-
Conteúdos Programáticos
Conteúdos Programáticos
1. Introdução à Análise Exploratória de Dados e compreensão da sua importância na Ciência de Dados;
2. Caracterização dos diferentes tipos de dados e a sua natureza;
3. Estatística Descriptiva:
- Tabelas de frequência;
- Estatística Descriptiva: medidas de localização, dispersão, assimetria e curtose;
- Visualizações gráficas;
4. Análise Bivariada:
- Coeficiente de correlação linear de Pearson;
- Regressão linear;
- Independência entre variáveis;
5. Visualizações gráficas;
- Técnicas e melhores práticas;
- Análise Exploratória de Dados (AED) automatizada;
6. Python para análise exploratória de dados:
- Introdução às bibliotecas NumPy e Pandas para limpeza e análise de dados;
- Introdução às bibliotecas Matplotlib, Seaborn, Plotly, Bokeh, entre outros para visualização de dados;
- Ferramentas de Análise Exploratória de Dados (AED) automatizada.
-
Objetivos
Objetivos
No final desta unidade curricular, pretende-se que o aluno seja capaz de:
- Perceber o que é a Análise Exploratória de Dados e como se encaixa no workflow de Data Science;
- Compreender a natureza dos diferentes tipos de dados e a necessidade de tratá-los;
- Compreender e aplicar estatística descritiva na análise de dados;
- Fazer análises bivariada;
- Organizar e sintetizar os dados de forma a obter as informações necessárias para responder as questões que estão sendo estudadas;
- Criar visualizações objectivas e eficazes de dados que resultem em acções concretas;
- Utilizar a linguagem Python e as suas bibliotecas para análise de dados.
-
Metodologias de ensino e avaliação
Metodologias de ensino e avaliação
Nas aulas, introduzem-se os conceitos teóricos que são complementados com exemplos práticos reais. Os alunos são incentivados a resolver exercícios assim como a apresentar quaisquer dúvidas. Para cada tópico é apresentado um conjunto de exercícios de aplicação dos conceitos teóricos, procedendo-se ao acompanhamento da resolução dos mesmos e apresentando-se a resolução final.
Materiais de apoio e exercícios com sugestões de resolução serão disponibilizados no Moodle.
Acredita-se que a avaliação contínua, adaptada de acordo com a evolução dos alunos, seja uma boa prática. O acompanhamento individual e a disponibilidade para esclarecer dúvidas, sempre que necessário, é essencial para o aluno e para o seu desempenho.
-
Bibliografia principal
Bibliografia principal
- VanderPlas, J. (2016). Python Data Science Handbook: Essential Tools for Working with Data,. O'ReiIIy.
- Data Visualization with Python for Beginners: Visualize Your Data using Pandas, Matplotlib and Seaborn (2020). AI Publishing LLC.
- Grus, J. (2019). Dafa science from scratch: first principles with Python. O'ReiIIy Media.
- Murteira, B. & Antunes, M. (2012). Probabilidades e Estatística. (Vol.1). Lisboa: Escolar Editora.
-
Horário de Atendimento
Horário de Atendimento
-
Mobilidade
Mobilidade
Não