Contacto WhatsApp 963640100

Universidade Lusófona

Sistemas de Informação Multimédia

Disciplina do Curso

Engenharia Informática

Grau|Semestres|ECTS

Licenciatura | Semestral | 6

Ano | Tipo de unidade curricular | Lingua

3 |Obrigatório |Português

Total de horas de Trabalho | Tempo de Contacto (horas)

168 | 52,5

Código

ULHT260-7281

Disciplinas complementares recomendadas

Não aplicável

Pré-requisitos e co-requisitos

Não aplicável

Precedências

Não

Estágio profissional

Não

Conteúdos Programáticos

- Conhecimento profundo dos conceitos associados ao ciclo de vida de extração de informação em sistemas multimedios.
- Que critérios concretos diferenciam informação de dados
- Como uma representação captura características não explicitas nos dados
- Como é que a maioria dos dados multimedia acabam por ser sempre representados como matrices - Captura e representação esencial de imagens, som, video, bio-data, e outros.
- Estatísticas básicas para pre-processamento de dados: inferência de valores en falta, estandardização, normalização, analise de distribuições, modalidade, tendência central, variância, simetria, pontos discrepantes (fora se serie), correlação, etc.
- Analise de dados usando NNMF (Non Negative Matrix Factorization) - Analise de dados usando PCA (Principal Component Analysis)

Objetivos

O objetivo central desta cadeira e fornecer aos estudantes técnicas algorítmicas/matemáticas para a extração de características com alto valor discriminatório/informativo a partir de dados gerados em múltiplos médios: imagem, som, video, bio-data, etc. Nesse sentido, há um foco central no ciclo de vida de sistemas multi-media: (1) aquisição de dados; (2) seleção de características; (3) representação e (4) 'machine learning'. Nesta cadeira de nível básico a atenção esta mais dirigida aos pontos (1) e (2) mas sem perder de vista os elementos fundamentais de (3) e (4). Em termos de 'skill set' os estudantes ficam preparados para (1) pre-processamento estatístico de dados matriciais para posterior (2) seleção de características usando factorização matricial com as técnicas de non-negative matrix factorization e principal component analysis. Adicionalmente, esta cadeira exige a aprendizagem auto-didáctica dos aspetos básicos de programação em Python e PHP.

Metodologias de ensino e avaliação

Aulas presenciais teóricas e praticas. As aulas começam sempre com uma revisão dos conceitos da aula anterior e perguntas para desafiar aos estudantes em termos cognitivos. Normalmente há um problema em aberto, no qual vamos trabalhando a medida que decorre a cadeira. A avaliação e feita com dois testes na aula teórica, e dois trabalhos praticos, um em PhP + SQL e outro em estatísticas PCA, e NNMF.

Bibliografia principal

- Eidenberger, H. (2012). Handbook of multimedia information retrieval. BoD¿Books on Demand. - Tukey, J. W. (1977). Exploratory data analysis.
- (practical) https://cran.r-project.org/web/packages/NMF/NMF.pdf
- (practical) http://factominer.free.fr/classical-methods/principal-components-analysis.html
- (article analysis) Ludeña-Choez, J., Quispe-Soncco, R., & Gallardo-Antolín, A. (2017). Bird sound spectrogram decomposition through Non-Negative Matrix Factorization for the acoustic classification of bird species. PloS one, 12(6), e0179403.