Skip to content

danielshz/nmf-applications

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Ā 

History

5 Commits
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 

Repository files navigation

Non-Negative Matrix Factorization (NMF)

Introdução

A Fatoração de Matrizes Não-Negativas (NMF) é um conjunto de algoritmos utilizado para anÔlise de problemas multivariÔveis e de Ôlgebra linear, sendo também encarada como uma técnica de aprendizado não supervisionado amplamente usada em diversas Ôreas como:

  • Processamento de sinais de Ć”udio
  • Astronomia
  • VisĆ£o computacional
  • BioinformĆ”tica
  • Recomendação de sistemas
  • AnĆ”lise de documentos

O NMF consiste na fatoração de uma matriz $V$ (não negativa) em duas matrizes $W$ e $H$, onde todos os elementos são não-negativos. Embora não haja uma solução exata para essa fatoração, uma aproximação numérica pode ser utilizada.

Fatoração

Ilustração da aproximação da matriz $V$ representada por duas matrizes menos $W$ e $H$, usando non-negative matrix factorization (Wikipedia).

Estrutura

Matriz de Entrada

A matriz $V$ (dimensão $m \times n$) contém valores multivariados não-negativos, ou seja, maiores ou iguais a zero (ex: intensidade das cores de pixels em imagens).

Matrizes de Fatoração

  • $W$: ContĆ©m uma base otimizada, de dimensĆ£o $m \times r$, onde $r$ Ć© escolhido pelo usuĆ”rio.
  • $H$: Coeficientes de combinação linear, de dimensĆ£o $r \times n$, usados para aproximar $V$.

A equação de aproximação pode ser escrita como: $$V \approx W \times H$$

AplicaƧƵes

Processamento de Imagens

A NMF pode ser usada para representar imagens como uma combinação de partes bÔsicas (por exemplo, rostos e suas partes como olhos, nariz e boca), com valores não-negativos tornando a interpretação mais intuitiva.

Fatoração

Representação de faces usando algoritmos de aprendizado non-negative matrix factorization (NMF), principal component analysis (PCA) e vector quantization (VQ). A base de dados utilizada tinha 2429 imagens de 19 X 19 pixels e foram fatoradas em 49 imagens base (Nature 1999)

AnƔlise de Texto

Em documentos textuais, a NMF pode ser aplicada para encontrar padrões semânticos ao fatorar a matriz de frequência de palavras em bases otimizadas e seus coeficientes.

Fatoração

Utilização do non-negative matrix factorization (NMF) para descobrir características semânticas de 30991 artigos da enciclopédia Grolier, considerando um vocabulÔrio de 15276 palavras para cada documento. Foram extraídas 200 características semânticas desses documentos, sendo exibidas no canto esquerdo superior algumas delas

Algoritmo

O problema de NMF é resolvido usando Gradiente Descendente Alternado (GD), onde as matrizes $W$ e $H$ são atualizadas iterativamente para minimizar a função de erro:

$$ \min | V - W H |_F^2 $$

As atualizações seguem um esquema multiplicativo que garante a não-negatividade dos elementos em cada iteração.

CaracterĆ­sticas

  • ConvergĆŖncia local: O algoritmo nĆ£o garante encontrar o mĆ­nimo global, mas assegura uma convergĆŖncia local.
  • Esparsidade: Muitas vezes, as soluƧƵes encontradas sĆ£o esparsas, ou seja, muitas entradas de $W$ e $H$ sĆ£o zero, facilitando a interpretação.
  • Interpretação intuitiva: As matrizes fatoradas sĆ£o mais interpretĆ”veis devido Ć  restrição de nĆ£o-negatividade.

About

šŸ”¢ Teoria e aplicaƧƵes da fatoração de matrizes positivas (NMF)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published