A Fatoração de Matrizes Não-Negativas (NMF) é um conjunto de algoritmos utilizado para anÔlise de problemas multivariÔveis e de Ôlgebra linear, sendo também encarada como uma técnica de aprendizado não supervisionado amplamente usada em diversas Ôreas como:
- Processamento de sinais de Ɣudio
- Astronomia
- Visão computacional
- BioinformƔtica
- Recomendação de sistemas
- AnƔlise de documentos
O NMF consiste na fatoração de uma matriz
Ilustração da aproximação da matriz
A matriz
-
$W$ : Contém uma base otimizada, de dimensão$m \times r$ , onde$r$ é escolhido pelo usuÔrio. -
$H$ : Coeficientes de combinação linear, de dimensão$r \times n$ , usados para aproximar$V$ .
A equação de aproximação pode ser escrita como:
A NMF pode ser usada para representar imagens como uma combinação de partes bÔsicas (por exemplo, rostos e suas partes como olhos, nariz e boca), com valores não-negativos tornando a interpretação mais intuitiva.
Representação de faces usando algoritmos de aprendizado non-negative matrix factorization (NMF), principal component analysis (PCA) e vector quantization (VQ). A base de dados utilizada tinha 2429 imagens de 19 X 19 pixels e foram fatoradas em 49 imagens base (Nature 1999)
Em documentos textuais, a NMF pode ser aplicada para encontrar padrões semânticos ao fatorar a matriz de frequência de palavras em bases otimizadas e seus coeficientes.
Utilização do non-negative matrix factorization (NMF) para descobrir caracterĆsticas semĆ¢nticas de 30991 artigos da enciclopĆ©dia Grolier, considerando um vocabulĆ”rio de 15276 palavras para cada documento. Foram extraĆdas 200 caracterĆsticas semĆ¢nticas desses documentos, sendo exibidas no canto esquerdo superior algumas delas
O problema de NMF Ć© resolvido usando Gradiente Descendente Alternado (GD), onde as matrizes
As atualizações seguem um esquema multiplicativo que garante a não-negatividade dos elementos em cada iteração.
- ConvergĆŖncia local: O algoritmo nĆ£o garante encontrar o mĆnimo global, mas assegura uma convergĆŖncia local.
-
Esparsidade: Muitas vezes, as soluções encontradas são esparsas, ou seja, muitas entradas de
$W$ e$H$ são zero, facilitando a interpretação. - Interpretação intuitiva: As matrizes fatoradas são mais interpretÔveis devido à restrição de não-negatividade.