Nesta página, descrevemos como usar embeddings armazenadas para gerar índices e consultar embeddings usando um índice IVF com o AlloyDB para PostgreSQL.
Para mais informações sobre como armazenar embeddings, consulte
Armazenar embeddings de vetor.
Antes de começar
Antes de começar a criar índices, conclua os seguintes pré-requisitos.
Os vetores de embedding são adicionados a uma tabela no banco de dados do AlloyDB.
A versão
0.5.0ou mais recente da extensãovector, baseada empgvectore estendida pelo Google para o AlloyDB, está instalada.CREATE EXTENSION IF NOT EXISTS vector;
Criar um índice IVF
O pgvector padrão oferece suporte à pesquisa de vizinho mais próximo aproximado por indexação. O AlloyDB adiciona a esse suporte um recurso de quantização escalar, que você pode especificar ao criar um índice.
Quando ativada, a quantização escalar pode acelerar significativamente consultas que têm vetores dimensionais maiores e permite armazenar vetores com até 8.000 dimensões.
Para ativar a quantização escalar em um índice baseado em pgvector, especifique IVF
como o método de índice e SQ8 como o quantizador:
CREATE INDEX INDEX_NAME ON TABLE
USING ivf (EMBEDDING_COLUMN DISTANCE_FUNCTION)
WITH (lists = LIST_COUNT, quantizer = 'QUANTIZER');
Substitua:
INDEX_NAME: o nome do índice que você quer criar, por exemplo,my-ivf-index. Os nomes de índice são compartilhados em todo o banco de dados. Verifique se cada nome de índice é exclusivo para cada tabela no banco de dados.TABLE: a tabela em que o índice será adicionado.EMBEDDING_COLUMN: uma coluna que armazena dados devector.DISTANCE_FUNCTION: a função de distância a ser usada com esse índice. Escolha uma destas opções:Distância de L2:
vector_l2_opsProduto interno:
vector_ip_opsDistância do cosseno:
vector_cosine_ops
LIST_COUNT: o número de listas a serem usadas com esse índice. Para mais informações sobre como decidir esse valor, consulte Ajustar um índice IVF.QUANTIZER: o tipo de quantizador que você quer usar.Defina como uma destas opções:
SQ8: recomendado. Resposta de consulta mais rápida, mas resulta em alguma perda de recall, o que não afeta os cenários de produção.FLAT: resposta de consulta mais lenta e maior uso de memória, mas pode atingir uma perda de recall insignificante.
Para criar esse índice em uma coluna de incorporação que usa o tipo de dados
real[]em vez devector, converta a coluna no tipo de dadosvector:
CREATE INDEX INDEX_NAME ON TABLE
USING ivf (CAST(EMBEDDING_COLUMN AS vector(DIMENSIONS)))'}} DISTANCE_FUNCTION)
WITH (lists = LIST_COUNT, quantizer = 'SQ8');
Substitua DIMENSIONS pela largura dimensional da coluna de embedding. Para mais informações sobre como encontrar as dimensões, consulte a função vector_dims em Funções de vetor.
Para conferir o progresso da indexação, use a visualização pg_stat_progress_create_index:
SELECT * FROM pg_stat_progress_create_index;
A coluna phase mostra o estado atual da criação do índice, e a fase building postings indica que a criação do índice está quase concluída.
Para ajustar o índice para um recall desejado e um equilíbrio de QPS, consulte Ajustar um índice IVF.
Executar uma consulta
Depois de armazenar e indexar os embeddings no banco de dados, você pode começar a
consultar usando a funcionalidade de consulta pgvector.
Para encontrar os vizinhos semânticos mais próximos de um vetor de embedding, execute a consulta de exemplo a seguir, em que você define a mesma função de distância usada durante a criação do índice.
SELECT * FROM TABLE
ORDER BY EMBEDDING_COLUMN DISTANCE_FUNCTION_QUERY ['EMBEDDING']
LIMIT ROW_COUNT
Substitua o seguinte:
TABLE: a tabela que contém o embedding com o qual você vai comparar o texto.INDEX_NAME: o nome do índice que você quer usar. Por exemplo,my-scann-index.EMBEDDING_COLUMN: a coluna que contém os embeddings armazenados.DISTANCE_FUNCTION_QUERY: a função de distância a ser usada com essa consulta. Escolha uma das seguintes opções com base na função de distância usada ao criar o índice:Distância de L2:
<->Produto interno:
<#>Distância do cosseno:
<=>
EMBEDDING: o vetor de embedding para encontrar os vizinhos semânticos armazenados mais próximos.ROW_COUNT: o número de linhas que serão retornadas.Especifique
1se você quiser apenas a melhor correspondência.
Para mais exemplos de consultas, consulte Consultas.
Você também pode usar a função embedding() para traduzir o
texto em um vetor. Você aplica o vetor a um dos operadores de vizinho mais próximo pgvector, <-> para distância L2, para encontrar as linhas do banco de dados com os embeddings mais semanticamente semelhantes.
Como embedding() retorna uma matriz real, é necessário transmitir explicitamente a
chamada embedding() para vector para usar esses valores com
operadores pgvector.
A seguir
- Criar um índice do ScaNN
- Fazer pesquisas de similaridade vetorial
- Ajustar o desempenho da consulta de vetores
- Métricas de índice vetorial
- Aprenda a criar um assistente de compras inteligente com o AlloyDB, o pgvector e o gerenciamento de endpoints de modelo.