Sistema de Preguntas y Respuestas basado en PDFs

Este proyecto implementa un sistema de preguntas y respuestas que utiliza documentos PDF como fuente de conocimiento. El sistema procesa múltiples archivos PDF, crea un índice searchable, y permite a los usuarios hacer preguntas sobre el contenido de estos documentos.

Características

Procesa múltiples archivos PDF en una carpeta especificada
Crea un índice FAISS para búsqueda eficiente
Utiliza embeddings de Hugging Face para la representación del texto
Implementa un sistema de preguntas y respuestas utilizando el modelo Llama 3 a través de Ollama
Interfaz de línea de comandos para interactuar con el sistema

Requisitos

Python 3.7+
Bibliotecas requeridas (ver requirements.txt)
crear un enviroment: python -m venv nombreEnviroment
crear un archivo .env en el cual contiene HUGGINGFACEHUB_API_TOKEN

Instalación

Clona este repositorio:
Instala las dependencias
Asegúrate de tener Ollama instalado y el modelo Llama 3 descargado.

Uso

Coloca tus archivos PDF en la carpeta Anexo1 (o modifica la variable folder_path en el script).
Ejecuta el script
El sistema procesará los PDFs y creará un índice la primera vez que se ejecute.
Una vez cargado, puedes hacer preguntas sobre el contenido de los documentos.
Escribe 'salir' para terminar la sesión.

Configuración

Puedes modificar el modelo de embeddings en las funciones create_and_save_index y load_index.
El tamaño de los chunks y el solapamiento se pueden ajustar en la función process_folder.
El modelo de lenguaje se puede cambiar en la función setup_qa_system.

Notas

Este sistema utiliza FAISS para el almacenamiento y búsqueda de vectores, lo que permite una recuperación rápida de información relevante.
El sistema no actualiza el índice automáticamente si se añaden nuevos PDFs. Deberás eliminar manualmente el índice existente para recrearlo con nuevos documentos.

Contribuciones

Las contribuciones son bienvenidas. Por favor, abre un issue para discutir cambios mayores antes de enviar un pull request.

Licencia

[Incluye aquí la información de la licencia de tu proyecto]

Name		Name	Last commit message	Last commit date
Latest commit History 45 Commits
ArchivosDemotxt		ArchivosDemotxt
ArchivosParteEnfermo		ArchivosParteEnfermo
.gitignore		.gitignore
Apéndice 13 al Anexo 3 (Año 2021)textoYTabla.txt		Apéndice 13 al Anexo 3 (Año 2021)textoYTabla.txt
INDICEGENERAL.pdf		INDICEGENERAL.pdf
README.md		README.md
app.py		app.py
app_streamlit.py		app_streamlit.py
app_traductor.py		app_traductor.py
output.json		output.json
preguntas_daca_AP13_A3.txt		preguntas_daca_AP13_A3.txt
preguntas_pe_manual_AP15_A3.txt		preguntas_pe_manual_AP15_A3.txt
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Sistema de Preguntas y Respuestas basado en PDFs

Características

Requisitos

Instalación

Uso

Configuración

Notas

Contribuciones

Licencia

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

Seali12/Demo-Rag

Folders and files

Latest commit

History

Repository files navigation

Sistema de Preguntas y Respuestas basado en PDFs

Características

Requisitos

Instalación

Uso

Configuración

Notas

Contribuciones

Licencia

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages