Exemple : Chatbot PDF 📚#
Description :
Cet exemple montre comment construire un chatbot PDF en utilisant un LLM local et un modèle d’embedding.
Technologies concernées :
@ Xinference en tant que service d’hébergement de modèles LLM
@ LlamaIndex est utilisé pour orchestrer l’ensemble du pipeline RAG.
@ Streamlit pour l’interface utilisateur interactive
Description détaillée des fonctions de démonstration :
J’ai créé un Dockerfile qui simplifie le processus de déploiement via Docker et garantit une reproductibilité facile.
Utilisez Xinference pour lancer les modèles LLM et d’embedding, et exposez deux ports pour y accéder.
Implémentez un téléchargement de fichiers fluide et une communication interactive avec le moteur de chat en utilisant Streamlit.
La vitesse d’embedding des documents est 5 fois plus rapide que celle de l’API d’OpenAI.
Utilisez la puissance de GGML pour exécuter le modèle sur GPU, garantissant une accélération et réduisant le temps d’attente pour les retours.
- Code source :