Exemple : Chatbot PDF 📚#

Description :

Cet exemple montre comment construire un chatbot PDF en utilisant un LLM local et un modèle d’embedding.

Technologies concernées :

@ Xinference en tant que service d’hébergement de modèles LLM

@ LlamaIndex est utilisé pour orchestrer l’ensemble du pipeline RAG.

@ Streamlit pour l’interface utilisateur interactive

Description détaillée des fonctions de démonstration :

  • J’ai créé un Dockerfile qui simplifie le processus de dĂ©ploiement via Docker et garantit une reproductibilitĂ© facile.

  • Utilisez Xinference pour lancer les modèles LLM et d’embedding, et exposez deux ports pour y accĂ©der.

  • ImplĂ©mentez un tĂ©lĂ©chargement de fichiers fluide et une communication interactive avec le moteur de chat en utilisant Streamlit.

  • La vitesse d’embedding des documents est 5 fois plus rapide que celle de l’API d’OpenAI.

  • Utilisez la puissance de GGML pour exĂ©cuter le modèle sur GPU, garantissant une accĂ©lĂ©ration et rĂ©duisant le temps d’attente pour les retours.

Code source :