Réordonnancement#

Apprenez à utiliser le modèle de réordonnancement dans Xinference.

Introduction#

Étant donné une requête et une série de documents, Rerank réordonne les documents de la manière la plus pertinente à la moins pertinente en fonction de la pertinence sémantique avec la requête. Dans Xinference, le modèle Rerank peut être appelé via le point de terminaison Rerank pour trier une série de documents.

Démarrage rapide#

Nous pouvons essayer d’utiliser l’API Rerank via cURL, le client OpenAI ou Xinference :

curl -X 'POST' \
  'http://<XINFERENCE_HOST>:<XINFERENCE_PORT>/v1/rerank' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "<MODEL_UID>",
    "query": "A man is eating pasta.",
    "documents": [
        "A man is eating food.",
        "A man is eating a piece of bread.",
        "The girl is carrying a baby.",
        "A man is riding a horse.",
        "A woman is playing violin."
    ]
  }'