Ce cours se concentre sur l'intégration des caractéristiques traditionnelles des bases de données avec les capacités de recherche vectorielle afin d'optimiser les performances et la rentabilité des applications de Génération augmentée de récupération (RAG) à grande échelle. Vous apprendrez à appliquer ces techniques clés :
1. Le préfiltrage et le postfiltrage : Ces techniques permettent de filtrer les résultats en fonction de conditions spécifiques. Le préfiltrage est effectué au stade de la création de l'index de la base de données, tandis que le postfiltrage est appliqué après l'exécution de la recherche vectorielle. 2. Projection : Cette technique consiste à sélectionner un sous-ensemble des champs renvoyés par une requête afin de minimiser la taille du résultat. 3. Reclassement : Cette technique consiste à réorganiser les résultats d'une recherche en fonction d'autres champs de données afin de placer les résultats les plus souhaités plus haut dans la liste. 4. Compression des invites : Cette technique est utilisée pour réduire la longueur des invites, dont le traitement peut être coûteux dans les applications à grande échelle. Vous apprendrez également, à l'aide d'exercices pratiques, à.. : 1. Mettre en œuvre la recherche vectorielle pour RAG en utilisant MongoDB. 2. Développer un pipeline d'agrégation MongoDB à plusieurs étapes. 3. Utiliser les métadonnées pour affiner et limiter les résultats de recherche renvoyés par les opérations de base de données, en améliorant l'efficacité et la pertinence. 4. Rationaliser les résultats des opérations de la base de données en incorporant une étape de projection dans le pipeline d'agrégation MongoDB, en réduisant la quantité de données renvoyées et en optimisant les performances, l'utilisation de la mémoire et la sécurité. 5. Reranker les documents pour améliorer la pertinence et la qualité de la recherche d'informations, et utiliser les valeurs des métadonnées pour déterminer la position de réorganisation. 6. Mettre en œuvre la compression rapide et acquérir une intuition sur la façon de l'utiliser et les avantages opérationnels qu'elle apporte aux applications LLM. Commencez à optimiser l'efficacité, la sécurité, la vitesse de traitement des requêtes et le coût de vos applications RAG avec la compression rapide et les techniques d'optimisation des requêtes.











