Dieser Kurs konzentriert sich auf die Integration traditioneller Datenbankfunktionen mit den Möglichkeiten der Vektorsuche, um die Leistung und Kosteneffizienz großer Retrieval Augmented Generation (RAG)-Anwendungen zu optimieren. Sie lernen, wie Sie diese Schlüsseltechniken anwenden können:
1. Vorfilterung und Nachfilterung: Dies sind Techniken zum Filtern von Ergebnissen auf der Grundlage bestimmter Bedingungen. Die Vorfilterung erfolgt in der Phase der Indexerstellung in der Datenbank, während die Nachfilterung nach der Durchführung der Vektorsuche angewendet wird. 2. Projektion: Bei dieser Technik wird eine Teilmenge der von einer Abfrage zurückgegebenen Felder ausgewählt, um die Größe der Ausgabe zu minimieren. 3. Neuordnung: Hierbei werden die Ergebnisse einer Suche auf der Grundlage anderer Datenfelder neu geordnet, um die gewünschten Ergebnisse in der Liste weiter nach oben zu verschieben. 4. Prompt-Komprimierung: Diese Technik wird verwendet, um die Länge von Prompts zu reduzieren, deren Verarbeitung in großen Anwendungen teuer sein kann. In praktischen Übungen lernen Sie außerdem, wie man: 1. Implementierung der Vektorsuche für RAG mit MongoDB. 2. Entwicklung einer mehrstufigen MongoDB-Aggregationspipeline. 3. Verwendung von Metadaten zur Verfeinerung und Einschränkung der von Datenbankoperationen zurückgegebenen Suchergebnisse, um die Effizienz und Relevanz zu verbessern. 4. Rationalisierung der Ergebnisse von Datenbankoperationen durch Integration einer Projektionsstufe in die MongoDB-Aggregationspipeline, wodurch die zurückgegebene Datenmenge reduziert und die Leistung, Arbeitsspeichernutzung und Sicherheit optimiert werden. 5. Neueinstufung von Dokumenten, um die Relevanz und Qualität der Informationsabfrage zu verbessern, und Verwendung von Metadatenwerten zur Bestimmung der Neuordnungsposition. 6. Implementierung der Prompt-Komprimierung und Erlernen ihrer Funktionsweise und ihrer Vorteile für LLM-Anwendungen. Optimierung der Effizienz, der Sicherheit, der Abfragegeschwindigkeit und der Kosten Ihrer RAG-Anwendungen durch Prompt-Komprimierung und Techniken zur Abfrageoptimierung.












