Daten-Pipelines

Pipelines sind automatisierte Workflows, die Dokumente in durchsuchbare Wissensdatenbanken für KI-Agenten umwandeln. Sie überwachen Dateispeicherorte, verarbeiten Dokumente bei Änderungen und pflegen Vektordatenbanken, die von Agenten für Informationen abgefragt werden.

Dokumentverarbeitungs-Workflow

Rohe Dokumente können nicht direkt von Agenten abgefragt werden. PDFs und Word-Dateien müssen in Text umgewandelt, in überschaubare Teile zerlegt und in Vektor-Embeddings transformiert werden, die eine semantische Suche ermöglichen. Pipelines übernehmen diese Transformation automatisch.

Das Diagramm zeigt den vollständigen Fluss von der Dokumentenerfassung bis zu den Agentenabfragen. Jede Phase transformiert die Daten, um sie durchsuchbar und abrufbar zu machen.

Automatische Synchronisierung

Pipelines überwachen Datenquellen auf Änderungen. Wenn ein Dokument hinzugefügt, geändert oder gelöscht wird, verarbeitet die Pipeline die Änderung und aktualisiert die Wissensdatenbank. Dies hält die Antworten der Agenten ohne manuelles Eingreifen aktuell.

Orchestrierung mit Dagster

Dagster orchestriert die Pipeline-Ausführung und kümmert sich um Planung, Wiederholungen und Protokollierung. Jeder Verarbeitungsschritt wird verfolgt, wodurch ein Audit-Trail von der Dokumentenerfassung bis zur Speicherung entsteht. Sie können Pipeline-Läufe überprüfen, um Probleme zu beheben, die Dokumentenverarbeitung zu verifizieren und die Datenqualität zu überwachen.

Einführung: Die Vision des Swiss AI Hub

Warum Swiss AI Hub

Schnellstart: Ihre ersten 30 Minuten

Plattform-Architektur

Bereitstellungsanleitung

Überwachung und Alarmierung

Einrichtung des Identitätsanbieters

Microsoft Entra ID

Agents

Daten-Pipelines

8 Knowledges

Chat-Schnittstelle

Zugriffsverwaltung

Auditierung und Beobachtbarkeit

Sprachmodelle

Gedächtnis

Mandantenfähigkeit

17 Slack Teams Integrations

18 Api

Sicherheit

Compliance und Vorschriften

Schnellstart

Agenten erstellen

Pipelines erstellen

Prozesse erstellen

Erweiterte SDK-Themen

Funktionen

Mitwirken

KI für Beiträge nutzen

Zertifizierung

API-Referenz

Fehlerbehebung

Glossar

Pipeline

Sources

Daten-Pipelines

Dokumentverarbeitungs-Workflow

Automatische Synchronisierung

Orchestrierung mit Dagster

Überwachung und Alarmierung

Einrichtung des Identitätsanbieters

Microsoft Entra ID

Sources

Daten-Pipelines ​

Dokumentverarbeitungs-Workflow ​

Automatische Synchronisierung ​

Orchestrierung mit Dagster ​

Daten-Pipelines

Dokumentverarbeitungs-Workflow

Automatische Synchronisierung

Orchestrierung mit Dagster