Was KI bei Sicherheitsdatenblättern überhaupt leisten kann
Sicherheitsdatenblätter sind strukturierte Dokumente – und genau das macht sie zu einem naheliegenden Anwendungsfall für KI-gestützte Verarbeitung. Jedes SDS folgt demselben 16-Abschnitte-Schema nach REACH, enthält standardisierte Codes wie H- und P-Sätze, CAS-Nummern und Einstufungsangaben. Theoretisch gute Voraussetzungen dafür, dass ein Sprachmodell wie GPT-4 oder ein spezialisiertes Extraktionssystem die relevanten Informationen erkennt, benennt und weiterverarbeitet.
In der Praxis ist das differenzierter. Die Qualität von Sicherheitsdatenblättern variiert erheblich: manche Lieferanten liefern sauber formatierte PDFs mit klarer Struktur, andere gescannte Dokumente mit schlechter Texterkennung, uneinheitlichen Tabellenformaten oder gar handschriftlichen Ergänzungen. Hinzu kommt, dass Abschnitt 3 je nach Hersteller unterschiedlich tief ausgefüllt ist, Einstufungen manchmal fehlen oder widersprüchliche Angaben zwischen Abschnitt 2 und 15 auftauchen.
KI kann hier keine inhaltliche Prüfung ersetzen – sie kann aber den Aufwand für Extraktion, Klassifikation und Zuordnung deutlich reduzieren. Der Unterschied liegt darin, welchen Reifegrad die KI-Anwendung hat und wie sie in den bestehenden Prozess eingebettet ist.
Die vier Reifegrade KI-gestützter SDS-Verarbeitung
Es ist sinnvoll, KI-Anwendungen im SDS-Kontext nicht pauschal zu betrachten, sondern nach ihrem Automatisierungsgrad zu unterscheiden. In der Praxis lassen sich vier Stufen beobachten, die sich in Aufwand, Zuverlässigkeit und Implementierungstiefe unterscheiden.
Stufe 1: Assistiertes Lesen und Suchen
Auf dieser Stufe hilft KI dabei, Inhalte aus einem SDS schneller zu finden und verständlich aufzubereiten. Ein konkretes Beispiel: Ein Produktionsmitarbeiter hat ein 22-seitiges SDS eines Klebstoffs vorliegen und möchte wissen, welche persönliche Schutzausrüstung vorgeschrieben ist. Anstatt das Dokument manuell zu durchsuchen, gibt er es in ein KI-Tool ein und fragt direkt. Stufe-1-Systeme funktionieren wie ein intelligenter Leser – sie antworten auf Fragen zum Dokument, extrahieren aber keine Daten für nachgelagerte Systeme.
Der Nutzen ist real, aber begrenzt. Die fachliche Einschätzung bleibt beim Menschen. Auf dieser Stufe befinden sich viele Unternehmen, die ChatGPT oder ähnliche Tools informell und ohne strukturierten Prozess einsetzen.
Stufe 2: Strukturierte Extraktion
Hier geht es darum, definierte Felder aus dem SDS automatisch auszulesen: Produktname, CAS-Nummern, Einstufungsklassen, H- und P-Sätze, Lagerbedingungen, Entsorgungshinweise. Die Ausgabe ist kein Fließtext mehr, sondern strukturierte Daten, die in ein Gefahrstoffverzeichnis oder eine Datenbank übernommen werden können.
Das klingt einfach, ist es aber nicht immer. Tabellen in PDFs werden von Sprachmodellen oft nicht korrekt ausgelesen. Extraktionssysteme brauchen entweder saubere Dokumente oder einen nachgelagerten Prüfschritt. In der Praxis empfiehlt sich ein Konfidenz-Scoring: Das System markiert Felder, bei denen die Extraktion unsicher war, zur manuellen Nachprüfung.
Stufe 3: Automatische Klassifikation und Zuordnung
Auf dieser Stufe erkennt das System nicht nur Daten, sondern interpretiert sie: Es ordnet ein Produkt automatisch einer Gefahrstoffklasse zu, erkennt, ob eine neue Version eines bereits bekannten SDS vorliegt, oder schlägt basierend auf der Einstufung relevante Betriebsbereiche vor. Das ist deutlich komplexer und setzt eine gut strukturierte Datenbasis voraus.
Ein typischer Praxisfall: Ein Unternehmen erhält monatlich neue SDS von 30 verschiedenen Lieferanten. Statt jedes Dokument manuell einzusortieren, erkennt das System anhand von Produktname, CAS-Nummern und Einstufung automatisch, ob es sich um eine Aktualisierung eines bekannten Produkts handelt, und markiert geänderte Abschnitte zur Prüfung. Das spart erheblichen manuellen Aufwand – vor allem wenn Lieferanten dasselbe Produkt unter leicht abweichenden Bezeichnungen liefern.
Stufe 4: Prozessintegration und Ableitung
Die höchste Stufe verbindet SDS-Daten mit nachgelagerten Prozessen: Gefährdungsbeurteilungen werden automatisch auf Aktualitätsbedarf geprüft, wenn sich ein SDS ändert. Betriebsanweisungen erhalten einen Hinweis, wenn sich relevante Schutzmaßnahmen im zugrunde liegenden SDS geändert haben. Lieferantenwechsel lösen automatische Prüfprozesse aus.
Diese Stufe ist technisch anspruchsvoll und erfordert nicht nur gute KI-Komponenten, sondern auch saubere Datenstrukturen und definierte Prozesse als Grundlage. Wer hier ohne Vorbereitung einsteigt, riskiert, Automatisierung auf chaotischen Daten aufzubauen – was die Fehlerquote eher erhöht als senkt.
Wo KI heute realistisch einsetzbar ist – und wo nicht
Die technischen Möglichkeiten sind beeindruckend, aber die Erwartungen müssen realistisch bleiben. Sprachmodelle wie GPT-4 können SDS-Inhalte gut zusammenfassen, H-Sätze erklären und einfache Fragen beantworten. Sie halluzinieren aber auch – das heißt, sie erfinden gelegentlich Informationen, die im Dokument nicht stehen. Technisch lässt sich das durch dokumentengebundenes Grounding reduzieren: Dabei wird das Modell strikt auf das vorliegende Quelldokument beschränkt, anstatt auf allgemeines Trainingswissen zurückzugreifen – ein Ansatz, der in professionellen Extraktionssystemen als Retrieval-Augmented Generation (RAG) umgesetzt wird. Im SDS-Kontext ist Halluzination ein ernstes Problem, denn eine falsch ausgelesene Einstufung oder ein übersehener CMR-Hinweis kann echte Konsequenzen haben.
Realistisch einsetzbar ist KI heute für:
- Dokumentenextraktion mit Prüfschritt: KI liest Felder aus, ein Mensch validiert unsichere Ergebnisse – sinnvoll bei großen Dokumentenmengen mit überschaubarem Prüfaufwand.
- Versionserkennung: Das System vergleicht zwei SDS-Versionen und hebt geänderte Abschnitte hervor, anstatt manuell 22 Seiten PDF gegen 24 Seiten PDF zu prüfen. Wie aufwändig das manuell ist, zeigt auch der Beitrag Versionsvergleich von Sicherheitsdatenblättern: Manuell vs. strukturiert.
- Mehrsprachige Verarbeitung: KI kann SDS in verschiedenen Sprachen einheitlich auslesen und in eine standardisierte Struktur überführen – relevant für Unternehmen mit internationalen Lieferanten.
- Bereichszuordnung: Anhand von Produkttyp und Einstufung schlägt das System vor, in welchen Betriebsbereichen das SDS verfügbar sein sollte.
Nicht geeignet ist KI derzeit für:
- Fachliche Bewertung: Ob eine Einstufung korrekt ist, ob Substitutionsbedarf besteht oder ob ein CMR-Stoff überhaupt eingesetzt werden sollte – das bleibt Aufgabe qualifizierter Personen.
- Rechtssichere Vollautomatisierung ohne Review: Wer KI-extrahierte Daten ohne Prüfschritt in compliance-relevante Systeme überführt, erhöht das Risiko stiller Fehler.
- Schlechte Eingabedokumente: Gescannte PDFs mit niedriger Auflösung, handschriftliche Ergänzungen oder stark abweichende Formate limitieren die Extraktionsqualität erheblich.
Implementierung: Worauf es beim Einstieg ankommt
Wer KI-gestützte SDS-Verarbeitung einführen will, sollte methodisch vorgehen. Der häufigste Fehler ist, mit einem Piloten auf den komplexesten Dokumenten zu starten – also genau dort, wo die Fehlerquote am höchsten ist. Sinnvoller ist ein strukturierter Ansatz.
- Datenbasis klären: Wie viele SDS sind im Bestand? Wie viele davon liegen als durchsuchbare PDFs vor, wie viele als Scans? Ohne diese Grundlage lässt sich der Automatisierungsgrad nicht realistisch einschätzen.
- Piloten auf guten Dokumenten starten: Die ersten Tests sollten auf sauber strukturierten SDS basieren, um die Extraktionsqualität realistisch zu bewerten, bevor schwierigere Dokumente hinzukommen.
- Konfidenz-Schwellen definieren: Welche Felder müssen zwingend manuell geprüft werden? Typisch sind: Einstufung nach CLP, CMR-Angaben, Abschnitt 8 (Schutzmaßnahmen).
- Prüfprozess integrieren: KI-Extraktion ohne Prüfschritt ist kein nachhaltiger Prozess. Es braucht klare Verantwortung, wer was prüft und wie oft.
- Schnittstellen definieren: Sollen KI-extrahierte Daten ins Gefahrstoffverzeichnis fließen? In die Gefährdungsbeurteilung? Die technische Integration ist oft der aufwändigste Teil.
Wenn der operative Engpass vor allem in Suche, Versionsverfolgung und Bereichszuordnung liegt, kann eine schlanke Lösung wie SDS Engine als strukturierte Grundlage dienen – bevor komplexere KI-Pipelines aufgebaut werden. Ohne saubere Grundstruktur laufen KI-Prozesse schnell ins Leere.
Typische Fehlannahmen beim Einsatz von KI für SDS
In der Praxis begegnen immer wieder dieselben Missverständnisse, wenn Unternehmen KI für die SDS-Verwaltung evaluieren.
„KI erkennt automatisch, ob ein SDS veraltet ist"
Das stimmt nur bedingt. KI kann das Versionsdatum extrahieren und mit einem bekannten Datum vergleichen. Ob eine neue Revision fällig ist – etwa weil sich die CLP-Einstufung eines enthaltenen Stoffs geändert hat oder weil neue Erkenntnisse zur Toxikologie vorliegen – erfordert fachliches Wissen, das ein allgemeines Sprachmodell nicht zuverlässig liefert. Dazu passt ergänzend der Beitrag Wie oft müssen Sicherheitsdatenblätter aktualisiert werden?, der erklärt, welche Auslöser nach REACH relevant sind.
„ChatGPT kann SDS direkt prüfen und Fehler erkennen"
Sprachmodelle können plausibel klingende Aussagen über SDS-Inhalte machen. Aber sie haben keine verlässliche Kenntnis der aktuellen Einstufungsdaten im C&L Inventory, keine Verbindung zu aktuellen Stoffdatenbanken und keine Möglichkeit, interne Inkonsistenzen im SDS systematisch zu erkennen. Wer ein Sprachmodell bittet, ein SDS auf Vollständigkeit zu prüfen, bekommt eine Antwort – aber keine Garantie auf Richtigkeit.
„KI spart ab sofort den manuellen Aufwand komplett"
Realistische Einsparungen liegen je nach Dokumentenqualität und Prozesstiefe bei 40–70 % des manuellen Aufwands für Extraktion und Zuordnung. Der verbleibende Aufwand konzentriert sich auf fachliche Prüfung, Ausnahmen und Grenzfälle. Das ist ein erheblicher Gewinn – aber kein Nullaufwand.
Nachhaltigkeit in der KI-Nutzung: Prozess schlägt Technologie
Der Begriff „nachhaltig" im Kontext von KI und SDS bedeutet nicht, möglichst viel zu automatisieren. Er bedeutet, Prozesse aufzubauen, die langfristig funktionieren – auch wenn sich Tools ändern, Lieferanten wechseln oder neue regulatorische Anforderungen hinzukommen.
Ein Unternehmen, das 200 SDS mit einer durchdachten Struktur, klaren Verantwortlichkeiten und einem verlässlichen Prüfprozess verwaltet, ist besser aufgestellt als eines, das 5.000 PDFs in einer KI-Pipeline verarbeitet, ohne zu wissen, ob die Ausgabe korrekt ist. Nachhaltigkeit entsteht nicht durch Automatisierung allein, sondern durch die Kombination aus guter Datengrundlage, klar verteilten Rollen und einem KI-Einsatz, der den menschlichen Review nicht ersetzt, sondern gezielt reduziert.
Wenn genau hier Versionsstände, Bereichsbezug und Aktualität auseinanderlaufen, kann SDS Engine sinnvoll unterstützen – ohne den fachlichen Review zu ersetzen. Der Wert liegt in der strukturierten Grundlage, auf der KI-Prozesse erst dann zuverlässig werden, wenn sie gebraucht werden.
KI verändert die SDS-Verwaltung – aber nicht durch einen einmaligen Technologiesprung, sondern durch schrittweise Reifung von Extraktion über Klassifikation bis zur Prozessintegration. Wer diesen Weg realistisch geht, kann erheblichen operativen Aufwand reduzieren und gleichzeitig die Qualität der Daten verbessern. Wer zu schnell zu hoch greift, riskiert, Automatisierung auf unsicherer Grundlage aufzubauen – mit entsprechenden Folgen für Compliance und Prüffestigkeit.