Garbage in, Garbage out – dieses Problem besteht auch in der Welt der generativen KI. Wenn wir unzulängliche Daten in unser Corporate GPT füttern, dann werden wir am Ende unzulängliche Informationen erhalten. Was können wir dagegen tun?
Ein Gastbeitrag von CEO & Founder Michael Siegmund und CMO Yagmur Anis, qibri GmbH.
Was bedeutet GIGO eigentlich?
Starten wir mit einer kurzen Definition von GIGO:
GIGO – Garbage In, Garbage Out – beschreibt das Prinzip, dass die Ergebnisse eines Computers immer nur so gut sein können wie die Qualität der Daten, die er vorab enthält. Wenn man falsche oder ungenaue Daten eingibt, wird der Computer mit hoher Wahrscheinlichkeit auch fehlerhafte oder wenig brauchbare Ausgaben erzeugen.
💡 Rechner sind nicht in der Lage, von sich aus zu erkennen, ob die Eingaben korrekt oder sinnvoll sind – sie verarbeiten einfach alles, was ihnen gegeben wird. Das bedeutet, dass die Qualität der Ergebnisse direkt von der Qualität der Eingaben abhängt.
Somit ist GIGO ein besonders heißes Thema in Zeiten des Aufstiegs von Corporate GPTs: Wie können wir unsere Unternehmensdaten in einer Qualität abspeichern, dass wir sie zu einem späteren Zeitpunkt auch ideal nutzen können?
Datenqualität wird somit zum essenziellen Bestandteil einer jeden KI-Strategie.
Die Bedeutung von Corporate GPTs
ChatGPT hat unseren Umgang mit Informationen drastisch verändert – wie wir sie suchen, erstellen, verändern. Diese Umwälzung spiegelt sich unmittelbar in den typischen CEO Agenda wider: Die Einführung von Künstlicher Intelligenz steht nun ganz weit oben auf der Prioritätenliste.
Nun nutzen immer mehr Mitarbeitende ChatGPT, um Unterstützung bei der Durchführung verschiedener Aufgaben zu erhalten. Man kann sich denken, dass dabei auch sensible Fragen und Informationen in das Tool eingegeben werden.
Gleichzeitig haben aber nur wenige Unternehmen Corporate GPTs erfolgreich implementiert. Viele kämpfen noch immer mit traditionellen Problemen des Wissens- und Datenmanagements, z. B. unterschiedlichen Repositories, doppelten und veralteten Dokumenten und fehlender Versionskontrolle.
💡 Ein Repository im Datenmanagement ist ein zentraler Speicherort, in dem Daten und digitale Ressourcen systematisch gesammelt, organisiert und verwaltet werden. Repositories gewährleisten die Konsistenz, Integrität und Verfügbarkeit von Informationen. Sie sind entscheidend für die effiziente Datenverwaltung in Unternehmen.
Infolgedessen bleiben offene Systeme wie ChatGPT die bevorzugte Ressource für Mitarbeiter, was jedoch erhebliche Risiken für die Datenvertraulichkeit der Unternehmen birgt.
Wie können Unternehmen also erfolgreiche und sichere Corporate GPTs mit ihren eigenen Daten anlegen und ebendiese Risiken minimieren?
Die wichtigsten Datenqualität-Standards
Die Einführung von Datenqualitätsstandards als Framework kann Unternehmen einen Wettbewerbsvorteil verschaffen. Denn letztlich ist die Qualität der Daten die Grundlage für eine zuverlässige und hochwertige KI-Anwendung.
Zur Bewertung der Datenqualität können grundsätzlich eine Vielzahl von Dimensionen herangezogen werden. Einige davon sind aber absolut grundlegend, auf diese möchten wir an dieser Stelle tiefer eingehen.
Genauigkeit
Viele Unternehmen verwenden Plattformen wie Box, SharePoint oder Notion als Hauptquellen für ihr Wissensmanagement. Diese Plattformen werden jedoch häufig für die tägliche Arbeit genutzt. Das bedeutet, dass auch Dokumente im Entwurfsstatus und ohne Prüfung umfasst werden. Die Erstellung von Inhalten, die unternehmensweit geteilt werden sollen, erfordert hingegen mehrere Überarbeitungen und Anpassungen.
💡 KI ist zunächst nicht in der Lage, zwischen einem Entwurf und einer endgültigen Version zu unterscheiden. Wenn alle Versionen am selben Ort aufbewahrt werden, werden sie konsolidiert, was die Genauigkeit beeinträchtigt.
Validität
Im Geschäftsleben ändern sich die Dinge schnell. Neue Trends entwickeln sich, neue Vorschriften werden fortlaufend eingeführt. Es ist praktisch unmöglich, alle Änderungen bestehender Dokumente nachzuverfolgen.
Wenn jedoch alte Aufzeichnungen im Repository für KI-Initiativen aufbewahrt werden, werden den Mitarbeitenden eventuell Informationen präsentiert, die mittlerweile schon nicht mehr gültig sind.
Konsistenz
Wir alle waren schon einmal in der Situation, dass wir auf mehrere Versionen desselben Dokuments gestoßen sind und Kollegen um Hilfe bitten mussten, um die richtige Version zu identifizieren.
💡 Wenn Informationen, die an verschiedenen Orten gespeichert sind und nicht übereinstimmen, kann auch KI widersprüchliche Ergebnisse liefern.
Zudem wird es schwierig, den Ursprung der Informationen nachzuvollziehen und mit den relevanten Verantwortlichen zu überprüfen.
Vollständigkeit
Wenn verschiedene Teams unterschiedliche Repositories pflegen und auf unterschiedliche Systeme angewiesen sind, ohne eine einheitliche Quelle der Wahrheit, wird das Corporate GPT auf mehreren unvollständigen Elementen trainiert und liefert Antworten, denen bestimmte Einblicke fehlen.
Die Ausgabequalität von Corporate GPTs erhöhen: 5 Strategien.
Glücklichlicherweise haben wir aber doch einige Hebel verfügbar!
Hier sind 5 Strategien, die Unternehmen helfen können, die Ausgabequalität von Corporate GPTs zu verbessern:
1. Ein Framework zur Verringerung von Halluzinationen nutzen
Obwohl Gen AI in der Regel beeindruckende Antworten auf Benutzeranfragen liefert, ist es nicht ungewöhnlich, dass sie auch mal falsche Antworten generiert und als Fakten präsentiert (sogenannte KI-Halluzinationen).
Um dieses Problem zu vermeiden, können wir einen Rahmen wie RAG (Retrieval-Augmented Generation) verwenden. Diese Methode führt unterschiedliche Checks durch um sicherzustellen, dass die ausgegebenen Informationen tatsächlich valide sind.
2. Vergangenheits- und zukunftsorientierte Dokumente trennen
Dokumente können nach ihrer zeitlichen Ausrichtung und ihrem Zweck getrennt werden. Dabei werden tägliche Arbeitsdateien ausgeschlossen und dadurch Inkonsistenzen zu vermieden.
Es könnte beispielsweise sein, dass ein Corporate GPT den Mitarbeitenden zweierlei Informationen einsichtig machen soll:
- Anleitungen, wie Dinge heute zu tun sind: Hierzu können wir eine Quelle aus aktuellen bzw. zukunftsorientierten Dokumenten erstellen, die spezifische Anweisungen in Form von Anleitungen, Richtlinien, SOPs oder Best Practices bieten.
- Informationen darüber, wie Dinge in der Vergangenheit gemacht wurden: Hierfür könnten wir eine Basis aus abgeschlossenen Aufzeichnungen erstellen, die vergangene Bemühungen detailliert beschreiben.
3. Back-Office-Funktionen nutzen
Das bedeutet, dass Entwürfe in einem separaten Bereich erstellt und bearbeitet werden, und nur die endgültigen und abgestimmten Dokumente im Frontend verfügbar sind. Auf diese Weise können mehrere Stakeholder zusammenarbeiten und Beiträge zu den Dokumenten leisten, ohne dass die Gefahr besteht, dass Fehler oder Inkonsistenzen für unser Corporate GPT oder den Endbenutzer sichtbar sind.
4. Verantwortliche zuweisen
Um Transparenz bei den Antworten von Corporate GPTs zu gewährleisten, sollten wir eine klare Informationsbasis schaffen, die die Verantwortlichen für jede Informationseinheit angibt.
Dies kann helfen, die Herausforderungen der Black-Box-Natur der KI-Technologie zu überwinden: So kann eine Information bis auf die Ursprungsquelle zurückverfolgt werden.
5. Silos abbauen
Wenn Abteilungen isoliert voneinander arbeiten und unterschiedliche Formate, Methoden und Software zur Erstellung und Organisation von Informationen verwenden, wird es immer schwieriger, einen vollständigen und übergreifenden Überblick zu schaffen.
Eine Möglichkeit, diese Silos zu überwinden, besteht darin, eine Plattform zu implementieren, die Teamarbeit erleichtert und verschiedene Abteilungen auf ein gemeinsames Ziel hin ausrichtet.
Dieser Ansatz gewährleistet eine effiziente Zusammenarbeit zwischen den verschiedenen Organisationseinheiten und gleichzeitig eine einzige Quelle der Wahrheit für ein Corporate GPT.
Zusammenfassung und Key-Takeaways
GIGO ist ein heißes Thema, wenn wir von Corporate GPTs sprechen. Nur mit gut organisierten Daten ausreichender Qualität können Corporate GPTs nämlich eine wirkliche Unterstützung sein. Wenn wir hingegen schlechte Daten in unser Corporate GPT füttern, können die Ergebnisse irreführend und schädlich für den Geschäftserfolg sein. Genauigkeit, Validität, Konsistenz und Vollständigkeit sind Kriterien für gute Datenqualität.
Diese 5 Strategien helfen bei der Erhöhung der Ausgabenqualität eines Corporate GPT:
- Ein Framework zur Verringerung von Halluzinationen nutzen: Ein RAG kann falsche KI-Antworten reduzieren, indem es Modelle an eine Wissensbasis bindet.
- Vergangenheits- und zukunftsorientierte Dokumente trennen: Dokumente nach zeitlicher Ausrichtung trennen kann die Konsistenz zu erhöhen.
- Back-Office-Funktionen nutzen: Dokumente separat bearbeiten, um Fehler zu vermeiden und hochwertige Endergebnisse zu sichern.
- Verantwortliche zuweisen: Verantwortliche für jede Information zuweisen, um Transparenz zu schaffen.
- Silos abbauen: Eine gemeinsame Plattform fördert die Zusammenarbeit und verhindert isoliertes Arbeiten.
Über die Autoren
Micheal Siegmund ist der CEO & Founder von qibri. Michael hat 25 Jahre Erfahrung im Bereich strategische Unternehmensentwicklung, davon 7 Jahre als Unternehmensberater (u.A. Droege & Accenture), 7 Jahre als Führungskraft in einem Öl & Gas Konzern und 12 Jahre als 3-facher Unternehmensgründer.
Yagmur Anis ist Chief Marketing Officer von qibri. Yagmur hat 12 Jahre Erfahrung im B2B-Marketing mit besonderem Schwerpunkt auf Unternehmenssoftware und Datenanalyse, davon 7 Jahre bei McKinsey & Company.
Über qibri
qibri erfasst und ordnet für Unternehmen bestehendes Knowhow und sorgt für seine kontinuierliche Verbesserung sowie optimale Nutzung im täglichen Betrieb. Darüber hinaus dient qibri als kuratierte und gesicherte Wissensbasis für zukünftige interne LLMs (Corporate GPTs), die Mitarbeitenden zuverlässige Antwort gibt und von Experten weiterentwickelt werden kann. So können Unternehmen, organisatorische Komplexität reduzieren, Operational Excellence erreichen, Produktivität steigern, Transformation erleichtern und die Grundlage für zuverlässige Gen-AI schaffen.
Klingt spannend?
Sprechen wir doch über Ihr Unternehmen, um Ihre KI-Potentiale aufzudecken!