Jeder spricht von Daten, jeder produziert Daten – ob er will oder nicht. Aber was sind eigentlich Daten?

Daten sind vielfach sehr stark auf das eigene Unternehmen und Geschäftsmodell bezogen und können daher auch nicht einfach für andere Zwecke eingesetzt werden. Angenommen ein Immobilienmakler sammelt Daten über Hausverkäufe in einer ländlichen Region. Das Unternehmen baut eine umfassende Datensammlung auf, mit der von bestimmten Eigenschaften der Immobilie (Nutzfläche, Anzahl Bäder, Anzahl Schlafräume, Baujahr, etc.) mit hoher Wahrscheinlichkeit der mögliche Verkaufspreis geschätzt werden kann.

Obgleich wir nun auf der Basis dieser Daten ein KI-System zur Ermittlung möglicher Verkaufspreise erstellen könnten, wird unser System im engeren Umfeld einer Metropole wahrscheinlich sehr schlecht arbeiten, da die zugrundeliegenden Daten allesamt aus dem ländlichen Umfeld stammen.

Wie kommt man also an verwendbare Daten?

Der direkte Weg, um an Daten, die die Basis für ein KI-System bilden können, zu kommen lautet: manuelles Klassifizieren. In der Produktion werden Fotos aller erzeugten Güter angefertigt. Diese werden einem Mitarbeiter der Qualitätssicherung vorgelegt und dieser entscheidet für jedes Foto, ob das abgebildete Produkt verkauft werden kann oder ob es sich um Ausschussware handelt.

Leichter kommt man zu Daten, dort wo sie ohnehin produziert werden. Betreibt das Unternehmen etwa einen Webshop, so können über jeden Besucher im Shop sehr genaue Daten.

Bis zum Jahr 2025 werden durch KI-Systeme weltweit über 36,8 Mrd. US-Dollar Umsatz generiert werden.

In der industriellen Produktion erzeugen Maschinen laufend Zustandsdaten. Diese Daten können gespeichert werden und für die Berechnung von Ausfallwahrscheinlichkeiten verwendet werden. Aus diesen Daten können die Werte verschiedenster Sensoren ausgelesen werden. Zusätzlich weiß man, ob dieser Zustand zu einem Ausfall der Maschine geführt hat oder nicht.

Mit diesem Datensatz kann nun ein KI-System in Form eines A>B Mappings modelliert werden. A ist das Set von Messwerten aus den Sensoren und B ist die Klassifizierung, ob die Maschine ausgefallen ist oder nicht.

So kann mittels KI in Zukunft eine bedarfsorientierte, vorausschauende Wartung an der Maschine veranlasst werden, um mögliche Stillstandzeiten durch Ausfall zu reduzieren bzw. zu minimieren.

Natürlich gibt es inzwischen auch schon eine Vielfalt an frei oder kommerziell verfügbaren Datensammlungen, die für das Erstellen von KI-Systemen verwendet werden können.

Use und Miss-Use von Daten

Doch aus Daten allein kann nicht automatisch auch eine erfolgreiche KI-Transformation im Unternehmen durchgeführt werden. Insbesondere in der Nutzung bzw. schlechten Nutzung von Daten liegen vielerorts Fallstricke versteckt.

Eine mögliche falsche Annahme lautet:

„Wir haben so viel Daten in unserem Unternehmen gesammelt. Diese müssen nur einem KI-Team übergeben werden. Das KI-Team macht diese Daten dann wertvoll.”

Dieses Vorgehen kann – muss aber nicht – funktionieren. In der Regel sind mehr Daten für KI sinnvoll, doch nur weil ich viele Terabytes an Daten gesammelt habe, können diese nicht zwingend sinnvoll für KI eingesetzt werden. Im schlimmsten Fall werden andere Unternehmen nur wegen deren Daten aufgekauft, um im Endeffekt erkennen zu müssen, dass deren Daten für die geplanten KI-Ziele wertlos waren.

Im umgekehrten Fall könnte man folgende Aussagen treffen: „Unsere IT im Unternehmen arbeitet perfekt. Gib uns einfach nur 3 Jahre und wir werden das perfekte Datenset für KI-Ziele aufbauen. Wir raten ausdrücklich von dieser Strategie ab, da sie möglicherweise Zeitverschwendung darstellt. Sobald eine respektable Menge an Daten gesammelt wurde, sollte das KI-Team eingebunden werden. Gemeinsam kann dann die Qualität der Daten analysiert werden und ein Plan für das weitere Vorgehen oder erste KI Pilotprojekte definiert werden.

Allgemein gilt festzuhalten, dass eine frühe und laufende Integration des KI-Teams bereits in der Phase der Datensammlung und -aufbereitung ein wesentlicher Treiber für die erfolgreiche Umsetzung des KI-Transformationsprozesses im Unternehmen darstellt.