Datenanalyse: Was ist das?
Datenanalyse ist dazu da, anhand unterschiedlicher Methoden Informationen aus vorhandenen Daten abzuleiten, um daraus Schlüsse zu ziehen, die Unternehmen bei der Entscheidungsfindung unterstützen. Welche Methoden werden dabei angewandt? Und wo kommt Datenanalyse zum Einsatz?
1. Was versteht man unter Datenanalyse?
Bei der Datenanalyse werden statistische Methoden verwendet, anhand derer bereits bestehende Daten analysiert werden, um für ein Unternehmen relevante Informationen zu einem bestimmten Bereich zu gewinnen. Diese Informationen dienen als Basis für die Entscheidungsfindung. In Zeiten, in denen die Datenmengen schier unendlich scheinen und nicht aufhören zu wachsen, ist es für Unternehmen ein Muss, diese Daten entsprechend zu verarbeiten und zu analysieren. Denn nur so können die gesammelten Daten genutzt werden, um zukünftige Unternehmensschritte zu planen, bereits getätigte Entscheidungen zu bewerten und Risiken zu minimieren.
Die Datenanalyse oder Datenauswertung beschreibt den Prozess der Gewinnung von wertvollen Informationen aus Rohdaten. Diese Daten kommen oft aus einem sogenannten Data Warehouse, in dem bereits die Vorarbeit der logischen Verknüpfung von Daten erfolgte. Somit stehen diese für die statistische Analyse zur Verfügung. Die aus der Analyse resultierenden Ergebnisse werden dann in Form von Zahlen, Fakten, Metriken oder Datenvisualisierungen (z.B. Diagramme, Tabellen) veranschaulicht und zur Weiterverwendung bereitgestellt.
2. Aus welchen Schritten setzt sich die Datenanalyse zusammen?
Ein typischer Datenanalyse-Prozess setzt sich aus sieben Schritten zusammen:
- Einlesen: Die Daten in das richtige Format (z.B. CVS) bringen, um sie analysieren zu können.
- Explorieren: Die Daten reinigen, prüfen und kennenlernen, fehlende Daten ersetzen.
- Modifizieren: Den Datensatz an das Vorhaben anpassen und so darstellen, dass er für die weitere Bearbeitung genützt werden kann.
- Modellieren: Die Formel (Funktion) finden, die die Daten möglichst gut erklärt. Meist müssen mehrere Modelle verglichen werden.
- Validieren: Herausfinden, ob das gewählte Modell auch neue Daten erklären kann (Validierungsstichprobe).
- Bewerten: Bestimmen, ob die Ergebnisse der Datenanalyse relevant sind.
- Zusammenfassen: Die Methode und die Ergebnisse so zusammenfassen, dass sie verwertbar und reproduzierbar sind.
3. Welche Methoden der Datenanalyse gibt es?
Es gibt im Wesentlichen vier Methoden, die bei der Datenanalyse zum Einsatz kommen. Gereiht von der einfachsten bis zur anspruchsvollsten Methode lauten sie wie folgt:
- Descriptive Analytics
- Diagnostic Analytics
- Predictive Analytics
- Prescriptive Analytics
Welche dieser vier Methoden tatsächlich zur Datenauswertung herangezogen wird, hängt nicht zuletzt von der Frage ab, ob analysiert werden soll, was in der Vergangenheit geschah und warum oder ob herausgefunden werden soll, was man in Zukunft besser machen kann. Im Zentrum der unterschiedlichen Analysemethoden steht die Eruierung von Trends und Mustern, die Aussagekraft haben in Bezug auf Vergangenes, Gegenwärtiges oder Zukünftiges. Je komplexer die Methode der Datenanalyse, desto wertvoller sind die Ergebnisse.
Descriptive Analytics
Die deskriptive oder beschreibende Datenanalyse konzentriert sich auf Daten aus der Vergangenheit, um daran zu erkennen, was passiert ist. Sie liefert beispielsweise Informationen über den Umsatz im letzten Quartal, wie viele PatientInnen im letzten Monat stationär behandelt oder wie viele Artikel in einem Geschäft zurückgegeben wurden. Dabei werden die in den Einzeldaten vorhandenen Informationen verdichtet und so dargestellt, dass wesentliche Schlüsse daraus gezogen werden können.
Die Ergebnisse der Descriptive Analytics dienen lediglich der Veranschaulichung dessen, was falsch und was richtig war. Es geht dabei jedoch nicht darum, warum etwas falsch oder richtig gelaufen ist. Deshalb wird die deskriptive Datenanalyse meist mit anderen Analysemethoden kombiniert, um ein umfassendes, aussagekräftiges Ergebnis zu erlangen.
Diagnostic Analytics
Bei der diagnostischen Datenanalyse werden historische und andere Daten miteinander verglichen, um Muster zu erkennen, Zusammenhänge aufzudecken und Ursachen und gegenseitige Wechselwirkungen zu identifizieren. Es geht dabei darum, herauszufinden, warum etwas passiert ist. Diese Methode ermöglicht es Unternehmen, Einblick in Problemstellungen und deren Ursachen zu erlangen, um diese im Anschluss lösen zu können.
Predictive Analytics
Die prädiktive oder vorhersagende Analyse hilft dabei, einen Blick in die Zukunft zu werfen. Anhand dieser Analysemethode soll herausgefunden werden, was in der Zukunft passiert bzw. passieren könnte. Um Vorhersagen treffen zu können, werden die Ergebnisse bereits durchgeführter deskriptiver oder diagnostischer Analysen verwendet. Anhand verschiedener, komplexer Algorithmen und moderner Technologien werden Tendenzen ermittelt, um zukünftige Trends voraussagen zu können. Wie genau und wahrscheinlich die Vorhersagen der Predictive Analytics sind, hängt nicht zuletzt von der Qualität der Daten und den eingesetzten Algorithmen ab. Es darf dabei nie vergessen werden, dass es sich um Prognosen handelt, die sich situationsbedingt verändern können.
Prescriptive Analytics
Die präskriptive oder verordnende Datenanalyse ist die komplexeste und aufwendigste Analysemethode. Gleichzeitig ist sie für Unternehmen von unglaublich großem Wert, da anhand ihrer Ergebnisse entschieden werden soll, welche Maßnahmen zu treffen sind, um etwa ein künftiges Problem zu verhindern, zu beseitigen oder kommende Trends zu nutzen.
Prescriptive Analytics arbeitet dabei nicht nur mit historischen Daten, sondern benötigt auch aktuelle Informationen aus internen und externen Quellen, um Vorhersagen laufend aktualisieren zu können. Dazu kommt eine Reihe von modernen Technologien wie etwa maschinelles Lernen, Simulationsmodelle, neurale Netzwerke und Business Regeln. Aufgrund dieser Komplexität sollte ein Unternehmen überlegen, ob sich der Aufwand für den Einsatz präskriptiver Datenanalyse tatsächlich lohnt.
4. Warum ist Datenanalyse so wichtig?
Eine immer größer werdende Datenflut, multidimensionale IT-Systeme, steigende Datenkomplexität und große Konkurrenz zwingen Unternehmen praktisch dazu, digitale Datenanalysemethoden einzusetzen, um die große Menge an Daten zu ihrem Vorteil nutzen zu können.
Die Datenanalyse bietet Unternehmen einen tiefen, umfassenden Einblick in verschiedene Abläufe. Durch die strukturierte Auswertung von Daten werden Muster und Trends in den Daten erkannt. Sie ist ein wesentlicher Bestandteil der Business Intelligence bzw. Business Analytics, die direkten Einfluss auf den geschäftlichen Erfolg haben. Denn nur wer vorhandene Daten nachhaltig und intelligent nutzt, verarbeitet und analysiert kann effizient planen und die Abläufe zukünftig verbessern, um in Folge den Umsatz zu steigern, Geschäftsprozesse zu optimieren und dem Unternehmen Wachstum zu verleihen.
5. Wo kommt Datenanalyse zum Einsatz?
Prinzipiell lohnt sich die Datenanalyse für alle NutzerInnen, die anhand gesammelter Daten Entscheidungen treffen müssen. Besonders beliebt sind die Methoden der Datenanalyse in den Bereichen:
- Meinungsforschung
- Analysen in der Wissenschaft
- Klinische Studien
- Reporting (Berichtswesen) in Unternehmen
- Marketing
6. Welche Werkzeuge eignen sich zur Datenanalyse?
Ein Unternehmen muss nicht zwangsweise über eine professionelle IT-Abteilung verfügen, um von den Methoden der Datenanalyse profitieren zu können. Es gibt eine Reihe von gängigen Werkzeugen, anhand derer Daten analysiert werden können:
- Excel
Am Programm Microsoft Excel führt in der modernen Berufswelt so gut wie kein Weg vorbei. Spreadsheets und Tabellen sind fester Bestandteil der Geschäftstätigkeiten. Viele Unternehmen verwalten ihre Daten anhand des praktischen Programms, weshalb sich die Analyse mithilfe der standardmäßig vorhandenen Analysefunktionen anbietet.
- SQL
Auch SQL-Server-Datenbanken werden von vielen Unternehmen bevorzugt verwendet, um umfangreiche Datenmengen zu speichern. Um diese Datenmengen zu analysieren, können Werkzeuge wie zum Beispiel SQL Server Analysis Services zum Einsatz kommen.
- Programmiersprachen wie Python oder R
Viele Werkzeuge im Bereich des maschinellen Lernens (künstliche Generierung von Wissen aus Erfahrung) und die dafür erforderlichen Modellen basieren auf Programmiersprachen wie Python oder R.
Ob im kleinen oder im großen Stil, an Datenanalyse kommt kein Unternehmen vorbei. Gesammelte Daten sind wertvoll, sie nicht dazu zu nutzen, um Geschäftsabläufe einerseits auf ihre Effizienz zu prüfen und andererseits zukünftig zu optimieren wäre ein Verlust. Je nachdem, um welche Art von Unternehmen es sich handelt, mit welchen Produkten gehandelt wird oder welche Services geboten werden lohnt es sich, verschiedene Analysemethoden anzuwenden bzw. anwenden zu lassen. Die dadurch erlangten Ergebnisse haben große Aussagekraft und einen hohen Mehrwert.
Hier finden sich weitere Informationen zu unserem Master-Lehrgang Business Analyticss und unseren Praxisseminaren Big Data und AI im Wandel der Zeit, AI in Anwendung sowie Data Science and Machine Learning.