Big Data Analytics und Anwendungsbeispiele aus der Praxis

Software Wissen Logo

Durch die starke Digitalisierung der letzten Jahrzehnte werden Unternehmen und Systeme mit der Analyse immer größerer Datenmengen konfrontiert. Die klassischen BI-Strukturen sind mit der Analyse von großen Datenvolumina überfordert, was den Zugriff und die Auswertung interner und externer Daten für Unternehmen erschwert.

In klassischen BI-Lösungen fungieren Data Warehouses, basierend auf relationalen Datenbanken als Datenspeicher. Da relationale Datenbanken eine gewisse Struktur erfordern, ist es notwendig, unstrukturierte im Vorfeld aufzubereiten und Metadaten zu erzeugen, was immense Rechen- und Speicherkapazitäten beansprucht und sich in einer geringen Abfragegeschwindigkeit niederschlägt. Angesichts des hohen Datenvolumens bei Big Data stoßen die relationalen Datenbanken bei BI-Anwendungen zunehmend an die Grenzen der wirtschaftlichen Machbarkeit – bei teils sehr mäßiger Performance.  

Ein ungebrochener Trend in der BI-Branche stellt daher die Entwicklung neuer Software dar, welche die Analyse von Big Data erst ermöglicht und optimiert.

Big Data Analytics in der Praxis

Leistungsfähige Big-Data-Software ist in der Lage unterschiedliche Datensätze gleichzeitig zu verarbeiten, ermöglicht den Import großer Datenmengen und bietet die Möglichkeit, unterschiedliche Informationstypen zu analysieren. Dies ist vor allem bei der Auswertung unstrukturierter Daten (beispielsweise aus sozialen Netzwerken) ein großer Vorteil.

Einen neueren Trend stellt die Datennutzung in der Cloud dar. Cloud-Lösungen bieten Potenzial für eine flexiblere Performance, Verringerung der Servicekosten und schnellere Erneuerung von Systemumgebungen. Allerdings gibt es von Unternehmensseite nach wie vor Einwände bezüglich des Datenschutzes und der Datensicherheit.

Big-Data-Software: Aufbau und Produkte

Je nach Anforderungen gibt es verschiedene Software-Angebote auf dem Markt:

Im Mittelpunkt stehen vor allem die Auswertung qualitativer Daten und deren Transformation in quantitativ nutzbare Informationen für die Erstellung von Grafiken oder tabellarischen Reports. Unstrukturierte oder polystrukturierte Daten haben einen wesentlichen Anteil am allgemeinen Datenaufkommen. Es zeigt sich jedoch, dass viele Unternehmen noch nicht über das nötige Know-how verfügen, um mit unstrukturierten Big-Data-Informationen sinnvoll zu arbeiten.

Es gibt verschiedene Arten von Information die mit entsprechender Big-Data-Software erfasst werden können. Hierzu gehören sowohl Texte als auch Sprachaufzeichnungen, welche durch die Analyse von linguistischen und semantischen Sprachmustern verarbeitet werden können. Auch die Verwendung von Bildern wie Logos ist nachvollziehbar. Die meisten dieser Technologien sind aus dem Forschungsprojekt THESEUS hervorgegangen.

Wichtig für den Import großer Datenmengen aus verschiedenen Datenquellen ist eine leistungsfähige Anbindung an Basiskonnektoren. Diese gewährleisten sowohl den Zugriff auf das Internet als auch auf Dateien oder Datenbanken. Abhängig von der jeweiligen Quelle muss außerdem eine entsprechende Konvertierung der Daten für die weitere Verarbeitung stattfinden. Eine effiziente Anbindung ergibt sich daher auch aus der Unterstützung durch Standardformate, auf die bei der Auswahl von Software-Lösungen zu achten ist. Eine Open Source Framework für Import, Verteilung und Zugriff auf Big Data ist SMILA. Auch das System Hadoop von Google ist Open Source verfügbar. Diese Systeme sind speziell auf die Verarbeitung von unstrukturierten Daten ausgerichtet, um die neue Bandbreite an Informationen, die Big Data bietet, voll ausschöpfen zu können. Die althergebrachten BI-Architekturen schränken die Analyse durch vorangestellte Selektion und Strukturierung der Daten stark ein. Hadoop ist hingegen auf keine bestimmte Struktur festgelegt. Die Strukturen können sich sogar verändern, ohne dass eine Anpassung des Datenspeichers notwendig wäre oder Ladeprozesse unterbrochen werden.

Eine schnelle Verarbeitung von Big Data wird durch Map-Reduce-Ansätze realisiert. Dies ist ein Algorithmus, welcher zunächst die sinnvolle Aufteilung auf verschiedene Rechner oder Dateisysteme (siehe z.B. HDFS) vornimmt und diese am Ende sinnvoll wieder zusammenfügt. Des Weiteren gibt es In-Memory-Computing Angebote wie SAP HANA. Bei dieser Methode werden die Arbeitsspeicher von Computern für die Datenspeicherung genutzt.

Als Dateisystem zur Speicherung der Daten und der weiteren Verarbeitung mit MapReduce steht beispielsweise HDFS (Hadoop Distributed File System) zur Verfügung. HDFS wurde speziell für die Umsetzung von MapReduce entwickelt. Als Alternative dazu bietet sich das File-System GFS an.

Für die Nutzung von Big Data stehen unterschiedliche Datenbanken zur Verfügung. Es gibt zunächst SQL-Systeme für relationale Daten. Diese sind für die Verarbeitung der althergebrachten BI-Informationen geeignet, also für die Verarbeitung strukturierter Daten. Des Weiteren gibt es NoSQL-Datenbanken. Diese sind auf die neuen unstrukturierten Daten, also die Auswertung von Texten, Audio-Dateien oder Videos, ausgerichtet. Es ist jedoch darauf zu achten, dass je nach Datenart unterschiedliche Datenbanken verwendet werden müssen. Beispiele für Dokumentendatenbanken sind MongoDB oder Couch DB. Es gibt jedoch auch spezielle Lösungen für Graphendatenbanken oder Key Value Stores.

Für den Bereich Big Data Analytics sind unterschiedliche Data-Mining-Produkte auf dem Markt. Beliebte Tools sind beispielsweise SPSS oder SAS. Es haben sich jedoch auch Open-Source-Produkte wie „R“ am Markt etabliert.

Zusammenfassung Big-Data-Software Produkte
Datenimport

SILMA (open source)

Hadoop (open source)

Schnelle Verarbeitung

MapReduce

In-Memory-Computing --> SAP HANA

Datenspeicherung

HDFS

GFS

Datenbanken

SQL

NoSQL

Data Mining

SPSS

SAS

R (open source)

Anwendungsbeispiele für Big Data Analytics: Big Data kann Unternehmen entscheidende Vorteile bringen:

Die wirtschaftliche Nutzung von Big Data ist äußerst vielseitig und kann in unterschiedlichen Branchen eingesetzt werden:

Vertrieb, Marketing und CRM

Zur Hauptaufgabe der Big-Data-Analyse im Bereich Marketing gehört die Kostenreduzierung. Big Data ermöglicht es den Unternehmen, ihre Produkt- und Service-Angebote präziser auf ihre Kunden zuzuschneiden. So können beispielsweise Umsatzsteigerungen durch Marketingmaßnahmen gemessen werden.

Auch die Analyse von Verkaufsvorgängen kann den Unternehmen Umsatzsteigerungen einbringen. Für die Big-Data-Auswertung werden alle bekannten Informationen von Kunden, zu denen Transaktionen, Standortdaten, Demographie oder Präferenzen zählen, zusammengeführt und ausgewertet. Auf ihrer Basis können Muster von Kaufentscheidungen abgeleitet und neue Cross-Selling-Potenziale erschlossen werden.

Big Data erleichtert darüber hinaus die Wettbewerbsbeobachtung. Big-Data-Software ist in der Lage, alle relevanten Informationen aus Presse, Wettbewerberseiten und jeglichen sozialen Netzwerken zu extrahieren und in statistisch auswertbare Daten umzuwandeln. Hierzu werden beispielsweise Texte von Computerbildschirmen ausgelesen oder semantische Feinheiten in Texten registriert. Außerdem fließen SEO-Informationen in die Analyse mit ein. Aus den gesammelten Daten können Reporte über relevante Märkte und Wettbewerber erstellt werden und bilden so eine Basis für effektivere Unternehmens- und Marketingstrategien.

Des Weiteren können Prognosen über Kundenzufriedenheit oder potenzielle Abwanderung erstellt werden. Hierfür können gerade bei Online-Geräten Informationen über mögliche Netz- oder Qualitätsprobleme gewonnen werden und rechtzeitig mit gezielten Rabattaktionen oder Vorteilspaketen entgegengesteuert werden.

Auch das Management des Kundenkontakts per Mail kann durch die Analyse von Rücklaufquoten und die Anpassung von Verteilerlisten verbessert werden.

Auf diese Weise unterstützt Big Data das Customer Relationship Management an entscheidenden Stellen und fördert Kundenbindung und -gewinnung.

Big-Data-Analysis in der Produktentwicklung

In den Entwicklungsabteilungen der Unternehmen kann Big Data bei der Erfassung und Auswertung von Kundenbewertungen behilflich sein. Hinzu kommen Informationen aus Meinungsforen oder Social-Media-Plattformen. Unternehmen können hier wertvolle Informationen über Produktschwächen oder Entwicklungsvorschläge sammeln. Der Mark ist außerdem interessant für die Erkennung neuer Trends und Marktlücken sowie der Entwicklung neuer Produkte. Mit diesem Informationsvorsprung können sich Unternehmen Wettbewerbsvorteile für die Startphase eines Produktes sichern und somit die Absatzchancen erhöhen. Außerdem können Rückschlüsse auf die allgemeine Markenwahrnehmung gezogen werden.

Big Data für Produktion und Support

Big Data kann zur Optimierung in der Produktion beitragen. Alle Prozesse können über Sensoren genau erfasst und anschließend in großen Datenbanken zusammengeführt werden. So werden bei vielen hoch technisierten Prozessen in den Produktionsketten, beispielsweise in der Ölförderung, Sensoren an allen entscheidenden Maschinen installiert, wodurch in der technischen Überwachung sofort Störungen in den Mechanismen festgestellt werden können. Somit stellt die Sammlung von Big Data eine Präventivwartung sicher und kann Produktionsverzögerungen oder -ausfälle verhindern.

Gerade wenn ein Produkt aus verschiedenen Komponenten verschiedener Hersteller besteht (z.B. in der Automobilindustrie), kann die übergreifende Qualitätssicherung durch Big-Data-Technologien entscheidend verbessert werden.

Supply Chain Management

Bei der Analyse von Lieferketten fließen unterschiedliche Informationen von Produktionsstandorten, der Zwischenlager und der Transportwege zusammen und bilden eine unübersichtliche Sammlung von Daten. Big-Data-Software hilft an dieser Stelle, Ordnung in das Chaos zu bringen und den Zugriff auf Daten von externen Standorten zu optimieren.

Gerade bei Transportfahrzeugen findet eine immer stärkere Vernetzung mit den Firmen statt. So kann das Fahrzeug Informationen von Verbrauch über Verschleiß bis hin zu Positionsdaten abgeben und wird im Gegenzug über alternative Routen oder Beladungsänderungen informiert. Für Unternehmen entsteht so ein Vorteil durch die Reduzierung von Leerfahrten, die Verkürzung von Fahrtzeiten oder die Planung der Wartungen von Fahrzeuge.

Diese Technik wurde auch auf Flugzeuge übertragen. So können Flugzeugmotoren Daten an die Zentrale senden und frühzeitig auf Störungen hinweisen. Dies verschafft dem Transportwesen einen enormen Sicherheitsvorsprung.

Big-Data-Management für Finanzen und Versicherung

Auch die Finanzwelt profitiert von Big Data. Besonders in der Simulation von Vorhersagemodellen zur Erleichterung des Entscheidungsprozesses ist die Verwendung von Big Data sehr beliebt. Auch im Bereich Risikokalkulation ist Big Data besonders für Banken interessant. Im Anlagegeschäft kann damit schneller auf fallende Kurse oder einflussreiche Marktentwicklungen reagiert werden. Auch die Analyse von Einflussfaktoren bei der Kreditvergabe kann durch Big-Data-Nutzung deutlich optimiert werden.

Im Bereich Versicherung können sowohl Daten über Maschinen als auch über Menschen genutzt werden, um einerseits den Versicherungsservice anzupassen und andererseits mögliche Risiken für Versicherungen aufzeigen. So können beispielsweise Daten über den Gesundheitszustand von Patienten erfasst werden.

Selbstverständlich ist gerade bei der Datenerfassung von Individuen auf die datenschutzrechtlichen Bestimmungen zu achten.

Zusammengefasst lässt sich festhalten, dass die Nutzung von Big Data eine weite Bandbreite an Vorteilen eröffnet, die von vielen Unternehmen noch nicht vollständig ausgeschöpft wird.

Probleme bei der Anwendung von Big Data

Viele Unternehmen bemängeln noch immer die Qualität der neugewonnenen Daten. Big-Data-Software weist weiterhin Probleme bei der technischen Umsetzung der Verwaltung und Analyse von Daten auf. Gerade bei der Verknüpfung von unstrukturierten externen Daten und unternehmensinternen Daten treten häufig Probleme auf. Auch datenschutzrechtliche Themen stellen eine Herausforderung für die Verwendung von Big Data dar. Nicht umsonst wird inzwischen von „gläsernen Kunden“ geredet, wenn die neuerschlossenen Daten analysiert werden. Das Innovationstempo sollte bei der Anpassung der Systeme an die Bedürfnisse der Unternehmen gesteigert werden.

Detailliertere Informationen zum Thema Big Data Analytics und die neusten Tools für die Umsetzung in Unternehmen finden Sie in folgendem Artikel auf unserer Seite: Was ist Big Data?

Finden Sie hier weiteres Wissen unserer Experten zum Thema Big Data Analytics und Anwendungsbeispiele aus der Praxis

| Big Data |

 

Share

Wissenspool Schlagwortwolke