Case Study

Ein einheitliches Handhabungsmodell für Big Data

Data Reply Hat für RCS ein einheitliches Handhabungsmodell für Big Data entwickelt, um der Eröffnung neuer Chancen im digitalen zu Geschäften.

Eine maßgeschneiderte Plattform

Die von Data Reply umgesetzte Lösung für RCS - führenden italienischen Multimedia-Verlagsgruppen, die in allen Bereichen des Verlagswesens tätig ist: von Tageszeitungen über Zeitschriften, Bücher und Fernsehen bis hin zum Radio und den neuen Medien - erlaubt die neue geldwerte Nutzung eines Kanals, der den Wert ausnutzt, welcher den digitalen Informationen innewohnt. Dies geschieht mit einer Plattform, die nach Maß erschaffen wurde und es ermöglicht, die komplexe Vielzahl von Daten über Benutzer und Inhalte hinweg einfach zu handhaben. RCS verfügt jetzt über eine Plattform, die sich an die wachsenden Bedürfnisse des digitalen Geschäfts der einzelnen Konzernbereiche anpasst.

Bedürfnisse und Ziele

Die Entstehung und Entwicklung innovativer Techniken im Bereich Big Data und maschinelles Lernen eröffnete für die RCS MediaGroup neue Szenarien und Geschäftschancen, mit denen die Daten über Benutzer und Inhalte, die direkt oder über die Software von Drittanbietern gesammelt wurden, aufgewertet und geldwert nutzbar gemacht werden können. Um erste Schritte in dieser Richtung zu unternehmen, wandte RCS sich an Data Reply, die dank ihrer beträchtlichen Erfahrung in diesen Bereichen eine Plattform entwickelt und umgesetzt hat, die verschiedene Datenquellen aggregiert und so erste viel versprechende Ergebnisse in Bezug auf erweiterte Analysen durch Modelle für maschinelles Lernen hervorbringt.

Mit insgesamt 15 Millionen monatlichen Nutzern generiert das Online-Angebot von RCS MediaGroup eine unglaubliche Menge an Informationen, die gespeichert und sowohl mit externen Quellen als auch mit synergetischen Beziehungen zwischen den vorhandenen Quellen angereichert werden können, um Wert für die Gruppe selbst und für ihre Nutzer zu generieren. Insbesondere haben die Initiativen, an denen RCS und Data Reply zusammenarbeiten, das Ziel der Ermöglichung gezielter Online-Marketingaktionen, einer deutlichen Verbesserung des Nutzererlebnisses sowie einer Förderung der Kundenbindung.

Mit der umgesetzten Plattform konnten RCS und Data Reply rasch an der Umsetzung der ersten Projekte zur geldwerten Datennutzung arbeiten:

  • Publikumsanreicherung: Vorhersage der demographischen Parameter (z.B. Geschlecht, Alter usw.) von anonymen Surfern, damit sie zielgerichtete Inhalte erhalten, genau wie das bei registrierten Nutzern geschieht;

  • Kategoriekennzeichner: sie identifizieren die an bestimmten Produktkategorien interessierten Verbraucher, so dass ihnen Werbekampagnen von Interesse oder Produkte im Einklang mit ihren Vorlieben zugeführt werden;

  • Klickbereitschaft: Identifizierung von Benutzern, die am ehesten auf die Banner einer bestimmten Web-Kampagne klicken;

  • Absprung-Prävention: Identifizierung der Eigenschaften von Verhalten, Soziodemografie und Abonnement, die einen Benutzer dazu bringen, sein Abonnement nicht zu verlängern, und mit Hilfe dieser Informationen versucht man, die Kunden durch gezielte Marketing-Kampagnen zu halten;

  • Inhalte- und Produktempfehlung: Kennzeichnung von Produkten oder Inhalten, die für eine bestimmte Nutzerzielgruppe vermutlich interessant sein können.

Die Lösung

Ausgehend von diesen Anforderungen seitens RCS und auf der Grundlage der Erfahrungen bei zahlreichen Kunden entwarf und implementierte Data Reply eine IaaS-Cloudlösung von Microsoft auf Basis der Plattform Hadoop, konkret der Distribution von Cloudera, einer Firma, bei der Data Reply Silver Partner ist. Die in den Systemen von RCS aufgezeichneten Informationen nach dem Surfbesuch der Nutzer sind vielfältig und heterogen:

  • Data Management Platform: Metadaten über Seiten und deren Inhalte, Navigationsereignisse (z.B. Klick auf einen Artikel) und Anzeigeereignisse (z.B. Video-Wiedergabe), Benutzerzuordnung zu ihren Interessensegmenten auf Inhaltsebene;

  • Webanalyse-Lösung: Navigationsinformationen in Echtzeit (Apps, Online-Stores, C+);

  • Datawarehouse: 360-Grad-Ansicht der Nutzer als Abonnenten und Käufer;

  • Semantische Analyseplattform: taxonomische und semantische Informationen über die Textinhalte.

Um diese Datenquellen untereinander zu integrieren und Synergien zwischen ihnen zu nutzen, wurde eine Datenanschlussebene zur Umgebung von Cloudera entwickelt und implementiert, welche die Informationen mit der Quelle synchronisiert hält. Auf diese Weise wird die Big-Data-Umgebung eine natürliche Spielwiese für Datenerforschung, Datenanalyse und Techniken der erweiterten Analyse sowie ein einheitlicher Zugangspunkt und Integrationspunkt für Informationen. Die Architektur und die Fähigkeit zur horizontalen Skalierung, durch die sich Hadoop auszeichnet und dank der das System durch Hinzufügen neuer gewöhnlicher Rechner je nach erforderlicher Rechenpower mitwachsen kann, ermöglichen es zudem, die Daten unvoreingenommen in Bezug auf ihre Mengen-, Geschwindigkeits- und Vielfaltseigenschaften zu behandeln, so dass das zuständige Team für die Datenwissenschaft eine freie Erforschung und Weiterverarbeitung vornehmen und damit Modelle entwickeln kann, die das Umfeld von Initiativen für die wesentlichen operativen Geschäftsziele abstützen. Die Nutzung von R und Python im Rahmen einer innovativen kollaborativen Plattform für die Datenwissenschaft ermöglichte dem Team aus „Datenwissenschaftlern“ die beschleunigte Erreichung erster viel versprechender Ergebnisse, die sich in Form geschäftlicher KPIs auf einem speziellen benutzerspezifischen Dashboard anzeigen lassen.

Roadmap

Im 2. Quartal 2016 stand RCS in den Startblöcken dieser neuen Erfahrung. Mit der Hilfe von Data Reply konnte RCS die Big-Data-Plattform umsetzen und erzielte erste wichtige Ergebnisse in der Publikumsanreicherung und bei den Kategoriekennzeichnern. In der 2. Hälfte 2016 konzentrierten sich die Bemühungen dann auf die Konsolidierung der bestehenden Plattform und die geschäftliche Anwendung der bereits umgesetzten Anwendungsfälle. 2017 wird RCS weitere ehrgeizige neue Initiativen verfolgen: Die Plattform wird auf eine On-Premise-Infrastruktur migriert, um die Betriebskosten zu senken, und die verschiedenen Szenarien, die anfänglich angenommen wurden, werden implementiert.

Picture

Data Reply ist die spezialisierte Fachfirma für Datenmanagement mit Big-Data-Methodiken und neueste Analytik innerhalb der Reply-Gruppe. Sie unterstützt den Kunden beim Entwurf und der Umsetzung von Datenplattformen, mit denen sich die Unternehmensdatenbestände geldwert nutzbar machen lassen. Data Reply ist ein Team aus Big-Data-Ingenieuren und Datenwissenschaftlern mit reichhaltiger Erfahrung; die Firma kann bereits eine große Anzahl von Big-Data-Systemen im produktiven Einsatz vorweisen.