Case Study

Machine Translation-as-a- Service

Wie sich neuronale Modelle für den unternehmensweiten Einsatz skalieren lassen.

Machine Learning im Einsatz

Softwareprodukte, die Machine Learning (ML) einsetzen, haben ein enormes Potenzial für Unternehmen. In diesem Fundus an Möglichkeiten finden wir zum Beispiel neuronale maschinelle Übersetzungsmodelle, die die Übersetzungszeiten von Texten verkürzen können, oder Algorithmen der natürlichen Sprachverarbeitung (NLP), die Kundendaten sortieren können, um Angebote zu personalisieren. Um jedoch den vollen Wert auszuschöpfen, sind ausgereifte Datenverarbeitungs-Workflows nötig.

Der Aufbau einer soliden Datenverwaltung, um die jüngsten Fortschritte bei den Algorithmen des Machine Learnings in Softwareprodukten umzusetzen, die leicht zugängliche, wart- und erweiterbar sind, ist keine leichte Aufgabe. Unternehmen fallen oft in die Proof-of-Concept-(PoC-)Falle, in der Projekte im PoC-Stadium bleiben, ohne dass es gelingt, zur Produktionsreife zu gelangen. Nur ausgereifte Produktzyklen bringen den Unternehmen einen dauerhaften wirtschaftlichen Nutzen bei niedrigen Kosten.

Picture

Machine Translation-as-a-Service für BMW

In einem globalen Unternehmen wie BMW ist das Übersetzen von Texten eine oft notwendige, aber zeitraubende und mühsame Aufgabe. Die Verkürzung der Übersetzungszeiten von Tagen auf Minuten, in wenigen oder sogar ganz ohne manuelle Schritte, hilft dem Unternehmen, schneller und effizienter zu arbeiten.

In den letzten zehn Jahren hat die Übersetzungsabteilung von BMW eine beträchtliche Menge an technischen Übersetzungen gesammelt und ein mehrsprachiges Wörterbuch entwickelt, das eine konsistente Verwendung der Terminologie während der gesamten Übersetzung gewährleistet.

Während einer Reihe interner Proof of Concepts (POC) hat das Machine Translation Team von BMW eine Methodik entwickelt, mit der diese Daten in den Trainingsprozess eingebracht werden, um die Übersetzungsqualität während der Inferenz durch die Verwendung von einheitlicher Terminologie zu verbessern. Das Ergebnis dieser Arbeit sind trainierte neuronale Modelle, die in der Übersetzungspipeline verwendet werden.

Unternehmensweite, gemeinsam genutzte Dienste

Damit die neuronalen Modelle von BMW in der gesamten Firma genutzt werden konnten, war es notwendig, sie als Service für Mitarbeiter und andere automatisierte Dienste nutzbar zu machen.

Reply erreichte dies für den Kunden, indem es einen kostengünstigen, auf AWS basierenden Shared Service für das gesamte Unternehmen bereitstellte. Dabei verwendete es die innovativen neuronalen Machine-Translation-Modelle von BMW mit spezifischen Anpassungen für den Automobilbereich. Erste Anwendungen der neuronalen maschinellen Übersetzungs-API wurden bereits im Jahr 2020 realisiert, was zu einem erheblichen Kosteneinsparungspotenzial für die Geschäftsbereiche führte.

Lösungen für verschiedene Anwendungsfälle entwickeln

Der Fall bei BMW ist nur ein Beispiel dafür, wie durch die richtigen Daten-Workflows Machine Learning-Produkte vorteilhaft gestaltet werden können. Während sich die Business Cases erheblich unterscheiden können, bleibt der architektonische Entwurf für die Lösungen sehr ähnlich. Die meisten von ihnen sind als Ansätze gestaltet, der auf Kubernetes-Clustern für Training und Inferenz basieren.

Reply bietet Unternehmen praktische Ratschläge dazu, wie traditionelle Entwicklungsverfahren und Best Practices für eine erfolgreiche Umsetzung kombiniert werden können. In diesem Whitepaper stellen die Experten konkrete Beispiele vor, die die Anwendung aktueller Life-Cycle-Praktiken für Machine Learning auf grundlegend unterschiedliche Anwendungsfälle veranschaulichen.

Picture

Data Reply unterstützt als Teil der Reply Gruppe Kunden darin, datengetrieben zu arbeiten. Data Reply ist in verschiedenen Branchen und Geschäftsbereichen tätig und arbeitet intensiv mit Kunden zusammen, damit diese durch die effektive Nutzung von Daten aussagekräftige Ergebnisse erzielen können. Hierfür konzentriert sich Data Reply auf die Entwicklung von Data-Analytics-Plattformen, Machine-Learning-Lösungen und Streaming-Anwendungen – automatisiert, effizient und skalierbar – ohne Abstriche in der IT-Security zu machen.