Projekt SyDaPro: Synthetische Daten in der Produktion

Willkommen auf der Webpräsenz des Projektes SyDaPRo. Hier finden Sie Informationen rund um das Projekt sowie und Ansprechpartner.

Herausforderung

In industriellen Produktionsanlagen gewinnt künstliche Intelligenz (KI), insbesondere maschinelles Lernen (ML), zunehmend an Bedeutung. Sie ermöglicht bspw. eine vorausschauende Wartung oder Steuerung und Optimierung von Produktionsabläufen. Eine wesentliche Herausforderung beim Einsatz von ML besteht in der Bereitstellung großer Datenmengen, die für das Anlernen von Prozessmodellen erforderlich sind und beispielsweise bei der Simulation und Optimierung  von Produktionsprozessen ausgenutzt werden können. Gerade in der produzierenden Industrie sind genügend Daten häufig nicht in ausreichender Menge und Qualität vorhanden.

 

Lösungsansatz

Dieses Projekt adressiert die Erzeugung synthetischer Daten in der Produktion. Den Ausgangspunkt hierzu stellen stochastische Modelle dar, die basierend auf Echtdaten und Deep Learning erstellt werden. Mittels der stochastischen Modelle werden zufällige Daten erzeugt, welche die gleichen Charakteristika wie echte Daten aufweisen. Auf diese Weise soll neben  der Verfügbarkeit von Trainingsdaten für ML auch eine datenbasierte Optimierung von Produktionsprozessen und die Vermeidung von Anomalien ermöglicht werden. Die Erzeugung und Nutzung synthetischer Produktionsdaten erfordert die Berücksichtigung der folgenden Teilaspekte, die in dem Projekt SyDaPro wie folgt adressiert werden:

  • Erstellung stochastischer Prozessmodelle: Im Rahmen des Projektes werden stochastische Modelle entwickelt, welche auf Basis der Realdaten trainiert werden. Als Grundlage dient ein GAN-VAE-Framework, welches die Vorteile von Variational Autoencodern und Generative Adversarial Networks kombiniert. Diese Modellklasse induziert eine Wahrscheinlichkeitsverteilung im latenten Raum, welche auf eine Mannigfaltigkeit im Datenraum abgebildet wird. Zeitreihen werden durch NARX (Nonlinear AutoRegressive eXogenous) für kurzfristige Phänomene und Rekurrenz für langfristige Phänomene modelliert. Weiterhin werden in dem Projekt diskrete Ereignisse berücksichtigt, deren Emissionsverteilungen mittels Bayes’scher Netze beschrieben werden.
  • Synthese künstlicher Produktionsdaten: Die stochastischen Modelle erzeugen synthetische Daten durch Sampling zufälliger Zeitverläufe. Viele Knoten im zugrundeliegenden gerichteten graphischen Modell sind normalverteilt oder multinominalverteilt, wodurch sie sich leicht sampeln lassen. No-U-Turn Sampler können auch mit komplexeren Verteilungen arbeiten. Diese Techniken erlauben das Sampling synthetischer Daten mit vorgegebenen Randbedingungen. Unverzerrtes Sampling bei personenbezogenen Produktionsdaten (Arbeitsgeschwindigkeit o.Ä.) stellt die Anonymisierung und den Datenschutz sicher.
  • Ausnutzung physikalischen Wissens bei der Synthese der Produktionsdaten: Im Maschinellen Lernen ist die Erzeugung von Features durch Eingangstransformationen zentral. Generative Modelle verwenden dual dazu geeignete Ausgangstransformationen. Es werden Transformationen für typisches Verhalten in der Produktion entwickelt, welche auf physikalischem oder regelungstechnischem Vorwissen beruhen, um die generativen Modelle zu verbessern. Bspw. kann bei stark korrelierten Größen wie Stromstärke und Spannung das stochastische Modell durch ein angepasstes Koordinatensystem den korrelierten Anteil (Signal) und den unkorrelierten Anteil (Rauschen, Anomalie) unabhängig voneinander vorhersagen. Fouriertransformationen sind Grundlage für regelungstechnische Ansätze, wo Frequenzen und Amplituden statt der Signale gelernt werden.
  • Verwendung synthetischer Daten zur Optimierung von Produktionsprozessen: Die synthetischen Daten werden über das Training von ML-Modellen hinaus bei der Optimierung von Produktionsprozessen erprobt. Zum einen soll ein Teil der Datenkanäle, zum Beispiel ein neuer Produktionsablauf, vorgegeben und durch Sampling der Stromverbrauch vorhergesagt werden (Inferenz). Andererseits soll eine Zielgröße vorgegeben werden und dafür synthetische Daten erzeugt werden. Diese Daten zeigen, wie Stellgrößen eingestellt  

 

Steckbrief

Projekttitel: SyDaPro: Synthetische Daten in der Produktion
Laufzeit: 01.10.2021 - 30.09.2023
Förderung: Bundesministerium für Bildung und Forschung (BMBF)
Ziel: Erzeugung synthetischer Daten in der Produktion