Skip to content

Anforderungsliste Datenauswertung

Patrick Zimbrod edited this page Nov 4, 2021 · 1 revision

Umsetzung der Sensorik

Sensor Detail Mess-bereich Empfind-lichkeit Messverstärker Anschluss Anschlusstyp Anschlussart Sampling
Mikrofon PCB 377B02 15 - 20000 Hz 50 mV / Pa PCB 426E01 BNC analog ICP / IEPE 0..5V 4 mA ~ 50 kHz
Vibrationsaufnehmer PCB M353B15 1 - 10000 Hz 10 mV / g BNC analog ICP / IEPE 0..5V 4 mA ~ 50 kHz
Vibrationsaufnehmer PCB M357B11 1 - 12000 Hz 3 pC / g PCB 422E53 BNC analog ICP / IEPE 0..5V 4 mA ~ 50 kHz
Pyrometer KGA 740 - LO 200 - 3500 °C BNC analog 0 .. 10 V ~ 50 kHz
Sauerstoff 1 Unitronic KE-25 0 - 2 % Klemme analog 0 .. 5 V ~ 60 Hz
Sauerstoff 2 Unitronic KE-25 2 - 20 % Klemme analog 0 .. 5 V ~ 60 Hz
Differenzdruck GMUD-MP-F-MBF-GE605958 0 - 1 mbar Klemme analog 0 .. 10 V ~ 60 Hz
Temperatur Plattform PT100 B&R X20AT4222 Klemme analog am Sensor oder Eingangsmodul max 24V ~ 60 Hz
Temperatur Kammer PT100 B&R X20AT4222 Klemme analog am Sensor oder Eingangsmodul max 24V ~ 60 Hz
Reserve 1 Klemme analog 0 .. 10 V ~ 60 Hz
Reserve 2 Klemme analog 0 .. 10 V ~ 60 Hz
Reserve 3 Klemme analog 0 .. 10 V ~ 60 Hz
Temperatur Raum Klemme analog 4 .. 20 mA ~ 60 Hz
Feuchte Raum Klemme analog 4 .. 20 mA ~ 60 Hz

Anforderungen an das Datenmodell

Metadaten und Overhead

Es soll ein praktikabler Kompromiss zwischen den folgenden Eigenschaften gefunden werden:

Forderung Beschreibung
F2.1.1 Flexibilität bezüglich des Datentyps, darunter unkomprimierte Audio-Dateien, RAW-Fotos, Zeitserien von Spannungssignalen, etc.
F2.1.2 In Relation zur Gesamtgröße der Datenbasis geringer Overhead
F2.1.3 Möglichkeit zur Einbindung aussagekräftiger Metadaten, etwa Start-/Stoppzeiten Baujob, Jobname, etc.
F2.1.4 Hohe Lese- und Schreibperformanz

Die Forderungen werden nach aktuellem Stand (22.09.20) folgendermaßen umgesetzt:

Umsetzung Beschreibung
U2.1.1 Bevorzugt sind Formate, die in hierarchischer Weise mehrere Datentypen beinhalten können (containerisierte Speicherung)
U2.1.2 Bzgl. der zu erwartenden Datenmenge im Bereich von 10¹ bis 10² GB wird davon ausgegangen, dass der Overhead vernachlässigbar ist
U2.1.3 Vgl. U2.1.1
U2.1.4 Bevorzugt sind Formate, die die Datensätze im Binärformat serialisieren können

Vorschläge zur Umsetzung sind nach aktuellem Stand (22.09.20, absteigend):

  • HDF5
  • AVRO
  • JSON
  • CSV

Softwaretechnische Umsetzung

Die entwickelte Softare-Umgebung sollte folgende Anforderungen erfüllen:

Forderung Beschreibung
F2.2.1 In einer möglichst gängigen Sprache verfasst sein, um die Nutzbarkeit für andere Einrichtungen zu gewährleisten (öffentliches Forschungsprojekt)
F2.2.2 In einer Sprache verfasst sein, die eine möglichst gute Lesbarkeit durch einfache Semantik garantiert
F2.2.3 In einer Sprache verfasst sein, die die Anbindung an möglichst viele, frei zugängliche Bibliotheken ermöglicht
F2.2.4 Aufgrund der verschiedenen Beitragenden zur Software in einem zugriffsbeschränkten Repository vorhanden sein

Ein Vorschlag zur Umsetzung ist nach aktuellem Stand (22.09.20):

Umsetzung Beschreibung
U2.2.1 Python (TIOBE Index Rang 3)
U2.2.2 Python: keine Variablendeklarationen, multiparadigmatisch, einrückungsbasierte Syntax
U2.2.3 Python: Tensorflow, Keras, PyTorch, Pandas, Numpy, SciPy, matplotlib, h5py
U2.2.4 GitLab-Repository der Uni Augsburg: Kostenloses Hosting, unbeschränkt viele Contributor, bewährtes Git-basiertes Versionsmanagement, sicheres Zugriffsmanagement, einfache Publikation

Algorithmische Umsetzung

Die entwickelten Verfahren sollten folgende Anforderungen erfüllen:

Forderung Beschreibung
F2.3.1 Möglichst schnelle, valide und reliable Vorhersagen zur Prozessqualität liefern
F2.3.2 Auf reproduzierbaren Features basieren
F2.3.3 Im Rahmen des maschinellen Lernens möglichst geringe Anforderungen bzgl. Rechenleistung in der Trainingsphase liefern
F2.3.4 Möglichst durch unüberwachtes oder semi-überwachtes Lernen Vorhersagen zur Prozessqualität liefern

Vorschläge zur Umsetzung sind nach aktuellem Stand (22.09.20):

Umsetzung Beschreibung
U2.3.1 Mehrschichtiger Ansatz gemäß Antrag:
1. Deskriptive Statistik: Identifikation von Verteilungsfunktionen, Bilden statistischer Kennwerte, Filtern von Ausreißern, Berechnung von Effekten. Insbesondere soll die Validität multivariater statistischer Verfahren untersucht werden – etwa der Hauptkomponentenanalyse (PCA)
2. Machine Learning: Einsatz von Klassifizierern, die die Zielgrößen in teilerfremde Cluster zuordnen können.
Optional: Einsatz von Regressoren, die Effekte verschiedener Eingangsgrößen auf die Zielgrößen quantifizieren.
U2.3.2 Direkte, aus Daten abgeleitete Features: Ergebnisse aus statistischer Auswertung – etwa diskretisierte Mittelwerte (alle 0,2 s)
U2.3.3 Ausschluss von Deep-Learning Algorithmen, insbesondere CNN zur Bildauswertung, Fokus auf einfache Machine Learning Methoden:
- Support Vector Machine
- Bayesian Network
- Random Forest
- Spectral Clustering
- K-Means
U2.3.4 Vgl. U2.3.3

Datenbasis zur Auswertung

Messung Signalfrequenz [Hz] Signalformat Zielgrößen
Luftschall Kammer 50.000 Spannung - Zeit Keyhole
Rissbildung
Überhitzung
Kollisionen
Körperschall Beschichtung 50.000 Spannung - Zeit Kollisionen
Verzug
Spratzer
Körperschall Bauplattform 50.000 Spannung - Zeit Bindefehler
Keyhole
Überhitzung
Rissbildung
Kollisionen
CMOS NIR long n.a. (1x je Schicht) Bild (Pixel-Array) Bindefehler
Überhitzung
CMOS NIR PB n.a. (2x je Schicht) Bild (Pixel-Array) Beschichtungsfehler
Strommessung 60 Stromstärke - Zeit Beschichtungsfehler
Kollisionen
Thermografie 300 Bild (Pixel-Array) Bindefehler
Überhitzung
Spratzer
Temperatur Plattform 60 Spannung - Zeit Temperatur Plattform
(abh. Variable)
Temperatur Kammer 60 Spannung - Zeit Temperatur Kammer
(abh. Variable)
Sauerstoff 1 60 Spannung - Zeit Sauerstoff
(abh. Variable)
Sauerstoff 2 60 Spannung - Zeit Sauerstoff
(abh. Variable)
Differenzdruck 60 Spannung - Zeit Schutzgasströmung
(abh. Variable)
Feuchte Raum 60 Stromstärke - Zeit Feuchte Raum
(abh. Variable)

Zielsystem

Folgende Zielgrößen sollen durch das Modell binär klassifizierbar sein:

Nr. Bezeichnung Binärisierungsgrenzwert Kritikalität
Z1 Keyhole 0 variabel
Z2 Rissbildung 0 Abbruch
Z3 Überhitzung > 0 variabel
Z4 Kollision > 0 (0 bei Stoppkollision) variabel (Abbruch)
Z5 Bindefehler > 0 Abbruch
Z6 Beschichtungsfehler > 0 variabel
Z7 Spratzer > 0 variabel

Features zur Datenauswertung

Luftschall Kammer

Das Slicing erfolgt bei gegebener Abtastrate von 50 kHz bei 1000 Samples.

Feature Art Operationen
Varianz der Signalintensität Zeitbereich F11 = VAR(X)
Anzahl der Frequenz-Peaks > x dB Bildbereich F12 = log10(F(X)) > x
Anzahl der Hauptkomponenten > x Bildbereich F13 = PCA(X) > x

Körperschall Beschichtung

Das Slicing erfolgt bei gegebener Abtastrate von 50 kHz bei 1000 Samples.

Feature Art Operationen
Varianz der Signalintensität Zeitbereich F21 = VAR(X)
Anzahl der Peaks > x dB Zeitbereich F22 = log10(X) > x
Anzahl der Frequenz-Peaks > x dB Bildbereich F23 = log10(F(X)) > x

Körperschall Plattform

Das Slicing erfolgt bei gegebener Abtastrate von 50 kHz bei 1000 Samples.

Feature Art Operationen
Varianz der Signalintensität Zeitbereich F31 = VAR(X)
Anzahl der Frequenz-Peaks > x dB Bildbereich F32 = log10(F(X)) > x
Anzahl der Hauptkomponenten > x Bildbereich F33 = PCA(X) > x

CMOS NIR Langzeitbelichtung

Durch die Langzeitbelichtung entsteht je ein Bild pro Schicht, daher ist kein weiteres Slicing der Eingangsdaten notwendig.

Feature Art Operationen
Vektor der relativ überbelichteten Pixel Zeitbereich F41 = X > MEAN(X) + 3*STD(X)
Vektor der absolut überbelichteten Pixel (Grenzwert x) Zeitbereich F42 = X > x
Anzahl der Hauptkomponenten > x Bildbereich F43 = PCA(X) > x

CMOS Pulverbettbelichtung

Durch die Langzeitbelichtung entstehen je zwei unabhängige Bilder pro Schicht, daher ist kein weiteres Slicing der Eingangsdaten notwendig.

Feature Art Operationen
Vektor der relativ überbelichteten Pixel Zeitbereich F41 = X > MEAN(X) + 3*STD(X)
Vektor der absolut überbelichteten Pixel (Grenzwert x) Zeitbereich F42 = X > x
Anzahl der Hauptkomponenten > x Bildbereich F43 = PCA(X) > x