-
Notifications
You must be signed in to change notification settings - Fork 2
Anforderungsliste Datenauswertung
Sensor | Detail | Mess-bereich | Empfind-lichkeit | Messverstärker | Anschluss | Anschlusstyp | Anschlussart | Sampling |
---|---|---|---|---|---|---|---|---|
Mikrofon | PCB 377B02 | 15 - 20000 Hz | 50 mV / Pa | PCB 426E01 | BNC | analog | ICP / IEPE 0..5V 4 mA | ~ 50 kHz |
Vibrationsaufnehmer | PCB M353B15 | 1 - 10000 Hz | 10 mV / g | BNC | analog | ICP / IEPE 0..5V 4 mA | ~ 50 kHz | |
Vibrationsaufnehmer | PCB M357B11 | 1 - 12000 Hz | 3 pC / g | PCB 422E53 | BNC | analog | ICP / IEPE 0..5V 4 mA | ~ 50 kHz |
Pyrometer | KGA 740 - LO | 200 - 3500 °C | BNC | analog | 0 .. 10 V | ~ 50 kHz | ||
Sauerstoff 1 | Unitronic KE-25 | 0 - 2 % | Klemme | analog | 0 .. 5 V | ~ 60 Hz | ||
Sauerstoff 2 | Unitronic KE-25 | 2 - 20 % | Klemme | analog | 0 .. 5 V | ~ 60 Hz | ||
Differenzdruck | GMUD-MP-F-MBF-GE605958 | 0 - 1 mbar | Klemme | analog | 0 .. 10 V | ~ 60 Hz | ||
Temperatur Plattform | PT100 | B&R X20AT4222 | Klemme | analog | am Sensor oder Eingangsmodul max 24V | ~ 60 Hz | ||
Temperatur Kammer | PT100 | B&R X20AT4222 | Klemme | analog | am Sensor oder Eingangsmodul max 24V | ~ 60 Hz | ||
Reserve 1 | Klemme | analog | 0 .. 10 V | ~ 60 Hz | ||||
Reserve 2 | Klemme | analog | 0 .. 10 V | ~ 60 Hz | ||||
Reserve 3 | Klemme | analog | 0 .. 10 V | ~ 60 Hz | ||||
Temperatur Raum | Klemme | analog | 4 .. 20 mA | ~ 60 Hz | ||||
Feuchte Raum | Klemme | analog | 4 .. 20 mA | ~ 60 Hz |
Es soll ein praktikabler Kompromiss zwischen den folgenden Eigenschaften gefunden werden:
Forderung | Beschreibung |
---|---|
F2.1.1 | Flexibilität bezüglich des Datentyps, darunter unkomprimierte Audio-Dateien, RAW-Fotos, Zeitserien von Spannungssignalen, etc. |
F2.1.2 | In Relation zur Gesamtgröße der Datenbasis geringer Overhead |
F2.1.3 | Möglichkeit zur Einbindung aussagekräftiger Metadaten, etwa Start-/Stoppzeiten Baujob, Jobname, etc. |
F2.1.4 | Hohe Lese- und Schreibperformanz |
Die Forderungen werden nach aktuellem Stand (22.09.20) folgendermaßen umgesetzt:
Umsetzung | Beschreibung |
---|---|
U2.1.1 | Bevorzugt sind Formate, die in hierarchischer Weise mehrere Datentypen beinhalten können (containerisierte Speicherung) |
U2.1.2 | Bzgl. der zu erwartenden Datenmenge im Bereich von 10¹ bis 10² GB wird davon ausgegangen, dass der Overhead vernachlässigbar ist |
U2.1.3 | Vgl. U2.1.1 |
U2.1.4 | Bevorzugt sind Formate, die die Datensätze im Binärformat serialisieren können |
Vorschläge zur Umsetzung sind nach aktuellem Stand (22.09.20, absteigend):
- HDF5
- AVRO
- JSON
- CSV
Die entwickelte Softare-Umgebung sollte folgende Anforderungen erfüllen:
Forderung | Beschreibung |
---|---|
F2.2.1 | In einer möglichst gängigen Sprache verfasst sein, um die Nutzbarkeit für andere Einrichtungen zu gewährleisten (öffentliches Forschungsprojekt) |
F2.2.2 | In einer Sprache verfasst sein, die eine möglichst gute Lesbarkeit durch einfache Semantik garantiert |
F2.2.3 | In einer Sprache verfasst sein, die die Anbindung an möglichst viele, frei zugängliche Bibliotheken ermöglicht |
F2.2.4 | Aufgrund der verschiedenen Beitragenden zur Software in einem zugriffsbeschränkten Repository vorhanden sein |
Ein Vorschlag zur Umsetzung ist nach aktuellem Stand (22.09.20):
Umsetzung | Beschreibung |
---|---|
U2.2.1 | Python (TIOBE Index Rang 3) |
U2.2.2 | Python: keine Variablendeklarationen, multiparadigmatisch, einrückungsbasierte Syntax |
U2.2.3 | Python: Tensorflow, Keras, PyTorch, Pandas, Numpy, SciPy, matplotlib, h5py |
U2.2.4 | GitLab-Repository der Uni Augsburg: Kostenloses Hosting, unbeschränkt viele Contributor, bewährtes Git-basiertes Versionsmanagement, sicheres Zugriffsmanagement, einfache Publikation |
Die entwickelten Verfahren sollten folgende Anforderungen erfüllen:
Forderung | Beschreibung |
---|---|
F2.3.1 | Möglichst schnelle, valide und reliable Vorhersagen zur Prozessqualität liefern |
F2.3.2 | Auf reproduzierbaren Features basieren |
F2.3.3 | Im Rahmen des maschinellen Lernens möglichst geringe Anforderungen bzgl. Rechenleistung in der Trainingsphase liefern |
F2.3.4 | Möglichst durch unüberwachtes oder semi-überwachtes Lernen Vorhersagen zur Prozessqualität liefern |
Vorschläge zur Umsetzung sind nach aktuellem Stand (22.09.20):
Umsetzung | Beschreibung |
---|---|
U2.3.1 | Mehrschichtiger Ansatz gemäß Antrag: 1. Deskriptive Statistik: Identifikation von Verteilungsfunktionen, Bilden statistischer Kennwerte, Filtern von Ausreißern, Berechnung von Effekten. Insbesondere soll die Validität multivariater statistischer Verfahren untersucht werden – etwa der Hauptkomponentenanalyse (PCA) 2. Machine Learning: Einsatz von Klassifizierern, die die Zielgrößen in teilerfremde Cluster zuordnen können. Optional: Einsatz von Regressoren, die Effekte verschiedener Eingangsgrößen auf die Zielgrößen quantifizieren. |
U2.3.2 | Direkte, aus Daten abgeleitete Features: Ergebnisse aus statistischer Auswertung – etwa diskretisierte Mittelwerte (alle 0,2 s) |
U2.3.3 | Ausschluss von Deep-Learning Algorithmen, insbesondere CNN zur Bildauswertung, Fokus auf einfache Machine Learning Methoden: - Support Vector Machine - Bayesian Network - Random Forest - Spectral Clustering - K-Means |
U2.3.4 | Vgl. U2.3.3 |
Messung | Signalfrequenz [Hz] | Signalformat | Zielgrößen |
---|---|---|---|
Luftschall Kammer | 50.000 | Spannung - Zeit | Keyhole Rissbildung Überhitzung Kollisionen |
Körperschall Beschichtung | 50.000 | Spannung - Zeit | Kollisionen Verzug Spratzer |
Körperschall Bauplattform | 50.000 | Spannung - Zeit | Bindefehler Keyhole Überhitzung Rissbildung Kollisionen |
CMOS NIR long | n.a. (1x je Schicht) | Bild (Pixel-Array) | Bindefehler Überhitzung |
CMOS NIR PB | n.a. (2x je Schicht) | Bild (Pixel-Array) | Beschichtungsfehler |
Strommessung | 60 | Stromstärke - Zeit | Beschichtungsfehler Kollisionen |
Thermografie | 300 | Bild (Pixel-Array) | Bindefehler Überhitzung Spratzer |
Temperatur Plattform | 60 | Spannung - Zeit | Temperatur Plattform (abh. Variable) |
Temperatur Kammer | 60 | Spannung - Zeit | Temperatur Kammer (abh. Variable) |
Sauerstoff 1 | 60 | Spannung - Zeit | Sauerstoff (abh. Variable) |
Sauerstoff 2 | 60 | Spannung - Zeit | Sauerstoff (abh. Variable) |
Differenzdruck | 60 | Spannung - Zeit | Schutzgasströmung (abh. Variable) |
Feuchte Raum | 60 | Stromstärke - Zeit | Feuchte Raum (abh. Variable) |
Folgende Zielgrößen sollen durch das Modell binär klassifizierbar sein:
Nr. | Bezeichnung | Binärisierungsgrenzwert | Kritikalität |
---|---|---|---|
Z1 | Keyhole | 0 | variabel |
Z2 | Rissbildung | 0 | Abbruch |
Z3 | Überhitzung | > 0 | variabel |
Z4 | Kollision | > 0 (0 bei Stoppkollision) | variabel (Abbruch) |
Z5 | Bindefehler | > 0 | Abbruch |
Z6 | Beschichtungsfehler | > 0 | variabel |
Z7 | Spratzer | > 0 | variabel |
Das Slicing erfolgt bei gegebener Abtastrate von 50 kHz bei 1000 Samples.
Feature | Art | Operationen |
---|---|---|
Varianz der Signalintensität | Zeitbereich | F11 = VAR(X) |
Anzahl der Frequenz-Peaks > x dB | Bildbereich | F12 = log10(F(X)) > x |
Anzahl der Hauptkomponenten > x | Bildbereich | F13 = PCA(X) > x |
Das Slicing erfolgt bei gegebener Abtastrate von 50 kHz bei 1000 Samples.
Feature | Art | Operationen |
---|---|---|
Varianz der Signalintensität | Zeitbereich | F21 = VAR(X) |
Anzahl der Peaks > x dB | Zeitbereich | F22 = log10(X) > x |
Anzahl der Frequenz-Peaks > x dB | Bildbereich | F23 = log10(F(X)) > x |
Das Slicing erfolgt bei gegebener Abtastrate von 50 kHz bei 1000 Samples.
Feature | Art | Operationen |
---|---|---|
Varianz der Signalintensität | Zeitbereich | F31 = VAR(X) |
Anzahl der Frequenz-Peaks > x dB | Bildbereich | F32 = log10(F(X)) > x |
Anzahl der Hauptkomponenten > x | Bildbereich | F33 = PCA(X) > x |
Durch die Langzeitbelichtung entsteht je ein Bild pro Schicht, daher ist kein weiteres Slicing der Eingangsdaten notwendig.
Feature | Art | Operationen |
---|---|---|
Vektor der relativ überbelichteten Pixel | Zeitbereich | F41 = X > MEAN(X) + 3*STD(X) |
Vektor der absolut überbelichteten Pixel (Grenzwert x) | Zeitbereich | F42 = X > x |
Anzahl der Hauptkomponenten > x | Bildbereich | F43 = PCA(X) > x |
Durch die Langzeitbelichtung entstehen je zwei unabhängige Bilder pro Schicht, daher ist kein weiteres Slicing der Eingangsdaten notwendig.
Feature | Art | Operationen |
---|---|---|
Vektor der relativ überbelichteten Pixel | Zeitbereich | F41 = X > MEAN(X) + 3*STD(X) |
Vektor der absolut überbelichteten Pixel (Grenzwert x) | Zeitbereich | F42 = X > x |
Anzahl der Hauptkomponenten > x | Bildbereich | F43 = PCA(X) > x |