Skip to content

Gliederung und grober Überblick

Henry Schuler edited this page Apr 15, 2023 · 2 revisions

Gliederung

  1. Einleitung

    TODO: Konzept fehlt

  2. Grundlagen

    Grundlegende Theoretische Konzepte werden vorgestellt. Vermittlung von Basiswissen für ein besseres Verständnis der Arbeit.

    1. Authentifizierung

      Definition des Begriffs Authentifizierung. Typische aktuelle Einsatzgebiete sowohl im allgemeinen als auch im speziellen Fall Sprecherauthentifizierung.

    2. Menschliche Stimme

      Anatomische Grundlagen des Menschens zum Verständnis der Differenzierbarkeit, sowie verwendeten Verfahren.

      1. Stimmerzeugung

        Grunkonzept der Resonanz, sowie Stimmbildung auf basis eines Rauschens. Aufbau des Vokal- und Nasaltrakts. Zuständigkeit der Bereiche für verschiedene Arten von Lauten.

      2. Stimmwahrnehmung

        Extrahieren von Stimminformationen aus gesprochenem. Aufbau des Ohrs, sowie die anschließende Signalverarbeitung. Spezielle Charakteristiken der Stimme/von Lauten im Wahrnehmungsprozess.

    3. Audioanalyse

      Vorstellung von grundlegenden Konzepten für die Verarbeitung von analogen Audiosignalen im digitalen Bereich. Methoden zur extrahierung von Stimmcharacterisitken aus Sprechsignalen (auf Basis der Erkenntnisse des vorangehenden Kapitels).

      1. Signalvorverarbeitung

        Verfahren zur Signalaufbereitung: Rausch- und Pausenreduzierung, sowie Framing und Windowing.

      2. Fourier Analyse

        Signalanalyse im Frequenzbereich. Grundlage für MFCC.

      3. Mel Frequency Cepstral Coefficients

        Extrahieren von Stimmcharakteristiken auf Basis des menschlichen Ohrs.

      4. Linear Predictive Coding

        Extrahieren von Stimmcharakteristiken auf Basis der menschlichen Stimmproduktion.

    4. Künstliche Intelligenz und Machine Learning
Clone this wiki locally