TUD

Institut für Akustik und Sprachkommunikation

Akustische Mustererkennung

Übersicht

Prinzip der akustischen Mustererkennug mit Hidden-Markov-Modellen [Bild zum Vergrößern anklicken]

Eigenschaften von Prüfobjekten äußern sich als typische Ausprägungen und zeitliche Abfolgen von Signalereignissen. Mit Hilfe von Verfahren der Signalanalyse, Merkmalextraktion, -kompression und statistischen Mustererkennung werden automatisch Modelle der Messsignale erstellt. Diese Modelle können zur Beurteilung unbekannter Prüfobjekte benutzt werden. Es werden Hidden-Markov-Modelle (HMM) und Support Vector Machines (SVM) oder in einfachen Fällen Gaussian Mixture Models (GMM) eingesetzt. Da diese Verfahren lernfähig und problemunabhängig sind, eignen sie sich im Prinzip für jede akustische Diagnose. Sie benötigen wenig oder gar kein a priori-Wissen, sind skalierbar und echtzeitfähig. Fallen Daten mehrerer Sensoren an, können diese kombiniert werden, um eine Gesamtaussage zu treffen.

In der Signalstruktur im Bild rechts ist das Auftreten von Ereignissen besonders deutlich erkennbar (im Bild vier Ereignisse E0 - E1 - E2 - E3). Bei der Merkmalextraktion werden aus dem Signal in gleichmäßigen Abständen einzelne Merkmalvektoren und somit insgesamt eine Merkmalvektorfolge gebildet (Bild Mitte). Die interessierenden Eigenschaften liegen nicht nur in einem Spektrum (räumliche Eigenschaften), sondern auch in der Folge von Spektren (zeitliche Struktur). Eine kurze Folge von Merkmalvektoren beschreibt ein akustisches Ereignis (z. B. E1). Diese Ereignisse werden bei HMMs in Form von Verteilungsdichtefunktionen beschrieben.

Die Modellierung von Folgen solcher Ereignisse, also der Signalstruktur, erfolgt als Markov-Kette erster Ordnung. Jeder mögliche Zustandsübergang tritt mit einer bestimmten Wahrscheinlichkeit auf (Bild, unten). Die Zustandsfolge in diesem Beispiel ist offensichtlich, sie muss jedoch nicht bekannt sein, da das System in der Lage ist, diese selbst zu lernen.

Video: Strukturen in Signalen [26 MB]

Akustische Diagnose

Mit Ultraschall-Aktuatoren instrumentierte Aluminium- und CFK-Platten, letztere mit Beschädigung (Einschlag). Foto: Fraunhofer IZFP-D [Bild zum Vergrößern anklicken]

Strukturintegrierte Zustandsüberwachung von Flugzeugbauteilen

Eine besonders interessante Anwendung besteht aufgrund der großen Relevanz in der Zustandsüberwachung von Konstruktionselementen in Flugzeugen. Die Integrität von Flugzeug-Rumpfschalen soll zunächst während der Belastungstests am Boden und später auch permanent während des Fluges überwacht werden.
Es wurden dazu zwei typische Flugzeugkonstruktionsmaterialien (Aluminium und kohlefaserverstärkter Kunststoff, CFK) verwendet.

Die Testobjekte, eine Aluminium- und eine CFK-Platte, wurden mit Ultraschall-Aktuatoren (Sender-/Empfängereinheiten) bestückt (siehe Bild). Jeder Aktuator fungiert umlaufend als Körperschallsender, während alle anderen die durch das Material laufenden Schallwellen aufzeichnen. Jede Sender-Empfänger-Kombination ("Messstrecke") liefert eine Teilinformation über den Zustand des Bauteils, die Teilinformationen werden am Ende der Verarbeitung zu einer Gesamtaussage zusammengefasst. Die Untersuchung der Testobjekte erfolgte im intakten sowie in beschädigten Zuständen. Bei der Aluminiumplatte wurde schrittweise ein Riss zunehmender Länge eingebracht, bei der CFK-Platte 5 Einschläge mit verschieden hohen Einschlagsenergien. Es wurde ein HMM und ein SVM für jede Messstrecke im intakten Zustand trainiert. Die Klassifikation erfolgte mit Signalen im intakten und in beschädigten Zuständen.

Sowohl mit HMMs als auch mit SVMs konnten alle getesteten Fehler sicher erkannt werden. HMM-Klassifikatoren sind besonders zur Abschätzung des Beschädigungsgrads, SVM-Klassifikatoren besonders zur Erkennung geringfügiger Beschädigungen geeignet. Zum Vergleich mit einem "konventionellen" Verfahren wurde für die Aluminiumplatte eine laufzeittomografische Bildrekonstruktion basierend auf den beschriebenen Messdaten durchgeführt. Diese konnte Risse in der Aluminiumplatte erst ab 12 cm Länge detektieren, beide statistischen Verfahren ab dem kleinsten getesteten Riss von 1 cm Länge. Akustische Mustererkennungsverfahren erlauben im Gegensatz zur Tomografie jedoch keine Schadenslokalisierung im Bauteil.

Finanzierung:DFG
Partner:Fraunhofer IZFP-D, Dresden
weitere Informationen:Abschlussbericht (PDF)
Prüfobjekt (Gummiwalze) mit sichtbarer Beschädigung (rechts) sowie Histogramm über Maßzahlen für die Abweichung der Messsignale verschiedener Prüfobjekte vom intakten Zustand (neglog. Likelihood NLL, jede Messung wurde 1000 Mal wiederholt, links) [Bild zum Vergrößern anklicken]

Fehlerfrüherkennung an Spinnmaschinen

Ziel dieses Forschungsprojektes war es, einen bevorstehenden Ausfall von beweglichen Maschinenteilen an Spinnmaschinen mit Hilfe eines HMM-Klassifikators zu diagnostizieren. Bei bestimmten Bauteilen (in unseren Versuchen: gummierte Oberwalzen und Lager in einem Streckwerk) führt schon eine gewisse Abnutzung zu periodischen Garnfehlern, die unbedingt vermieden werden sollen. Bisher erfolgt die Fehlerdiagnose durch Sichtkontrollen und akustische Wahrnehmung von Schadgeräuschen während regelmäßiger Inspektionen. Die automatische Körperschalldiagnose soll die Kontrolle unterstützen und zuverlässige Aussagen zum Zustand von Bauteilen möglich machen. Grundlage sind Änderungen im Schwingungsspektrum des jeweiligen Teils im Vergleich zu intakten Bauteilen. Diese Änderungen sollen mit Hilfe eines portablen Maschinendiagnosegerätes erkannt und Aussagen zum Verschleißzustand getroffen werden.

Im Gegensatz zu anderen akustischen Diagnoseverfahren wird dabei aus einer Stichprobe typischer Signalverläufe ein stochastisches Strukturmodell gebildet, welches die zeitliche Abfolge von Signalereignissen berücksichtigt und das zu modellierende Signal nicht nur als statisch betrachtet. Die zu untersuchenden Daten werden von einer sich in Entwicklung befindlichen autarken Sensorbaugruppe bereitgestellt, die Körperschallsignale aufzeichnet und dem Diagnosegerät drahtlos übermittelt. Für die Positionierung und Entwicklung der Sensorbaugruppe sind fortlaufend Aussagen in Bezug auf Änderungen zu bisherigen Klassifikationsergebnissen notwendig. Deshalb wurde eine Datenbank mit Körperschallsignalen des Versuchsstreckwerkes aufgebaut. Für die Erhebung stehen 6 Walzen unterschiedlichen Zerstörungsgrades (2 neuwertige und 1 defekte Walze, sowie 3 mittleren Zerstörungsgrades) zur Verfügung. Mit Hilfe eines HMM-basierten Signalmodells ist es zum gegenwärtigen Zeitpunkt am Versuchsstreckwerk möglich, die intakten und gänzlich defekten Walzen klar zu erkennen. Ein technologischer Schwerpunkt dieses Projekts ist die Analyse vorhandener und Entwicklung neuer Merkmalextraktionsverfahren für die Klassifikation mittels HMMs.

Finanzierung:AiF
Partner:ITB, TU Dresden
Fraunhofer IZFP-D, Dresden
XGraphic Ingenieurgesellschaft mbH, Aachen
marco Systemanalyse und Entwicklung GmbH, Hermsdorf
Rieter Textile Systems, Ingolstadt
weitere Informationen:Projektskizze (PDF)
Abschlussbericht TUD-IAS (PDF)
Abschlussbericht TUD-ITB (PDF)
Röntgenbild eines typischen Fehlerbildes (Lunker). Foto: Fraunhofer IZFP-D, Dresden [Bild zum Vergrößern anklicken]

Prüfung von gesinterten Zahnrädern

In dieser Studie wurde eine Gut-/Schlechtanalyse gesinterter Zahnräder durchgeführt. Dabei wurde der Klang des Zahnrades (Frequenzspektrum, Abklingverhalten) bei definierter Anregung durch einen Ultraschallimpuls mit Hilfe des in diesem Projekt entwickelten HMM-Klassifikators bewertet. Jede Aufnahme wurde gleichzeitig mit zwei unabhängigen Sensoren durchgeführt. Die besondere Schwierigkeit der Aufgabe bestand darin, dass nicht nur grobe Fehler wie Ausbrüche oder Risse gefunden werden sollten, sondern auch winzige Einschlüsse oder geringfügige Kontamination des Rohmaterials. Die Abbildung zeigt ein typisches Fehlerbild.

Auftraggeber:Schunk Sintermetalltechnik GmbH, Thale
Miba Sinter Austria GmbH
Partner:Fraunhofer IZFP-D, Dresden
Testobjekt: mikrofluidisches Magnetventil. Foto Fraunhofer IZFP-D, Dresden

Akustische Zustandsüberwachung von Magnetventilen

Für den Einsatz von mikrofluidischen Bauelementen, wie z. B. Ventile, in Bereichen, bei denen ein Ausfall unerwartete, teilweise auch unvorhersehbare Folgen haben kann, ist die Erkennung eines bevorstehenden Ausfalls von großer Bedeutung. Dazu wurden 2 Dauerversuche durchgeführt, bei denen jeweils 8 Ventile zyklisch geöffnet und geschlossen wurden. Anhand der dabei aufgezeichneten Schaltgeräusche sollte eine Aussage über die zu erwartende Restlebensdauer der einzelnen Ventile ermittelt werden. Aufgrund der deutlich ausgeprägten Signalstruktur ist hier der Einsatz von Verfahren zum automatischen Strukturlernen nützlich.
 
Trainiert wurden Hidden-Markov-Modelle für die Zustände „neuwertig“ und „verschlissen“, jeweils mit Daten mehrerer Ventile. Anhand dieser Modelle wurde der Klang eines anderen Ventils bewertet. Die im Verlaufe der Lebenszeit abnehmende Ähnlichkeit zum mittleren Klang eines neuwertigen Ventils und die zunehmende Ähnlichkeit zum mittleren Klang eines abgenutzten erlaubt eine Abschätzung des Alters und somit der Restlebensdauer des unbekannten Ventils.

Finanzierung:DFG
Partner:Fraunhofer IZFP-D, Dresden
weitere Informationen:Abschlussbericht (PDF)
Vom Fraunhofer IZFP-D entwickelte Messsonde

Akustische Zustandsüberwachung von Eisenbahnrädern

Dieses am Fraunhofer-Institut für Zerstörungsfreie Prüfverfahren Dresden (IZFP-D) durchgeführte Projekt befasste sich mit einem neuartigen Verfahren zur in-situ-Überwachung von Eisenbahnrädern durch Auswertung der Laufgeräusche beim normalen Betrieb (herkömmliche Verfahren testen die Räder nur während der Wartung). Ziel ist es, Fehler am Rad sofort zu detektieren und somit auf akute Störfälle reagieren zu können. Das IZFP-D entwickelte eine spezielle Messsonde (siehe Abbildung) mit acht gleichmäßig auf dem Umfang verteilten Körperschallsensoren. Schäden auf der Lauffläche des Rades führen zu periodischen Störungen der Messsignale. Eine umlaufsynchrone Signalmittelung über viele Radumdrehungen beseitigt zufällige Störungen (z. B. Schienenstöße u. ä.)

Ein vom Institut für Akustik und Sprachkommunikation der TU Dresden untersuchter Ansatz zur Fehlerdetektion besteht in der statistischen Klassifikation der Laufgeräusche. Dazu wurde im einfachsten Fall ein HMM mit zwei Zuständen (OK und FEHLER) trainiert. Nachteil dieses Ansatzes ist, dass Daten fehlerhafter Räder zum Modelltraining benötigt werden. Abhilfe schafft eine Abwandlung des Verfahrens, welche nur die Ähnlichkeit zur Klasse OK ermittelt und bei zu geringer Ähnlichkeit eine Fehlstelle detektiert. Die Experimente zeigten, dass mit Hilfe statistischer Verfahren Fehler an Eisenbahnrädern anhand der Laufgeräusche erkannt und lokalisiert werden können. Ein technologischer Schwerpunkt dieses Projekts war eine angepasste Merkmalextraktion für den HMM-Klassifikator.

Musiksignalerkennung

Klassifikation musikalischer Aspekte

Die Verbreitung von Musik wurde durch das Internet und den mp3-Standard revolutioniert. Jeder Musiker und Künstler bekommt die Möglichkeit seine Kunst selbst anzubieten, was zu einem nahezu unüberschaubaren Angebot an Musik führt. Neue Technologien wie die Navigation durch Musiksammlungen, deren Visualisierung, Annotation, Musikempfehlungssysteme, semantische Suche und das Bilden von Kaufempfehlungen sind nötig. In diesem spannenden Umfeld bewegt sich das vorliegende Forschungsprojekt der Klassifikation musikalischer Aspekte.

Menschen beschreiben Musik mit einfachen, signalfernen, bedeutungsvollen Aspekten. Deren automatische Gewinnung aus dem Musiksignal bildet die Grundlage für eine Annotation von Musiktiteln und dient damit allen oben genannten Aufgabenfeldern. Gegenstand der Untersuchungen sind unter anderem Aspekte wie Genre, Klangfarbe, Tempo, Rhythmus und Songstrukturen. Aus Sicht der Mustererkennung werden Merkmalvektoren, hinter denen sich Ausprägungen eines Aspektes verbergen, beobachtet. Dabei handelt es sich um verschiedene Low- und Midlevel-Merkmale. Da Musiksignale Informationen in ihrer zeitlichen Struktur tragen, wird insbesondere der zeitliche Verlauf von Musik mittels Segmentierung in die Untersuchung einbezogen.

Partner: mufin GmbH, Musikempfehlungs- und Musikerkennungstechnologie
Fotos: Wikipedia

Bewertung und Beurteilung von Musikinstrumenten anhand von Solomusikstücken

Ziel dieses Forschungsprojektes war es unter anderem, mit Hilfe statistischer Klassifikatoren Musikinstrumente anhand des beim Instrumentenspiel entstehenden Schallsignals zu beurteilen und zu vergleichen. Bislang basierten alle instrumentellen Ansätze zu einer solchen Beurteilung auf physikalischen Modellen beziehungsweise auf künstlichen Anspielvorrichtungen. Die automatische Beurteilung von Musikinstrumenten anhand gespielter Musik sollte zunächst spielerunabhängig, im zweiten Schritt zusätzlich melodieunabhängig und im dritten Schritt dazu noch raum- und aufnahmeunabhängig sein. Es wurde eine Datenbasis mit Anspielen von jeweils zehn Gitarren, Violinen, Klarinetten und Trompeten aufgenommen. Jedes der 40 Instrumente wurde in zwei Räumen, von fünf Musikern, mit drei unterschiedlichen Stücken und je einer Wiederholung (also insgesamt 60 Mal) aufgenommen.

Voraussetzung für die Beurteilung eines Instruments ist das sichere Erkennen individueller Instrumente unabhängig von Spieler, Melodie und Aufnahmebedingungen. Ist dies erfolgreich möglich, können relativ einfach automatisch „objektive“ Ähnlichkeiten zwischen Instrumenten bestimmt werden. Das Projekt ergab als ein wesentliches Ergebnis, dass die beschriebene statistische Modellierung für bestimmte Instrumente hervorragend (z. B. Gitarren 94 - 99 %, Violinen 96 - 98 % Erkennungsrate eines aus 10 Instrumenten), für an­de­re weniger gut (z. B. Trompeten 33 - 97 % Erkennungsrate eines aus 10 Instrumenten) geeignet ist.

 

Finanzierung:Bmbf
Partner:Institut für Musikinstrumentenbau Zwota
weitere Informationen:Abschlussbericht (PDF)

 

 

Biosignalerkennung

Beispiel für manuelle und automatische Blutdruckmessung. [Bild zum Vergrößern anklicken]

Nichtinvasive Blutdruckmessung am aktiven Menschen

Ziel dieses Projekts war die automatische akustische Blutdruckmessung am Oberarm mit Druckmanschette und elektronischem Stethoskop (bestehend aus zwei in die Manschette integrierten Spezialmikrofonen) anhand der so genannten Korotkoff-Geräusche (siehe Abbildung). Diese Geräusche bestehen aus vier unterscheidbaren Phasen, der Beginn der ersten Phase sowie das Ende der letzten Phase markieren den systolischen und diastolischen Blutdruck.

Mit Hilfe eines HMM-basierten Signalmodells wurden das Korotkoff-Geräusch im Stethoskopsignal automatisch lokalisiert und aus der Position die Blutdruckwerte berechnet. Befindet sich der Patient in Ruhe, liefert das Verfahren eine gute Genauigkeit. In Bewegung (Fitnessübungen) entstehen durch Muskeln und Gelenke starke Störgeräusche. Bei der Blutdruckmessung unter solchen Bedingungen konnte eine immer noch akzeptable Genauigkeit erzielt werden. Ein technologischer Schwerpunkt dieses Projekts war eine angepasste Merkmalextraktion für den HMM-Klassifikator.

 

Auftraggeber:Gesundheitstechnik Stier, Neuruppin

 

 

Foto: Wikipedia [Bild zum Vergrößern anklicken]

Analyse von Nutztierlauten

Ausgehend von den dynamischen Eigenschaften eines biogenen Schallsignals wurde unter Nutzung der Erfahrungen der Sprachanalyse eine Methode zur numerischen (Tier-) Lautsignalanalyse erarbeitet. Bei der Lautanalyse werden aus den von einem FFT-Spektrumanalysator aus dem Lautsignal erzeugten Spektrenfolgen in einem zweistufigen Verfahren Parameter abgeleitet.

In der ersten Stufe werden für jedes Spektrum der Spektrenfolge fünf Parameter 1. Ordnung zur Bewertung der Energieverteilung im Spektrum berechnet ... .

Die zweite Stufe extrahiert aus den Verlaufskurven der Parameter 1. Ordnung über den Laut die Parameter 2. Ordnung, welche spezifische Eigenschaften des Lautes in einem Zahlenwert wiedergeben.

Durch eine Normierung über die Lautdauer ... wurden neue Möglichkeiten für einen Vergleich der komplexen Frequenzmuster als Ganzes geschaffen. So wurden aus einem Vergleich mit den folgenden Lauten für jeden Laut neue Parameter zur Beschreibung der Dynamik der Lautfolge ermittelt.

Mit dieser Methode wurden ... Verlassenheitslaute von ... Küken an (mehreren) Beobachtungstagen untersucht. Dabei konnten (u. a.) als typische Merkmale  ... ein Frequenzsprung im Verlauf der Grundfrequenz, die asymmetrische Verteilung der Energie über die Lautdauer und eine hohe Tonalität der Laute festgestellt werden.

(Aus: Marx, G.: Entwicklung einer Methode zur numerischen Lautanalyse. Diss., Martin-Luther-Universität Halle-Wittenberg 1993.)

Stand: 13.08.2009 09:18
Autor: M. Wolff