Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
COMPUTER-IMPLEMENTED METHOD AND SYSTEM FOR DETECTING ANOMALIES DURING THE OPERATION OF A TECHNICAL DEVICE
Document Type and Number:
WIPO Patent Application WO/2023/202778
Kind Code:
A1
Abstract:
The invention relates to a computer-implemented method for detecting anomalies during the operation of a technical device, wherein the following steps are carried out: a) detecting first training data from the operation of the technical device and providing same, generating and training a first model, and providing the first model in the form of first weights, as well as loading and storing the first model in the first computing device, b) detecting operating data of the technical device and determining an anomaly characteristic with respect to a match with the first model, c) checking whether the anomaly characteristic lies within a specified value range, and if so, continuing with step b), otherwise continuing with step d), d) providing the first model weights of the auto encoder and storing same together with the anomaly characteristic in the storage device, e) checking whether a specified number of stored first model weights for each anomaly characteristic has been reached and if so, continuing with step b), otherwise continuing with step f), f) transmitting the stored first model weights for each anomaly characteristic to a second computing device (2) and calculating a second model using second model weights by determining the inference, and g) transmitting the second model weights of the previously calculated second model to the first computing device (1), deleting the first model weights transmitted in step f) from the storage device, and continuing with step b).

Inventors:
SCHALL DANIEL (AT)
Application Number:
PCT/EP2022/060677
Publication Date:
October 26, 2023
Filing Date:
April 22, 2022
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS AG OESTERREICH (AT)
International Classes:
G06N3/04; G06N3/08
Other References:
SUYI LI ET AL: "Abnormal Client Behavior Detection in Federated Learning", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 22 October 2019 (2019-10-22), XP081519014
Attorney, Agent or Firm:
MAIER, Daniel (DE)
Download PDF:
Claims:
Patentansprüche

1. Computer-implementiertes Verfahren zur Anomalie- Erkennung beim Betrieb eines technischen Geräts (TD1) , welches von einem Klienten-Server-System (CSS) mit einem Server (S) und einen Klienten (Kl) mit einer ersten Rechenvorrichtung (1) , aufweisend einen Prozessor und einen Speicher, betrieben wird und folgende Schritte ausgeführt werden: a) Erfassen aus dem Betrieb des technischen Geräts (TD1) und Bereitstellen von ersten Trainings-Daten (DT) vom Klienten (Kl) an den Server (S) , Erzeugen und Trainieren eines ersten Modells in Form eines Auto-Encoders durch den Server, und Bereitstellen des ersten Modells in Form von ersten Gewichten vom Server (S) an den Klienten (Kl) , sowie Laden und Speichern des ersten Modells in der ersten Rechenvorrichtung (1) , b) Erfassen von Betriebs-Daten des technischen Geräts (TD1) und Bestimmen einer Anomalie-Kenngröße hinsichtlich der Übereinstimmung mit dem ersten Modell durch die erste Rechenvorrichtung (1) , c) Prüfen, ob die Anomalie-Kenngröße innerhalb eines vorbestimmten Werte-Bereichs liegt, wenn ja, fortfahren mit Schritt b) , sonst fortfahren mit Schritt d) , d) Bereitstellen der ersten Modell-Gewichte des Auto- Encoders und Speichern mit der Anomalie-Kenngröße im Speicher durch die erste Rechenvorrichtung (1) , e) Prüfen, ob eine vorbestimmte Anzahl an gespeicherten ersten Modell-Gewichte des Auto-Encoders für jeweilige Anomalie-Kenngrößen erreicht ist, wenn ja, dann Fortfahren mit Schritt b) , sonst Fortfahren mit Schritt f ) , f) Übermitteln der gespeicherten ersten Modell-Gewichte für jeweilige Anomalie-Kenngrößen an eine zweite Rechenvorrichtung (2) , welche vom Klienten (Kl) umfasst ist und mit der ersten Rechenvorrichtung (1) über eine Kommunika- tions-Verbindung (3) mit einer vordefinierten Bandbreite verbunden ist, und Berechnen eines zweiten Modells in Form eines Auto-Encoders mit zweiten Modell-Gewichten durch Bestimmen der Inferenz durch die zweite Rechenvorrichtung ( 2 ) , g) Übermitteln der zweiten Modell-Gewichte des zuvor berechneten zweiten Modells an die erste Rechenvorrichtung (1) , und Löschen der im Schritt f) übermittelten ersten Modell-Gewichte aus dem Speicher der ersten Rechenvorrichtung (1) , und Fortf ährten mit Schritt b)

2. Verfahren nach dem vorhergehenden Anspruch, wobei die Anomalie-Kenngröße der Rekonstruktions-Fehler des Auto- Encoders ist.

3. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Größe der Speicherbelegung des Speichers der ersten Rechenvorrichtung (1) zum Speichern der im Schritt e) vorbestimmte Anzahl an gespeicherten ersten Modell-Gewichte des Auto-Encoders proportional zur Bandbreite der Kommunikations- Verbindung (3) zwischen der ersten Rechenvorrichtung (1) und der zweiten Rechenvorrichtung (2) vorgesehen ist.

4. Verfahren nach einem der vorhergehenden Ansprüche, wobei die im Schritt f) berechneten zweiten Modell-Gewichte vom Klienten (Kl) dem Server (S) bereitgestellt werden, und das Klienten-Server-System vorzugsweise einen weiteren Klienten (K2) mit einem weiteren technischen Gerät (TD2) aufweist und der Server (S) dazu eingerichtet ist, die zweiten Modell- Gewichte dem weiteren Klienten (K2) durch föderiertes Lernen bereitzustellen.

5. Klienten-Server-System (CSS) zur Anomalie-Erkennung beim Betrieb eines technischen Geräts (TD1) , umfassend einen Server (S) und einen Klienten (Kl) mit einer ersten Rechenvorrichtung (1) , aufweisend einen Prozessor und einen Speicher, und das Klienten-Server-System ( CSS ) dazu eingerichtet ist , das Verfahren nach einem der vorhergehenden Ansprüche aus zuführen .

6. Computerprogramm, umfassend Befehle , welche bei deren Aus führung durch einen Computer diesen veranlassen, das Verfahren nach einem der Ansprüche 1 bis 5 aus zuführen .

7 . Elektronisch lesbarer Datenträger mit darauf gespeicherten lesbaren Steuerinformationen, welche zumindest das Computerprogramm nach dem vorhergehenden Anspruch umfassen und derart ausgestaltet sind, dass sie bei Verwendung des Datenträgers in einer Recheneinrichtung das Verfahren nach einem der Ansprüche 1 bis 5 durchführen .

8 . Datenträgersignal , welches das Computerprogramm nach Anspruch 6 überträgt .

Description:
Computer- Implementiertes Verfahren und System zur Anomalie- Erkennung beim Betrieb eines technischen Geräts

Die Erfindung betri f ft ein computer-implementiertes Verfahren und ein Klienten-Server-System zur Anomalie-Erkennung beim Betrieb eines technischen Geräts .

Ferner betri f ft die Erfindung ein Computerprogramm, einen elektronisch lesbaren Datenträger und ein Datenträgersignal .

Typische Systeme künstlicher Intelligenz ( kurz „KI" ) passen Modelle des maschinellen Lernens ( kurz „ML" ) nur sehr langsam an neue Daten oder Umgebungsänderungen an . Der typische ML- Lebens zyklus umfasst drei Phasen : i ) Datenerfassung und Datenaufbereitung, ii ) Modellerstellung und iii ) Modellbereitstellung und Inferenz .

Das Schließen von Daten auf (hypothetische ) Modelle wird als statistische Inferenz bezeichnet .

ML-Modelle können sich j edoch häufig nicht schnell an Live- Daten oder neue Eingabedaten anpassen .

Ferner sind nicht alle Daten in einem Cloud-Edge-Kontext in der Cloud verfügbar . Das Senden aller Daten an die Cloud umgeht den Vorteil des Edge-Computing .

In einem Klienten-Server-System liegt eine Rechenvorrichtung mit einem Prozessor und einem Speicher an der Edge .

Außerdem verfügen Edge-Geräte häufig nicht über ausreichende Fähigkeiten, um ein vollständiges Training von ML-Modellen durchzuführen .

In modernen Cloud-Edge-Umgebungen nach dem Stand der Technik wird beispielsweise das Training und die Inferenz nur in der Cloud durchgeführt . Dies hat den Vorteil , dass alle Daten an einem Ort verarbeitet und gespeichert werden . Klienten rufen diese Daten von einer zentralen Stelle ab . Jedoch ist keine Echt zeitinteraktion mit einem Prozess , welcher an einem Klienten ausgeführt wird, möglich .

Alternativ wird im Stand der Technik Training in der Cloud und die Inferenz an der Edge durchgeführt . Dies führt dazu, dass performantes Training in der Cloud und Prozessinteraktion in Echtzeit an der Edge ausgeführt wird . Jedoch werden dabei Daten über die Cloud und die Edge verstreut verarbeitet oder gespeichert , was nachteilig ist , da das Aktualisieren von Modellen typischerweise nur in der Cloud möglich ist .

Es ist daher Aufgabe der Erfindung eine Lösung bereitzustellen, mittels welcher die genannten Nachteile überwunden werden können .

Die erfindungsgemäße Aufgabe wird durch ein Verfahren eingangs genannter Art gelöst , welches von einem Klienten- Server-System mit einem Server und einen Klienten mit einer ersten Rechenvorrichtung, aufweisend einen Prozessor und einen Speicher, betrieben wird und folgende Schritte ausgeführt werden : a) Erfassen aus dem Betrieb des technischen Geräts und Bereitstellen von ersten Trainings-Daten vom Klienten an den Server, Erzeugen und Trainieren eines ersten Modells in Form eines Auto-Encoders durch den Server, und Bereitstellen des ersten Modells in Form von ersten Gewichten vom Server an den Klienten, sowie Laden und Speichern des ersten Modells in der ersten Rechenvor-richtung, b) Erfassen von Betriebs-Daten des technischen Geräts und Bestimmen einer Anomalie-Kenngröße hinsichtlich der Übereinstimmung mit dem ersten Modell durch die erste Rechenvorrichtung, c) Prüfen, ob die Anomalie-Kenngröße innerhalb eines vorbestimmten Werte-Bereichs liegt , wenn j a, fortfahren mit Schritt b ) , sonst fortfahren mit Schritt d) , d) Bereitstellen der ersten Modell-Gewichte des Auto- Encoders und Speichern mit der Anomalie-Kenngröße im Speicher durch die erste Rechenvorrichtung, e ) Prüfen, ob eine vorbestimmte Anzahl an gespeicherten ersten Modell-Gewichte des Auto-Encoders für j eweilige Anomalie-Kenngrößen erreicht ist , wenn j a, dann Fortfahren mit Schritt b ) , sonst Fortfahren mit Schritt f ) , f ) Übermitteln der gespeicherten ersten Modell-Gewichte für j eweilige Anomalie-Kenngrößen an eine zweite Rechenvorrichtung, welche vom Klienten umfasst ist und mit der ersten Rechenvorrichtung über eine Kommunikations- Verbindung mit einer vordefinierten Bandbreite verbunden ist , und Berechnen eines zweiten Modells in Form eines Auto-Encoders mit zweiten Modell-Gewichten durch Bestimmen der Inferenz durch die zweite Rechenvorrichtung, g) Übermitteln der zweiten Modell-Gewichte des zuvor berechneten zweiten Modells an die erste Rechenvorrichtung, und Löschen der im Schritt f ) übermittelten ersten Modell- Gewichte aus dem Speicher der ersten Rechenvorrichtung, und Fortfahrten mit Schritt b ) .

Dadurch ist ein Modell-Training in der Cloud vorgesehen, die Inferenz wird j edoch an der Edge berechnet , außerdem erfolgt ein erneutes Trainieren ( engl . „re-training" ) an der Edge .

Dadurch ist es möglich ein performantes Training in der Cloud aus zuführen, sowie eine Prozess- Interaktion in Echtzeit zu erlauben, und ferner ein Re-Training von ML-Modellen wiederum an der Edge durchzuführen, um beispielsweise die Modellgenauigkeit aufgrund neuer Trainings-Daten, welche aus dem vorher- gehenden Betrieb eines technischen Geräts mit dem vorhergehenden ML-Modell gewonnen wurden, zu verbessern .

Die Daten liegen zwar über Klienten und Server verteilt , j edoch kann durch Anwendung föderierten Lernens das neue ML- Modell an andere Klienten verteilt werden, ohne die Rohdaten selbst im verteilten Klienten-Server-System zu verteilen, was zu einer verbesserten Datensicherheit und Privatsphäre führt .

In einer Weiterbildung der Erfindung ist es vorgesehen, dass die Anomalie-Kenngröße der Rekonstruktions-Fehler des Auto- Encoders ist .

Dadurch kann auf besonders einfache Weise eine besonders aussagekräftige Anomalie-Kenngröße ermittelt werden .

In einer Weiterbildung der Erfindung ist es vorgesehen, dass die Größe der Speicherbelegung des Speichers der ersten Rechenvorrichtung zum Speichern der im Schritt e ) vorbestimmte Anzahl an gespeicherten ersten Modell-Gewichte des Auto- Encoders proportional zur Bandbreite der Kommunikations- Verbindung zwischen der ersten Rechenvorrichtung und der zweiten Rechenvorrichtung vorgesehen ist .

Dadurch wird erreicht , dass erst bei Überschreiten einer vorgegebenen Anzahl an Rekonstruktions-Fehlern eine Aktualisierung des Modells erfolgt .

In einer Weiterbildung der Erfindung ist es vorgesehen, dass die im Schritt f ) berechneten zweiten Modell-Gewichte vom Klienten dem Server bereitgestellt werden, und das Klienten- Server-System vorzugsweise einen weiteren Klienten mit einem weiteren technischen Gerät aufweist und der Server dazu eingerichtet ist , die zweiten Modell-Gewichte dem weiteren Klienten durch föderiertes Lernen bereitzustellen .

Dadurch kann erreicht werden, dass das aktualisierte zweite Modell auf einfache Weise von weiteren Klienten genutzt werden können, ohne selbst dafür nötige Rechenoperationen aus zu- führen . Somit ist für weitere Klienten eine Bauart mit reduzierter Komplexität und geringeren Kosten möglich, und es können insbesondere die Prinzipen von föderiertem Lernen angewendet werden .

Die erfindungsgemäße Aufgabe wird durch ein System eingangs genannter Art gelöst , umfassend einen Serverund einen Klienten mit einer ersten Rechenvorrichtung, aufweisend einen Prozessor und einen Speicher, und das Klienten-Server-System dazu eingerichtet ist , das erfindungsgemäße Verfahren aus zuführen

Die erfindungsgemäße Aufgabe wird durch ein Computerprogramm gelöst , umfassend Befehle , welche bei deren Aus führung durch einen Computer diesen veranlassen, das erfindungsgemäße Verfahren aus zuführen .

Die erfindungsgemäße Aufgabe wird durch einen elektronisch lesbaren Datenträger mit darauf gespeicherten lesbaren Steuerinformationen gelöst , welche zumindest das erfindungsgemäße Computerprogramm umfassen und derart ausgestaltet sind, dass sie bei Verwendung des Datenträgers in einer Recheneinrichtung das erfindungsgemäße Verfahren durchführen .

Die erfindungsgemäße Aufgabe wird durch ein Datenträgersignal gelöst , welches das erfindungsgemäße Computerprogramm überträgt .

Die Erfindung wird nachfolgend anhand eines in den beigeschlossenen Zeichnungen dargestellten Aus führungsbeispiels näher erläutert . In den Zeichnungen zeigt :

Fig . 1 ein Aus führungsbeispiel des erfindungsgemäßen Verfahrens als Ablauf diagramm,

Fig . 2 ein Aus führungsbeispiel des erfindungsgemäßen Systems als Blockschaltbild . Fig . 1 stellt ein Aus führungsbeispiel des erfindungsgemäßen Verfahrens als Ablauf diagramm dar .

Ein Klienten-Server-System CSS zur Anomalie-Erkennung beim Betrieb eines technischen Geräts TD1 umfasst einen Server S und einen Klienten Kl mit einer ersten Rechenvorrichtung 1 und einen weiteren, in diesem Beispiel baugleichen Klienten K2 mit einem weiteren technischen Gerät TD2 .

Es können j edoch auch weitere Klienten im System eingesetzt werden, welche eine einfachere Bauart vorweisen und das das Modell mithil fe föderierten Lernens beziehen .

Die erste Rechenvorrichtung 1 weist einen Prozessor und einen Speicher auf .

Der Klient Kl umfasst ferner eine zweite Rechenvorrichtung 2 , welche mit der ersten Rechenvorrichtung 1 über eine Kommunikations-Verbindung 3 verbunden ist , wobei die Kommunikations- Verbindung 3 eine vordefinierte Bandbreite aufweist .

Der Klient Kl erfasst vorzugsweise mithil fe der ersten Rechenvorrichtung 1 während eines Referenzbetriebs des technischen Geräts TD1 Testdaten DT , welche einen zulässigen, gültigen Betrieb technischen Geräts TD1 repräsentieren .

Die Datenerfassung kann beispielsweise mit einem Sensor- Mittel wie einer Kamera erfolgen und die Testdaten DT können Kamera-Aufnahmen sein .

Mithil fe dieser Testdaten DT kann im Server durch Anwendung eines Auto-Encoders ein globales Modell auf Basis maschinellen Lernens für das technische Geräts TD1 erzeugt und trainiert werden .

In weiterer Folge kann das globale Modell an Klienten Kl , K2 zum Betrieb des technische Geräts TD1 in Form von Gewichten des globalen Modells bereitgestellt werden . Das erfindungsgemäße Verfahren zur Anomalie-Erkennung beim Betrieb eines technischen Geräts TD1 in Fig . 2 beschreibt nun die Details der Daten-Verarbeitung .

Das Verfahren ist computer-implementiert , das heißt ein oder mehrere Schritte werden von einem Computer ausgeführt .

Folgende Schritte werden ausgeführt : a ) Erfassen aus dem Betrieb des technischen Geräts TD1 und Bereitstellen von ersten Trainings-Daten DT vom Klienten Kl an den Server S , Erzeugen und Trainieren eines ersten Modells in Form eines Auto-Encoders durch den Server, und Bereitstellen des ersten Modells in Form von ersten Gewichten vom Server S an den Klienten Kl , sowie Laden und Speichern des ersten Modells in der ersten Re- chenvor-richtung 1 , b ) Erfassen von Betriebs-Daten des technischen Geräts TD1 und Bestimmen einer Anomalie-Kenngröße hinsichtlich der Übereinstimmung mit dem ersten Modell durch die erste Rechenvorrichtung 1 , beispielsweise der Rekonstruktions- Fehler des Auto-Encoders , c ) Prüfen, ob die Anomalie-Kenngröße innerhalb eines vorbestimmten Werte-Bereichs liegt , wenn j a, fortfahren mit Schritt b ) , sonst fortfahren mit Schritt d) , d) Bereitstellen der ersten Modell-Gewichte des Auto- Encoders und Speichern mit der Anomalie-Kenngröße im Speicher durch die erste Rechenvorrichtung 1 , e ) Prüfen, ob eine vorbestimmte Anzahl an gespeicherten ersten Modell-Gewichte des Auto-Encoders für j eweilige Anomalie-Kenngrößen erreicht ist , wenn j a, dann Fortfahren mit Schritt b ) , sonst Fortfahren mit Schritt f ) , f ) Übermitteln der gespeicherten ersten Modell-Gewichte für j eweilige Anomalie-Kenngrößen an eine zweite Rechenvor- richtung 2 , welche vom Klienten Kl umfasst ist und mit der ersten Rechenvorrichtung 1 über eine Kommunikations- Verbindung 3 mit einer vordefinierten Bandbreite verbunden ist , und Berechnen eines zweiten Modells in Form eines Auto-Encoders mit zweiten Modell-Gewichten durch Bestimmen der Inferenz durch die zweite Rechenvorrichtung 2 , g) Übermitteln der zweiten Modell-Gewichte des zuvor berechneten zweiten Modells an die erste Rechenvorrichtung 1 , und Löschen der im Schritt f ) übermittelten ersten Modell-Gewichte aus dem Speicher der ersten Rechenvorrichtung 1 , und Fortfahrten mit Schritt b )

Die Größe der Speicherbelegung des Speichers der ersten Rechenvorrichtung 1 zum Speichern der im Schritt e ) vorbestimmte Anzahl an gespeicherten ersten Modell-Gewichte des Auto- Encoders ist proportional zur Bandbreite der Kommunikations- Verbindung 3 zwischen der ersten Rechenvorrichtung 1 und der zweiten Rechenvorrichtung 2 vorgesehen .

Die zweite Rechenvorrichtung ist vorzugsweise ein Grafikprozessor ( engl . „graphics processing unit" , kurz GPU) , welcher ein auf ef fi ziente Berechnung spezialisierter und optimierter Prozessor ist und für künstliche Intelligenz und maschinelles Lernen verwendet werden kann . Weil GPUs außerordentlich viel Rechenleistung bieten, können sie beispielsweise aufgrund von Parallelverarbeitung eine enorme Beschleunigung bei Rechenaufgaben erzielen .

Der Grafik-Prozessor kann integrierter Teil der ersten Rechenvorrichtung sein, wie eine integrierte Grafikkarte eines Edge-Computers .

Das Bereitstellen der ersten Modell-Gewichte des Auto- Encoders im Schritt d) wird auch als „embedding" komprimierter Merkmale beziehungsweise eines komprimierten Merkmals- raums , welcher durch die Modell-Gewichte gebildet wird, bezeichnet .

Es ist klar, dass im gesamten Verfahren ein oder mehrere Anomalie-Kenngrößen angewendet werden können . Die im Schritt f ) berechneten zweiten Modell-Gewichte können vom Klienten Kl dem Server S bereitgestellt werden .

Der Server S kann sein globales ML-Modell nun aktualisieren .

Wenn das Klienten-Server-System CSS zumindest einen weiteren Klienten K2 mit einem weiteren technischen Gerät TD2 auf- weist , kann das System dem weiteren Klienten K2 durch föderiertes Lernen die zweiten Modell-Gewichte bereitstellen .

Bezugszeichenliste :

1, 2 Rechenvorrichtung mit Prozessor und Speicher

3 Datenverbindung mit Übertragungskapazität

CSS Klienten-Server-System (engl. „client-server- system")

Kl, Kl Klient, Edge-Vorrichtung

S Server

D, DT Daten, Trainings-Daten

TD1, TD2 technisches Gerät, z.B. Motor einer Produktions- anlage