Exponentiell Gewichtete Gleitende Durchschnittsdiagramme Zum Erfassen Von Konzeptdrift

Die Klassifizierung von Streaming-Daten erfordert die Entwicklung von Methoden, die rechnerisch effizient und in der Lage, mit Veränderungen in den zugrunde liegenden zu bewältigen sind Verteilung des Stroms, ein Phänomen, das in der Literatur als Konzeptdrift bekannt ist. Wir schlagen eine neue Methode zur Erkennung von Konzeptdrift vor, die ein EWMA-Diagramm (Exponentially Weighted Moving Average) verwendet, um die Fehlklassifizierungsrate eines Streaming-Klassifikators zu überwachen. Unser Ansatz ist modular und kann daher parallel zu jedem zugrunde liegenden Klassifikator ausgeführt werden, um eine zusätzliche Ebene der Konzeptdrifterkennung zur Verfügung zu stellen. Darüber hinaus ist unsere Methode rechnerisch effizient mit Overhead-O (1) und arbeitet in einer voll Online-Modus ohne Notwendigkeit, Datenpunkte im Speicher zu speichern. Im Gegensatz zu vielen existierenden Ansätzen zur Konzeptdrift-Erkennung erlaubt unsere Methode, die Rate der falsch-positiven Erkennungen zu kontrollieren und konstant zu halten. Themen: Statistik - Maschinelles Lernen, Informatik - Lernen, Statistik - Anwendungen DOI-ID: 10.1016j. patrec.2011.08 .019 OAI-Identifikator: oai: arXiv. org: 1212.6018Exponentiell gewichtete gleitende Durchschnittsdiagramme für die Erkennung von Konzeptdrift Die Klassifizierung von Streaming-Daten erfordert die Entwicklung von Methoden, die rechnerisch effizient sind und mit Veränderungen in der zugrunde liegenden Verteilung des Stroms, einem bekannten Phänomen, fertig werden können In der Literatur als Konzeptdrift. Wir schlagen eine neue Methode zur Erkennung von Konzeptdrift vor, die ein exponentiell gewichtetes gleitendes Mittel (EWMA) Diagramm verwendet, um die Fehlklassifizierungsrate eines Strömungsklassifizierers zu überwachen. Unser Ansatz ist modular und kann daher parallel zu jedem zugrunde liegenden Klassifikator ausgeführt werden, um eine zusätzliche Ebene der Konzeptdrifterkennung zur Verfügung zu stellen. Darüber hinaus ist unsere Methode rechnerisch effizient mit Overhead-O (1) und arbeitet in einer voll Online-Modus ohne Notwendigkeit, Datenpunkte im Speicher zu speichern. Anders als viele existierende Ansätze zur Konzeptdrift-Erkennung erlaubt unsere Methode, die Rate der falsch-positiven Erfassungen zu kontrollieren und über die Zeit konstant zu halten. Highlights Wir präsentieren einen Single Pass und einen rechnerisch effizienten Konzept-Drift-Erkennungsalgorithmus. Geeignet für den Einsatz auf hochfrequenten Datenströmen. Ermöglicht die Kontrolle der Rate der falsch positiven Erkennungen, im Gegensatz zu bestehenden Methoden. Experimente auf realen und synthetischen Daten zeigen ermutigende Ergebnisse. Zusammenfassung Klassifizierung von Streaming-Daten erfordert die Entwicklung von Methoden, die rechenschnell und effizient sind In der Lage, mit Veränderungen in der zugrunde liegenden Verteilung des Stroms, ein Phänomen, das in der Literatur als Konzept Drift bekannt zu bewältigen. Wir schlagen eine neue Methode zur Erkennung von Konzeptdrift vor, die ein EWMA-Diagramm (Exponentially Weighted Moving Average) verwendet, um die Fehlklassifizierungsrate eines Streaming-Klassifikators zu überwachen. Unser Ansatz ist modular und kann daher parallel zu jedem zugrunde liegenden Klassifikator ausgeführt werden, um eine zusätzliche Ebene der Konzeptdrifterkennung zur Verfügung zu stellen. Darüber hinaus ist unsere Methode rechnerisch effizient mit Overhead-O (1) und arbeitet in einer voll Online-Modus ohne Notwendigkeit, Datenpunkte im Speicher zu speichern. Anders als viele existierende Ansätze zur Konzeptdrift-Erkennung erlaubt unsere Methode, die Rate der falsch-positiven Erfassungen zu kontrollieren und über die Zeit konstant zu halten. Maschinelles Lernen (stat. ML) Lernen (cs. LG) Anwendungen (stat. AP)


Comments

Popular Posts