FLAGUS trasforma l’anomaly detection contro APT, apprendimento attivo e AutoEncoder avversariali potenziano la sicurezza con pochi dati
Il 5 settembre 2025 Sidahmed Benabderrahmane e Talal Rahwan hanno presentato su arXiv il nuovo framework FLAGUS — Feedback Learning Adversarial GAN-Updated System — una soluzione sofisticata e scalabile per il rilevamento delle minacce avanzate persistenti (APT), che abbatte i limiti imposti dalla scarsità di dati etichettati.
Le APT rappresentano una delle sfide più complesse in cybersecurity: agendo in modo furtivo e su lunghi orizzonti temporali, restano difficili da identificare con metodi tradizionali basati su firme o classificatori supervisionati. In particolare, in set reali come quelli del programma DARPA Transparent Computing, gli attacchi costituiscono solo lo 0,004 % del totale, rendendo la costruzione di sistemi affidabili particolarmente ardua.
FLAGUS si fonda su tre pilastri distintivi:
- un Attention Adversarial Dual AutoEncoder (ADAEN) che apprende a codificare il comportamento “normale”, evidenziando le anomalie tramite errori di ricostruzione e focalizzandosi sulle caratteristiche chiave grazie al meccanismo di attention;
- un ciclo di apprendimento attivo (active learning): vengono selezionati campioni incerti, etichettati tramite un “oracle” esterno, raffinando progressivamente il modello con costi minimi di labeling;
- l’uso di GAN per generare dati sintetici realistici che bilanciano il dataset e combattono il problema dell’imbalanced data.
La sperimentazione su 40 dataset di “provenance trace” (Android, Linux, BSD, Windows), con scenari di attacco reali, ha dimostrato che FLAGUS supera con margine nove metodi benchmark, utilizzando metriche basate su ranking (nDCG), che premiano la capacità di mettere in evidenza le anomalie più critiche in cima alla lista — essenziale per gli operatori dei SOC.
I risultati sono stati concreti e significativi: con l’attivo supporto dell’apprendimento incrementale, gli score nDCG medi e massimi sono migliorati costantemente su tutti i sistemi operativi, in particolare in scenari complessi (come Pandex, Bovia), con punte di nDCG pari a 1.0 in alcuni casi.
FLAGUS si rivela quindi come un framework pratico e versatile, utile non solo per la cybersecurity ma anche per contesti dove le anomalie sono rare e costose da etichettare: dalla rilevazione di frodi ai sistemi medici, dall’insider threat agli ambienti IoT.
Gli autori suggeriscono direzioni future congeniali alla scalabilità e all’adozione reale: integrazione di pretraining self-supervised, uso di reinforcement learning per ottimizzare le richieste all’oracolo, e deployment in pipeline real-time resistente ad attacchi avversariali.
In un panorama dove le difese automatizzate faticano a stare al passo con le minacce avanzate, FLAGUS offre una strada concreta per potenziare i sistemi SOC: imparare con pochi dati, generare informazioni rilevanti con costi ridotti, e mantenere performance elevate grazie a un mix efficace di autoencoder, GAN e apprendimento attivo.
Commenti
Posta un commento