DIANA
FFG KIRAS Automatisierte Nachrichtenanalyse
DIANA soll durch „Machine Learning“ ein automatisiertes Abgreifen und Analysieren von frei zugänglichen Informationen globaler Informations- und Kommunikationsdienste ermöglichen.
Gewaltbereite Gruppen nutzen vermehrt das Internet zur Organisation. Da der Umfang der im Internet verfügbaren Information kontinuierlich steigt ist eine manuelle Überwachung bereits heute nicht mehr vollständig möglich. Es gehen dadurch wichtige Hinweise verloren, die bei rechtzeitiger Entdeckung zur Einleitung geeigneter Abwehr- und Schutzmaßnahmen und der Ergreifung der agierenden Personen geführt hätten.
Durch automatisiertes Abgreifen und Analysieren der Informationen globaler Informations- und Kommunikationsdienste können Hinweise mit hohem Gefährdungspotential effizient identifiziert und Fachpersonal zur weiteren Bearbeitung zur Verfügung gestellt werden. Dies ermöglicht eine rechtzeitige Information staatlicher Einrichtungen und Einsatzorganisationen. Hierdurch wird ein wesentlicher Beitrag zur Erhöhung der sicherheitspolitischen Vorsorge Österreichs geleistet.
Das Sammeln, Aufbereiten, Analysieren und Verteilen von Nachrichten aus offenen Web-Quellen kann durch einen klar strukturierten Prozess abgebildet werden, und unterteilt sich in folgenden Stufen:
1. Abgreifen von Nachrichten-Quellen: In diesem Schritt werden die gewünschten Nachrichtenquellen durch Crawler-Komponenten abgegriffen. Hier bestehen im Stand der Technik deutliche Lücken hinsichtlich flexibler Reaktion auf unerwartete Formatänderungen und bezüglich der Harmonisierung unterschiedlicher Formate und Metadaten-Standards.
2. Semantische Anreicherung von Nachrichten: In diesem Schritt werden die abgegriffenen Nachrichten semantisch angereichert, etwa durch die Erkennung von benannten Entitäten wie Personen und Orte. Als forschungsrelevant stellen sich in diesem Zusammenhang insbesondere die sprachübergreifende Erkennung, die Disambiguierung erkannter Entitäten sowie die Extraktion von Relationen zwischen diesen dar.
3. Klassifikation von Nachrichten: Dieser Schritt reichert die abgegriffenen Nachrichten basierend auf externen Wissensbasen, etwa gelernten Klassifikationsmodellen oder Regelwerken, weiter an. In der Forschung noch immer herausfordernd sind die für eine allgemeine Lösung dieses Problems notwendigen Klassifikationsverfahren.
4. Automatisierte Analyse und Triggering: In diesem Schritt werden die angereicherten Nachrichten anhand der Konzepte und Klassifikationsergebnisse in ein auf Graphen basierendes Modell integriert. In diesem Modell werden automatisiert vordefinierte Muster erkannt und es werden Ereignisse ausgelöst, wenn bestimmte Muster auftreten. Forschungsrelevant ist hier insbesondere die Erkennung von Mustern in Graphen sowie die Adressierung zeitlicher Veränderungen in den zugrunde liegenden Strukturen.
5. Analyse durch Experten: In diesem Schritt werden die automatisch voranalysierten Nachrichten Experten zur Analyse präsentiert. Dabei ist eine optimale Aufbereitung der Datensätze zur Analyse ein wesentliches Erfolgskriterium.