Umweltdaten mit KI-Methoden für intelligente Datenanalysen erschließen
Forschungsprojekt Simplex4Learning will KI-/Machine Learning-Methoden praxistauglicher machen
Potenzial von KI-Methoden für umweltbezogene Fragestellungen erschließen
Methoden der Künstlichen Intelligenz (KI) wie Machine Learning (ML) können dazu beitragen, ökologische Phänomene und ihr komplexes Zusammenspiel, wie bei der Ursachen-Wirkung-Forschung in Waldökosystemen, möglichst gut zu verstehen und zu überwachen. Mit ihnen lassen sich Datenbestände aus verschiedenen Quellen intelligent auswerten, fehlende Daten mit Vervollständigungsmethoden generieren, Umweltphänomene prognostizieren oder räumliche Verteilungen besser verstehen. Ihre Anwendung erfordert jedoch vertiefte KI-Expertise, die in Umweltbehörden standardmäßig nicht verfügbar ist. Hier setzt das im Oktober 2023 gestartete Forschungsprojekt Simplex4Learning an.
Erwartungen an das Forschungsprojekt Simplex4Learning
„An das Forschungsprojekt Simplex4Learning knüpfen wir große Erwartungen, insbesondere im Hinblick auf die konkreten Fragestellungen unserer Kunden. Es dient auch unserer Vision, das Potenzial von vorhandenen Daten bestmöglich zu erschließen“, so Dr. Andreas Abecker, Leiter Forschung und Innovation bei Disy. „Viele Kunden können mangels praktikabler Werkzeuge nur mit großem Aufwand sowie viel mathematischem und softwaretechnischem Hintergrundwissen KI-Verfahren zur vertieften Analyse ihrer Daten nutzen. Hier wollen wir speziell mit Machine Learning neue Ansätze bieten“, gibt Dr. Abecker einen Ausblick auf die Erwartungen an das auf 30 Monate ausgelegte Projekt.
Methoden des maschinellen Lernens im Zusammenspiel mit disy Cadenza
Deshalb soll für die Disy-eigene Analysesoftware, die in der öffentlichen Verwaltung auf zehntausenden Arbeitsplätzen im Einsatz ist, ein praxistauglicher Ansatz entwickelt werden. Die Idee ist nun, dass Anwendende aus disy Cadenza heraus über die bestehende Analyse-Erweiterung, die als Schnittstelle zu KI-Verfahren fungieren kann, Daten, Lern- und Analyseaufgaben senden. Diese wiederum kann auf trainierte KI-Modelle zugreifen, die in einem ML-Repository abgelegt sind. Für das Training der KI-Modelle wird im Projekt ein ML-Framework aufgebaut, welches die automatische Erstellung von ML-Modellen mit unterschiedlichen Algorithmen unterstützt. Die ML-Resultate und generierten Ergebnisse werden über die Analyse-Erweiterung an disy Cadenza übergeben und können von den Anwendenden in ihrer Analyseumgebung visualisiert oder in weitere Analyseprozesse eingebunden werden. So kommen ML-Methoden in der Breite in die praktische Anwendung und können ohne vertiefte Kenntnisse zur Anwendung von KI-Algorithmen bei umweltbezogenen Fragestellungen ihren Nutzen entfalten.
Der Simplex-Ansatz: Neue Methode für Datenbereitstellung
Um Umweltdaten für das maschinelle Lernen effizient bereitstellen zu können, kommt der Datenhaltung eine Schüsselrolle zu. Der im Rahmen des Projekts weiterzuentwickelnde Simplex-Ansatz des Projektpartners Simplex4Data GmbH ermöglicht die Datenhaltung in einem einheitlich strukturierten Daten-Pool, der unabhängig von zweckgebundenen Anwendungsfällen ist. Die einheitlich strukturierten Umweltdaten lassen sich in vorhandene (Geodaten-)Infrastrukturen integieren, so dass disy Cadenza darauf zugreifen und sie für die KI-Verfahren bereitstellen kann.
Hintergrundinformationen zum BMBF-Forschungsprojekt Simplex4Learning
Das Forschungsprojekt „Intelligente Umweltdatenanalyse durch automatisiertes maschinelles Lernen für Fachanwender“ (Simplex4Learning) ist im Oktober 2023 gestartet und läuft bis März 2026. Es wird vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen der Maßnahme „KMU-Innovationsoffensive IKT" (Kennzeichen 01IS23041A/B/C) gefördert. Zum Projektkonsortium gehören Disy Informationssysteme GmbH, Simplex4Data GmbH und die Hochschule für Technik und Wirtschaft Berlin. Als assoziierte Partner sind das Landesamt für Natur-, Umwelt- und Verbraucherschutz Nordrhein-Westfalen, die Landesanstalt für Umwelt Baden-Württemberg und der Landesbetrieb Forst Brandenburg eingebunden. Sie unterstützen das Forschungsvorhaben mit Umweltdaten und Anwendungsfällen.