Logo: LGLN – Landesamt für Geoinformation und Landesvermessung Niedersachsen – Zur Startseite Niedersachsen klar Logo

Erfolgreicher Einsatz von Künstlicher Intelligenz in der Vermessungs- und Katasterverwaltung Niedersachsen.

Seit über 4 Jahren wird im Landesamt für Geoinformation und Landesvermessung Niedersachsen (LGLN) eine Software entwickelt, die mit Hilfe von Künstlicher Intelligenz (KI) Gebäude in Luftbildern erkennen kann. Es war ein weiter Weg vom ersten Prototypen bis zur produktiven Anwendung.

Doch seit diesem Jahr unterstützt die KI bei einem ersten Fachverfahren, indem sie die Menschen bei einer sehr mühevollen Aufgabe ersetzt.

Spätestens seit der Veröffentlichung von ChatGPT Ende 2022 ist das Thema KI im Alltag von vielen Menschen angekommen. Chatbots beantworten nicht mehr nur Fragen, sondern generieren uns vollständige Texte und realistische Bilder zu fast jedem Thema. Dabei ist das, was uns die KI abliefert, häufig so gut, als hätte es ein Mensch geschaffen.

Hinter ChatGPT und anderen Chatbots stehen sogenannte Große Sprachmodelle (engl.: Large Language Modells, LLMs). Diese KI-Modelle wurden mit vielen Texten trainiert und sind dadurch in der Lage menschliche Kommunikation nachzubilden. Die Entwicklung, das Training und die Anwendung solcher KI-Modelle gehören zum Fachbereich des „Maschinellen Lernens“, wird aber umgangssprachlich meistens einfach „KI“ genannt.

Auch im Bereich der (Luft-) Bildanalyse haben sich in den letzten Jahren Methoden des Maschinellen Lernens durchgesetzt und erstaunliche Möglichkeiten geschaffen. Im Bereich der Bildklassifikation kann die KI heutzutage zuverlässig unterscheiden, ob auf dem Foto z.B. eine Katze oder ein Hund zu sehen ist. Ein anderes Anwendungsfeld ist die Objekterkennung. Hierbei erkennt die KI in den Kamerabildern z.B. Fahrzeuge, Personen oder andere Objekte. Dies ist beispielsweise für das autonomes Fahren eine wichtige Fähigkeit.

Ein dritter Bereich der Bildanalyse, wo KI zum Einsatz kommt, ist die Bildsegmentierung. Hierbei wird jedes Pixel eines Bildes klassifiziert, beispielsweise in die Klassen „Person“ oder „keine Person“. Oder in der Medizin in „gesundes Gewebe“ und „krankes Gewebe“ oder in der Satellitenfernerkundung in die Klassen: „Wald“, „Siedlungsgebiet“, „Wasser“ und „Agrarfläche“.

Die erste KI, die im LGLN zum Einsatz kommt, gehört ebenfalls in den Bereich der Bildsegmentierung. Vereinfacht gesagt klassifiziert sie jedes Pixel eines Luftbildes in die Klassen „Dach“ und „kein Dach“. Somit ist es der KI möglich, die Lage und Form jedes aus der Luft sichtbaren Gebäudes zu erfassen. Genau genommen nutzt die KI dabei keine Luftbilder, sondern sogenannte Digitale Orthophotos (DOP), also auf eine Referenzfläche entzerrte und damit lagerichtige Luftbilder. Da heutzutage bei den DOPs ein digitales Oberflächenmodell als Referenzfläche verwendet wird, spricht man auch von TrueDOPs. In diesen sind auch die Dächer der Gebäude lagerichtig abgebildet und verdecken keine Bereiche neben den Gebäuden. Wie in den meisten Bundesländern haben diese TrueDOPs in Niedersachsen eine Bodenpixelgröße von 20 cm.

Für jedes Pixel dieser TrueDOPs gibt es fünf Werte, die von der KI zur Gebäudeerkennung genutzt werden: Je einen Wert für die Farben Rot, Grün, Blau und Nahen Infrarot und ein fünfter Wert für die Höhe. Dieser fünfte Wert wird aus der Differenz zwischen einem Geländemodell und einem Oberflächenmodell berechnet und beschreibt die Höhe der Objekte (z.B. Gebäude, Bäume, Fahrzeuge) auf dem Gelände.

Bevor die KI jedoch in der Lage ist, bisher noch nicht bekannte Gebäude zu finden, muss sie für diese Aufgabe trainiert werden. Als Trainingsdaten werden dabei sehr viele Beispiele benötigt, wie sich Gebäude in den fünf jeweiligen Pixelwerten darstellen. Die Qualität einer KI hängt hier entscheidend von der Qualität der Trainingsdaten ab. Für eine gute KI, dürfen die Trainingsdaten nur wenige Fehler enthalten, müssen repräsentativ sein und sollten in ausreichender Anzahl vorliegen.

Oft ist die Erstellung oder Beschaffung solcher Trainingsdaten die größte Herausforderung bei der Entwicklung einer KI. Im LGLN existiert für die benötigten Trainingsdaten jedoch bereits eine sehr gute Grundlage: Im Amtlichen Liegenschaftskatasterinformationssystem (ALKIS) sind Lage und Form fast aller Gebäude erfasst und seit 2023 ist ganz Niedersachsen erstmals vollständig mit TrueDOPs erfasst. Ein Geländemodell und ein Oberflächenmodell liegen ebenfalls bereits vor, sodass die fünf Werte pro Pixel flächendeckend vorhanden sind.

Kombiniert man diese Datensätze, erhält man einen sehr großen Trainingsdatensatz, mit dem auch komplexere KI-Modelle trainiert werden können. Im LGLN werden die Daten genutzt, um KI-Modelle zu trainieren, die seit Ende 2022 auf einer Architektur basieren, die unter dem Namen „Polygonal Building Extraction by Frame Field Learning“ in Frankreich entwickelt wurden.

Für das Training solcher großen KI-Modelle werden sehr leistungsstarke Grafikkarten mit viel Speicher benötigt. Das LGLN verwendet deshalb die für KI-Anwendungen sehr verbreiteten NVIDIA A100. Diese werden von der Cloud-Plattform CODE-DE für Behörden in Deutschland bereitgestellt und können auch vom LGLN genutzt werden.

Im Ergebnis der neuesten KI-Generation zur Gebäudeerkennung, die vom LGLN trainiert wurde, sind die Gebäude mit einer sehr hohen Vollständigkeit und Korrektheit erkannt worden. Ein großer Vorteil der verwendeten KI-Architektur ist die exakte Erkennung der Gebäudegeometrie. Die KI zeichnet die meist eckige Form der Dächer sehr präzise nach.

  Bildrechte: LGLN
Die türkisen Gebäude wurden von einer KI eingezeichnet.

Um alle Gebäude in Niedersachsen zu finden, muss die KI rund 12.000 TrueDOP-Kacheln durchsuchen. Diese haben jeweils eine Größe von 2 km × 2 km. Mit den aktuell verfügbaren Cloud-Ressourcen dauert die KI-Gebäudeerkennung für ganz Niedersachsen ca. 3 Tage. Diese Zeit ließe sich aber durch das Buchen weiterer Ressourcen nahezu beliebig reduzieren.

Für die allermeisten Gebäude in Niedersachsen ist die Form und Lage durch die klassische Gebäudeeinmessung bereits sehr genau bekannt. Ein wichtiger Nachbearbeitungsschritt ist daher die geometrische Verschneidung der bekannten Gebäude, die im ALKIS gespeichert sind, mit den Gebäuden, die durch die KI gefunden wurden. Die dabei entstehenden Differenzen sind für das LGLN eine sehr wertvolle Information.

Vereinfacht gesagt gibt es drei Arten von Differenzen: 1. Die KI hat ein Gebäude gefunden, das im ALKIS nicht existiert. Dies kann ein Hinweis auf einen Neubau sein. 2. Es gibt ein Gebäude im ALKIS, welches die KI nicht gefunden hat. Dies kann ein Hinweis auf einen Abriss sein. 3. Es gibt Unterschiede in Form oder Lage eines Gebäudes. Dies kann ein Hinweis auf bauliche Veränderungen oder Verschiebungen sein. Letztere können durch inhomogene Lagekoordinaten in den ALKIS-Daten auftreten.

Diese von der KI gefundenen Hinweise auf Differenzen zwischen der im Luftbild abgebildeten Realität und dem im ALKIS gespeicherten Gebäudebestand sollen jeweils durch einen Menschen validiert werden. Dazu wurde im LGLN eine Web-Anwendung entwickelt, mit der jede Differenz möglichst einfach betrachtet und bewertet werden kann.

Bildrechte: LGLN
Mit der Anwendung „KI-Gebäudeerkennung“ werden automatisch neue Gebäude gefunden.

Diese Anwendung wurde so entwickelt, dass sie aus Sicht der Nutzenden komplett im Browser ausgeführt werden kann und keine besonderen Anforderungen an die vorhandene Hardware in den Katasterämtern stellt. Somit kann jede Kollegin und jeder Kollege des LGLN die „KI-Gebäudeerkennung“ nutzen. Bisher mussten die TrueDOPs und ALKIS-Daten systematisch nach Differenzen durchsucht werden. Dieser mühsame und wenig effiziente Arbeitsschritt fällt nun komplett weg, da die Differenzen dank der KI direkt angezeigt werden und nur noch validiert werden müssen.

Bei der Validierung der Differenzen können die Bearbeitenden eine von drei Entscheidungen treffen: 1. Die erkannte Differenz ist korrekt und die ALKIS-Daten müssen aktualisiert werden oder 2. die erkannte Differenz ist zwar korrekt, aber das erkannte Gebäude ist nicht einmessungspflichtig. Die dritte Option wird gewählt, wenn die KI einen Fehler gemacht hat. Diese Fälle sind zwar für die Pflege der ALKIS-Daten irrelevant, sind aber ein wichtiges Feedback für die weitere Verbesserung der KI.

Erkennt die KI beispielsweise häufig Eisenbahnwaggons fälschlicherweise als Gebäude, werden der KI beim nächsten Training mehrere TrueDOPs mit Eisenbahnwaggons gezeigt. Diese sind natürlich nicht als Gebäude klassifiziert. So lernt die KI die markanten Muster in den Daten, die einen Waggon von einem Gebäude unterscheiden.

Dieses Feedback und die ständige Verbesserung ist ein wichtiger Aspekt bei der Entwicklung einer KI-Anwendung. Durch die Nutzung der Anwendung werden automatisch Informationen gesammelt, die zum Training der nächsten KI-Generation genutzt werden können. Im Alltag ist dies bereits allgegenwärtig: Beim Einkaufen, beim Musikhören, beim Fernsehen, beim Scrollen in Sozialen Medien, durch unsere Nutzung von Apps trainieren wir KI-Modelle.

Auch im LGLN war dieses Konzept der ständigen Verbesserung der KI durch die Nutzung der Anwendung schon eingeplant, als im Januar 2020 gemeinsam mit der IBM Deutschland GmbH ein Projekt zur Entwicklung eines Prototyps für die KI-Gebäudeerkennung startete. Neben einem Proof of Concept, war auch die Beschaffung leistungsstarker Cloud-Ressourcen, sowie der Aufbau eigener Kompetenz zur modernen und agilen Softwareentwicklung Teil des gemeinsamen Vorhabens mit IBM.

Im Januar 2021 wurde im LGLN das KI-Team gegründet, welches im Laufe des Jahres die KI-Gebäudeerkennung übernommen hat und seitdem unabhängig von IBM weiterentwickelt. Das KI-Team ist heute eines von 15 agilen, dezentralen Software-Entwicklungsteams des LGLN. Die Teams haben jeweils eine Zielgröße von 8-10 Personen. Entsprechend der IT-Strategie des LGLN setzen die Teams bei der Entwicklung neuer Produkte ausschließlich auf Open Source Software und Cloud-Ressourcen. Auch das KI-Team setzt daher auf offene, frei verfügbare KI-Komponenten.

Seit 2022 arbeitet das KI-Team sehr eng mit einer Projektgruppe im LGLN zusammen. Diese Projektgruppe aus Fachexpert*innen organisiert die Einführung der Software an den über 50 Standorten des LGLN und trägt durch ihre Zusammenarbeit mit dem KI-Team wesentlich zur Weiterentwicklung der KI-Anwendung bei. Im Rahmen von wöchentlichen Arbeitstreffen bekommt die Projektgruppe jede neue Funktion vom KI-Team vorgestellt. Außerdem wird in diesem Rahmen über mögliche Änderungen und das Feedback der Nutzenden diskutiert.

Bei diesem Austausch fließt Wissen in beide Richtungen: Das Entwicklungsteam gewinnt einen tieferen Einblick in die fachlichen Prozesse unserer Behörde. Die Fachexpert*innen bekommen einen Überblick über die Entwicklung eines KI-Modells und lernen die Potenziale und Grenzen der KI beim Lösen eines konkreten Problems kennen.

Das gewonnene, gemeinsame Verständnis ermöglicht es, eine Schnittstelle zwischen Mensch und KI zu entwickeln, die zur optimalen Lösung des technischen Problems führt: eine KI-basierte Anwendung als Entscheidungshilfe für Experten.

Darüber hinaus werden bestehende Arbeitsabläufe analysiert und mögliche Veränderungen durch den Einsatz von KI identifiziert. Dies ermöglichte der Projektgruppe die rechtzeitige Vorbereitung und Gestaltung der neuen Prozesse.

Zusammenfassend lässt sich sagen, dass die erfolgreiche Einführung der KI-basierten Anwendung in den produktiven Betrieb des LGLN maßgeblich durch die frühzeitige Einbindung von Fachexpert*innen und deren Zusammenarbeit mit dem Entwicklungsteam vorangetrieben wurde.

Ziel des LGLN ist es, dass die KI-Gebäudeerkennung auch in anderen Bundesländern zum Einsatz kommt. In vielen Gesprächen mit anderen Vermessungsverwaltungen wurde deutlich, dass der Ansatz „Einer für Alle“ gerade für KI-Anwendungen der richtige Weg ist. Sowie andere Behörden in Zukunft die KI-Gebäudeerkennung vom LGLN nutzen werden, nutzt das LGLN vielleicht eine Baumerkennung aus einem anderen Bundesland.

Freie und offene Geodaten, die zunehmend über geeignete Schnittstellen verfügbar sind, sowie Open Source Software und skalierbarer Cloud-Infrastrukturen erlauben es in Zukunft KI-Anwendungen zu skalieren und diese ohne großen Aufwand auf große Gebiete und viele Themen anzuwenden.

Dr. Jonas Bostelmann, Valentina Schmidt

Artikel-Informationen

erstellt am:
05.03.2024

zum Seitenanfang
zur mobilen Ansicht wechseln