Lade Veranstaltungen

« Alle Veranstaltungen

AI xpress NET: Smarte Informationsextraktion aus Scans und Fotos

28. Januar 2026 18:00 19:30

Beschreibung

AI xpress NET ist der Techtalk rund um KI-Themen im Startup- und Innovationszentrum AI xpress. Du bist Entwickler:in oder KI-Expert:in und interessierst dich für einen Austausch auf hohem technischem Niveau, dann ist AI xpress NET genau das Richtige für dich.

In vielen Unternehmen gibt es auch heute noch Prozesse die auf nicht nativ-digitalen Dokumenten basieren. Das heißt die Inhalte, egal ob Texte, ausgefüllte Formulare oder auch technische Zeichnungen müssen aus Scans oder von Fotos extrahiert und dann strukturiert und weiterverarbeitet werden.

Vision-Language Modelle (VLM) ermöglichen Informationsextraktion aus Dokumenten, bei denen die klassische OCR (optischer Zeichenerkennung) an ihre Grenzen stößt. Nicht nur was die Erkennbarkeit einzelner Zeichen angeht, sondern auch die Erfassung und Aufbereitung komplexer Strukturen beispielsweise in Form von Tabellen. Neben allgemeinen VLMs gibt es auf Texterkennung oder auch die Erkennung technischer Symbole spezialisierte VLMs, mit erstaunlichen Erkennungsraten.

In dieser Ausgabe von AI xpress NET wird es zwei Vorträge geben:

  1. KI in der Digitalisierung von Bauplänen
    Baupläne sind visuell komplexe und heterogene Dokumente, die sich weder mit klassischer OCR noch mit reinen Sprachmodellen vollständig erfassen lassen. Zentrale Informationen liegen in Geometrie, Symbolik und im Zusammenspiel von Bild und Text.
    Im Vortrag gehen wir darauf ein, wie aktuelle KI-Ansätze zur Bauplandigitalisierung eingesetzt werden, von Computer Vision über Vision-Language-Modelle bis hin zu menschlicher Qualitätssicherung. Außerdem beleuchten wir typische Fehlerquellen, Datenherausforderungen und Grenzen produktiver Systeme.
  2. Stand der Technik bei OpenSource VLMs zur Extraktion von Informationen aus Texten
    Der Stand der Technik bei Open-Source Vision-Language-Modellen zeigt, dass moderne Informations­extraktion längst über reine Textverarbeitung hinausgeht.
    Aktuelle VLMs kombinieren Sprachverständnis mit visueller Struktur­erkennung und ermöglichen so die Analyse komplexer Dokumente mit Layout, Tabellen und eingebetteten Grafiken.
    Der Vortrag gibt einen Überblick über verfügbare Open-Source-Modelle, deren Architekturen und Trainingsansätze.
    Beleuchtet werden typische Einsatzszenarien, Stärken gegenüber klassischen NLP-Methoden sowie Grenzen bei Skalierung, Datenqualität und Genauigkeit.

Im Anschluss besteht die Möglichkeit, bei Pizza und Getränken Fragen zu klären, Kontakte zu knüpfen und sich auszutauschen.

Nutzen für die BesucherInnen:

  • Information zum Stand der Technik in dem Bereich.
  • Diskutieren Sie mit anderen Teilnehmern über die Herausforderungen bei der vollständigen Automatisierung von Prozessen und entdecken Sie neue Lösungsansätze.
  • Plattform sowie Vernetzungs- und Austauschmöglichkeit für alle, die an ähnlichen Themen arbeiten.

Speaker

Dr. Dominik Rether, Geschäftsführer Qnovi GmbH

Dr. Dominik Rether ist Geschäftsführer der Qnovi GmbH, die Unternehmen bei der Entwicklung und Implementierung von KI-Lösungen berät und unterstützt. Nach seiner Promotion an der Universität Stuttgart im Bereich Fahrzeug- und Motorentechnik, war er lange Zeit in der Softwareentwicklung mit Fortran zur numerischen Strömungssimulation tätig. 2019 kam es zu ersten Berührungspunkten mit maschinellem Lernen für Prognosemodelle. 2021 erfolgte über die Gründung der Qnovi GmbH der Aufbau eines Teams aus Spezialisten, welche nutzbare KI-Lösungen für alle Branchen entwickeln. Seine Vorliebe gilt den selbstgehosteten LLM-Lösungen, deren Betreuung er teilweise übernimmt.

Florian Kopp, Co-Founder Celekohr

Florian Kopp ist Wirtschaftsingenieur im Bereich Elektrotechnik und einer der drei Gründer der im Herbst 2023 gegründeten Celekohr GmbH. Er verantwortet dort schwerpunktmäßig die Entwicklung des neuronalen Netzes.

Anmeldung

15€ Teilnahmegebühr
Nur für Rückfragen zur Anmeldung oder bei kurzfristigen Terminänderungen!

Ich möchte mich zum Newsletter anmelden.

Tribe Loading Animation Image

TIPP >> Unsere Veranstaltungsreihe “KI Roundtable” wäre auch für dich interessant!

Veranstalter

Röhrer Weg 8
Böblingen, 71032 Deutschland
Google Karte anzeigen
Veranstaltungsort-Website anzeigen
Google Maps

Mit dem Laden der Karte akzeptieren Sie die Datenschutzerklärung von Google.
Mehr erfahren

Karte laden