BMVC 2024

xAILab Bamberg präsentiert zwei Paper auf der 35. British Machine Vision Conference (BMVC) in Glasgow

xAILAB Bamberg feiert bedeutenden Erfolg: Zwei Forschungsarbeiten wurden auf der diesjährigen 35. British Machine Vision Conference (BMVC) im November 2024 angenommen. Ein Beitrag wird auf der Hauptkonferenz präsentiert werden, während der andere Beitrag auf dem begleitenden RROW-Workshop zur Verbesserung der Robustheit und Anpassungsfähigkeit von KI-Algorithmen für kritische Anwendungen wie automatisiertes Fahren, Robotik und medizinische Bildgebung zu sehen sein wird.

Hauptkonferenz Paper: "Privacy-preserving datasets by capturing feature distributions with Conditional VAEs"

Große und gut kommentierte Datensätze sind für die Weiterentwicklung von Deep-Learning-Anwendungen unerlässlich, jedoch oft teuer oder unmöglich für eine einzelne Einrichtung zu beschaffen. In vielen Bereichen, darunter auch in der Medizin, sind Ansätze, die sich auf die gemeinsame Nutzung von Daten stützen, von entscheidender Bedeutung, um diese Herausforderungen zu bewältigen. Die gemeinsame Nutzung von Daten erhöht zwar den Umfang und die Vielfalt des Datensatzes, wirft aber auch erhebliche Datenschutzbedenken auf. Übliche Anonymisierungsmethoden, die auf dem Paradigma der k-Anonymität basieren, können die Datenvielfalt oft nicht bewahren, was die Robustheit der Modelle beeinträchtigt. In dieser Arbeit wird ein neuartiger Ansatz vorgestellt, der Conditional Variational Autoencoders (CVAEs) verwendet, die auf Merkmalsvektoren trainiert werden, die aus großen vortrainierten Bildverarbeitungsgrundmodellen extrahiert wurden. Basismodelle erkennen und repräsentieren komplexe Muster in verschiedenen Bereichen und ermöglichen es den CVAEs, den Einbettungsraum einer gegebenen Datenverteilung getreu zu erfassen, um eine vielfältige, datenschutzkonforme und potenziell unbegrenzte Menge synthetischer Merkmalsvektoren zu generieren (zu samplen). Unsere Methode übertrifft herkömmliche Ansätze sowohl im medizinischen als auch im natürlichen Bildbereich deutlich, da sie eine größere Datenvielfalt und eine höhere Robustheit gegenüber Störungen aufweist und gleichzeitig die Privatsphäre der Stichprobe wahrt. Diese Ergebnisse unterstreichen das Potenzial generativer Modelle, Deep-Learning-Anwendungen in datenknappen und datenschutzsensiblen Umgebungen erheblich zu beeinflussen.

Für weitere Details können Sie das Paper hier und den zugehörige Quellcode hier abrufen.

RROW-Workshop Paper: "Unsupervised Feature Orthogonalization for Learning Distortion-Invariant Representations"

Wir präsentieren unORANIC+, eine neuartige Methode zur unüberwachten Orthogonalisierung von Bildmerkmalen, die die Fähigkeit eines Vision Transformers nutzt, sowohl lokale als auch globale Zusammenhänge zu erfassen, um die Robustheit und Generalisierbarkeit zu verbessern. Die schlanke Architektur von unORANIC+ trennt effektiv anatomische von bildspezifischen Merkmalen, was zu robusten und unvoreingenommenen latenten Repräsentationen führt. Dadurch kann das Modell herausragende Leistungen bei einer Vielzahl von Aufgaben in der medizinischen Bildanalyse und auf unterschiedlichen Datensätzen erbringen. Umfangreiche Experimente belegen die Leistungsfähigkeit von unORANIC+ bei der Bildrekonstruktion, seine Widerstandsfähigkeit gegenüber Störungen sowie seine Fähigkeit, bestehende Bildverzerrungen zu korrigieren. Darüber hinaus zeigt das Modell eine außergewöhnliche Eignung für nachgelagerte Aufgaben wie die Krankheitsklassifikation und die Erkennung von Bildkorruption. Wir bestätigen seine Anpassungsfähigkeit an verschiedene Datensätze, unabhängig von der Bildquelle oder der Stichprobengröße, und positionieren die Methode somit als vielversprechenden Algorithmus für die fortschrittliche medizinische Bildanalyse – insbesondere in ressourcenbeschränkten Umgebungen, in denen große, maßgeschneiderte Datensätze fehlen.

Für weitere Details können Sie das Paper hier und den zugehörige Quellcode hier abrufen.

Über BMVC und RROW

Die British Machine Vision Conference (BMVC) ist die jährliche Konferenz der British Machine Vision Association (BMVA) über maschinelles Sehen, Bildverarbeitung und Mustererkennung. Sie ist eine der wichtigsten internationalen Konferenzen über Computer Vision und verwandte Bereiche, die im Vereinigten Königreich stattfindet. Mit zunehmender Popularität und Qualität hat sie sich zu einer angesehenen Veranstaltung im Bildverarbeitungs-Kalender entwickelt.

Der RROW-Workshop befasst sich mit den Herausforderungen, denen sich tiefe neuronale Netze bei unerwarteten Szenen und Umgebungen stellen müssen, die sich von den Trainingsdaten unterscheiden. Im Fokus stehen Methoden und Datensätze zur Verbesserung der Robustheit und Anpassungsfähigkeit von KI für kritische Anwendungen wie automatisiertes Fahren, Robotik und medizinische Bildgebung.

In diesem Jahr findet die Konferenz in Glasgow auf dem Scottish Event Campus statt, einem renommierten Veranstaltungsort, der für seine modernen Einrichtungen und seine malerische Lage am Fluss Clyde bekannt ist.