In der heutigen digitalen Ära sind Sprachmodelle nicht mehr nur ein Produkt der Fantasie; sie sind zu einem integralen Bestandteil unserer täglichen Technologien geworden. Diese Modelle, die von einfachen Textverarbeitungsprogrammen bis hin zu komplexen KI-basierten Systemen reichen, verändern die Art und Weise, wie wir kommunizieren, lernen und arbeiten.
Das Periodensystem der Künstlichen Intelligenz
[Ir] - Image Recognition
Image Recognition [Ir] ermöglicht das Auffinden von Objekten in einem Bild und die Zuordnung zu vordefinierten Kategorien.
- Es kann auf einzelne Bilder oder eine Reihe von Bildern in einem Video angewendet werden.
- Die Anwendung ist nicht auf das menschliche Bildverständnis beschränkt.
- Kameras, Infrarot- oder Röntgengeräte liefern Daten, die von Image Recognition [Ir] erkannt werden können.
- Die Objekterkennung ist eng verbunden mit Image Identification [Ii], Face Recognition [Fr], Face Identification [Fi], Relationship Learning [Lr] und Decision Making [Dm].
- Image Recognition [Ir] wird in Unternehmen für verschiedene Aufgaben eingesetzt.
- Es kann bei der Qualitätssicherung verwendet werden, um den Zustand von Werkstoffen zu überprüfen.
- In der Sicherheitsbranche identifiziert es Personen auf Überwachungskamerabildern.
- Es erkennt Anomalien auf medizinischen Bildern wie CT-, MRT- oder Ultraschallbildern.
- In der Gestensteuerung ermöglicht es die Interaktion mit TV-Geräten.
- Weitere Anwendungsfälle sind das Erkennen von Straßenschildern, Tumoren oder Fehlbeständen in Lagern oder im Einzelhandel.
- Die Forschungsallianz 3Dsensation in Deutschland adressiert Bedarfsfelder wie Produktion, Gesundheit, Mobilität und Sicherheit sowie Interaktionen zwischen Mensch und Maschine.
- Unternehmen wie Carl Zeiss, Jenoptik, Audi und Festo sind Teil dieser Allianz und entwickeln Lösungen mit Image Recognition [Ir].
- Beispiele für Demonstratoren sind Follow-Me-Systeme in der Logistik, Assistenzroboter und Systeme zur Erfassung von Montageszenarien.
- Die Bedeutung von Image Recognition [Ir] hat aufgrund der Fortschritte in der KI in den letzten Jahren zugenommen.
- Autonomes Fahren und andere Anwendungen wären ohne Kameratechniken und KI nicht möglich.
- Die Marktbedeutung wird durch das Entstehen von Bilddatenbanken wie Imagenet und hochdotierte Wettbewerbe zur Objekterkennung unterstrichen.
- Die wirtschaftliche Bedeutung von Image Recognition [Ir] liegt in der Automatisierung, Digitalisierung und verschiedenen Branchen wie Robotik oder Mülltrennung.
- Die Entwicklung von Image Recognition [Ir] stellt eine große Herausforderung dar, da sie eine Vernetzung unterschiedlicher Fähigkeiten erfordert.
- KI-Systeme nutzen große Datenmengen, um Muster abzuleiten, aber die Leistungsfähigkeit ist schwer vorherzusagen.
- Datenqualität und Verfügbarkeit sind problematisch, ebenso wie lange Trainingszeiten und die Nutzung von Cloud-Diensten mit Fragen zur Datensicherheit und Datenschutz.
- Der Mangel an Fachkräften im Bereich Image Recognition [Ir] stellt eine weitere Hürde dar.
- Große IT-Dienstleister wie Google, Facebook, IBM, Microsoft und Amazon sowie führende Universitäten treiben die Entwicklung dieses KI-Elements voran.
- Open-Source-Initiativen fördern die Zusammenarbeit zwischen Forschung und Anwendung, während Referenzdaten und Gütemaße wichtige Grundlagen für die Entwicklung von Image-Recognition-Systemen sind.
Das Studentenprojekt „Shelf Availability“ nutzte eine Live-Videoübertragung von einem simulierten Supermarktgang, um Probleme in den Produktregalen zu erkennen (d. h. leere Regale, Produkte an der falschen Stelle und ungeordnete Regale). Im Falle eines erkannten Problems, wurde eine Push-Benachrichtigung mit einem entsprechenden Bild erstellt und an einen Ladenmitarbeiter gesendet. Das Problem ungeordneter Produktregale ist für Kunden, Mitarbeiter und Manager gleichermaßen suboptimal.…
Image Recognition bzw. die Bilderkennung ist eines der zwölf „Assess“-Elemente des Periodensystems der KI. Dabei geht es darum, Bilder bzw. einzelne Objekte innerhalb der Bilder zu klassifizieren. Was als „Bild“ verstanden wird, kann vielfältig sein. Verbreitet ist es beispielsweise RGB-Bilder, Infrarotbilder oder Röntgenaufnahmen als Input zu verwenden. Allerdings kann die Anwendung über das Bildverständnis eines Menschen hinaus gehen.
Rechtliches
Hochschule für Technik, Wirtschaft und Medien Offenburg
Campus Offenburg
Badstraße 24 77652 Offenburg Tel (+49) 781 205-0 Fax (+49) 781 205-214 |
Campus Gengenbach
Klosterstraße 14 77723 Gengenbach Tel (+49) 7803 9698-0 Fax (+49) 7803 9698-4449 |