Mehrspurige Straße zwischen Hochhäusern Über acht der Autos sind schematisch grüne grafische Flächen gelegt.© LeoPatrizi | istockphoto.com | Bearbeitung: ScaleHub AG

Datenerzeugung durch Schwarmarbeiter

ScaleHub AG

www.scalehub.com

Für viele Prozesse sind auch heute noch Dokumente zwingend erforderlich. Von Steuerformularen über Rezepte bis hin zu Anträgen aller Art – es geht (noch) nicht ohne sie. Ein großer Teil dieser Dokumente kann bereits teilweise oder vollständig automatisch bearbeitet werden. Die anderen Dokumente erfordern jedoch weiterhin manuelle Bearbeitungsschritte und verursachen damit hohe Kosten.

ScaleHub entwickelt eine Technologie, mit deren Hilfe Dokumente in viele verschiedene Teile zerlegt werden. Diese Teile werden als einzelne Arbeitsaufträge auf einer cloudbasierten Plattform bereitgestellt. Sogenannte Crowdworker von verschiedenen Crowdsourcing Marktplätzen bearbeiten dann die Aufträge. Crowdworker sind freie Mitarbeiter, die jeder für sich kleine Aufgaben erfüllen, deren Lösungen später zu einem Gesamtergebnis zusammengefügt werden. Sie sind sozusagen Teile eines Schwarms zur Erledigung größerer Aufgaben.

Durch die vielfache Segmentierung der zu verarbeitenden Informationen gewährleistet ScaleHub die Sicherheit der zumeist sensiblen Daten. Rückschlüsse auf die Inhalte der Dokumente sind nicht mehr möglich.

Mit dieser Technologie erwirtschaftet das Unternehmen bereits gute Umsätze. Aktuell befasst sich ScaleHub unter anderem mit der Erforschung weiterführender Lösungen, zum Beispiel für die Fahrzeugindustrie beim Einsatz von Assistenzsystemen und beim (teil)autonomen Fahren.

Selbstfahrende Autos verfügen über eine Künstliche Intelligenz (KI). Die KI muss während des Fahrens über eine Vielzahl von Sensoren im Auto die Daten ihrer Umgebung in Echtzeit erkennen, bewerten und verarbeiten. Doch das muss die KI erst einmal lernen. Als „Unterrichtsmaterial“ benötigt sie dafür große Mengen an qualifizierten Trainingsdaten.

Die Bereitstellung dieser Daten erfolgt durch den Menschen über Objekterkennungen und Datenkennzeichnung. Mehr als 80 Prozent der Kosten einer Kl-Lösung stehen im Zusammenhang mit der Generierung solcher Trainingsdaten. Mit der wachsenden Zahl selbstfahrender Autos wird sich der Bedarf an Trainingsdaten und damit auch an Personalressourcen für deren Bereitstellung deutlich erhöhen.

ScaleHub will basierend auf der bereits bestehenden cloudbasierten Plattform die Trainingseinheiten in viele Kleinstjobs splitten und den Crowdworkern unterschiedlicher Crowdsourcing Communities zuleiten. So können im Ergebnis Trainingsdaten in der richtigen Menge, Qualität und Zeit erzeugt werden.

Fast 4 Millionen Euro kosten die Entwicklungen von ScaleHub. Das Unternehmen wird dabei über die ILB mit Fördermitteln des Landes und der Europäischen Union in Höhe von rund 3 Millionen Euro unterstützt.