Die KI-Industrie hat ein neues Problem: Während das Internet bereits nach allen Regeln der Kunst nach Text- und Bilddaten abgegrast wurde, steht die nächste Generation der Künstlichen Intelligenz – die sogenannte Physical AI – vor einem Flaschenhals. Roboter, die in der echten Welt arbeiten sollen, brauchen Trainingsdaten, die zeigen, wie Menschen alltägliche physische Aufgaben erledigen. Genau hier setzt das Silicon-Valley-Startup Human Archive an. Das Unternehmen nutzt die boomende Gig-Economy in Indien, um mit Kameras und Sensoren ausgerüstete Arbeiter bei der Arbeit zu filmen und diese Daten an KI-Labore zu verkaufen.
Egocentric Data: Die Welt aus der Ich-Perspektive
Die Gründer von Human Archive – Samay Mani, Rushil Agarwal, Shloke Patel und Raj Patel – kommen von der UC Berkeley und der Stanford University. Ihr Ansatz ist technisch fundiert: Anstatt Roboter nur mit Videos aus der dritten Person zu füttern, setzen sie auf egocentric data, also Aufnahmen aus der Egoperspektive der Arbeiter. Dazu tragen die Arbeiter spezielle Kappen mit integrierten Kameras.
Das Startup beschränkt sich jedoch nicht auf reines Videomaterial. Human Archive entwickelt eigene Hardware-Setups, darunter taktile Handschuhe, Körper-Motion-Capture-Anzüge und Handgelenkskameras. Diese erfassen nicht nur Bewegungsabläufe, sondern auch physischen Druck und Tastgefühl, synchronisiert mit RGB-D-Daten (Farbbilder kombiniert mit Tiefeninformationen). Raj Patel betont, dass reine Videodaten nicht ausreichen – die Kombination mit weiteren Sensordaten mache die Datensätze für KI-Labore deutlich wertvoller. Aktuell hat das Unternehmen über 1.000 Headsets und mehr als 50 verschiedene Spezialgeräte im Einsatz.
Das Geschäftsmodell: Rabatte gegen Daten
Um an die Daten zu kommen, kooperiert Human Archive mit kleineren Dienstleistern in Indien – etwa aus dem Bereich Haushaltsservices oder Gastronomie. Das Prinzip: Wenn ein Arbeiter beim Kunden ist, wird diesem in der App ein Rabatt angeboten, wenn er der Datenerfassung zustimmt. Andernfalls zahlt er den vollen Preis. Für die Arbeiter selbst zahlt Human Archive einen Basislohn von 1 US-Dollar pro Stunde für die Teilnahme an der Datenerfassung. Das ist selbst für den indischen Markt niedrig; Konkurrenten zahlen laut einem Bericht der Economic Times umgerechnet zwischen 2,63 und 4,20 Dollar pro Stunde. Das Startup rechtfertigt dies mit seiner lokalen Präsenz und der schnellen Verfügbarkeit von Arbeitskräften.
Widerstand und öffentliche Kontroversen
Dass das Geschäftsmodell nicht überall auf Gegenliebe stößt, zeigt ein Blick auf die gescheiterten Partnerschaften. Größere Player wie Urban Company und Pronto haben eine Zusammenarbeit abgelehnt. Die Absagen führten zu öffentlichen Streitereien: Urban Company CEO Abhiraj Singh Bahl erklärte auf X, dass sein Unternehmen solche Arrangements ablehne. Daraufhin konterte Mitgründer Raj Patel, Urban Company werde bald gezwungen sein, umzudenken, sonst verliere es durch Kundenabwanderung an Relevanz. Noch schärfer wurde es gegenüber Pronto: Co-Gründer Rushil Agarwal berichtete, Pronto-Gründerin Anjali Sardana habe ihn ausgelacht und "stupid" genannt, als er die Idee einer Datenpartnerschaft vorstellte.
Ethische und datenschutzrechtliche Grauzonen
Abseits der publizistischen Scharmützel stellen sich ernsthafte ethische Fragen. Die Erfassung von egocentric data in privaten Haushalten ist hochsensibel. Es ist unklar, inwieweit die Arbeiter wirklich verstehen, wofür ihre Aufnahmen genutzt werden. Human Archive verweist darauf, dass die kommerziellen Verträge dem indischen Datenschutzgesetz (DPDP Act) entsprechen, Datenschutzhinweise angezeigt werden und Gesichter in den Aufnahmen unkenntlich gemacht werden. Dennoch berichtete Moneycontrol kürzlich, dass das indische IT-Ministerium die Einwilligungsmechanismen und Datenerfassungspraktiken von Startups in diesem Bereich untersucht.
Zach DeWitt, Partner beim Investor Wing VC, lobt zwar die einzigartige Fähigkeit, multisensorische Daten im großen Maßstab zu synchronisieren, und sieht in der Arbeit einen Brückenbau in die KI-Ökonomie. Doch die Realität zeigt ein klassisches Muster der Datenextraktion: Arbeiter im globalen Süden liefern für minimale Vergütung die Rohstoffe, die in den USA für hochprofitable KI-Modelle verarbeitet werden. Die Tatsache, dass Kunden Rabatte bekommen, die Arbeiter aber kaum profitieren, während die KI-Labore im Silicon Valley Millionen für die fertigen Datensätze zahlen, wirft die Frage nach einem fairen Datennutzungsmodell auf.
Ausblick: Von Indien in die Welt
Trotz der Kontroversen hat Human Archive eine Seed-Finanzierung von 8,2 Millionen Dollar eingesammelt. Zu den Investoren gehören Wing Venture Capital, NVP Capital, Y Combinator sowie Business Angels von OpenAI, Nvidia, Google und Meta. Das Kapital soll genutzt werden, um die Datenerfassung auf Südostasien und die USA auszuweiten. Langfristig plant das Startup eine Plattform, auf der jeder an der Datenerfassung teilnehmen und Geld verdienen kann – und sogar, in den USA Dienste wie Putzen oder Kochen anzubieten, um im Gegenzug Daten der ausführenden Arbeiter zu erhalten.
Die Entwicklung von Human Archive ist ein Weckruf für die Branche. Die KI der Zukunft wird nicht nur aus Texten generiert, sondern aus der physischen Erfahrung von Menschen. Wer die wertvollsten und umfassendsten Datensätze dieser physischen Welt besitzt, dominiert das nächste Kapitel der KI-Revolution. Die Frage bleibt, zu welchem Preis – ethisch und sozial – diese Daten eingetrieben werden.
Quelle: TechCrunch