Die letzte Meile: Wie Pokémon Go die Grundlage für eine neue Generation autonomer Roboter legte – TechnoDidact

Einleitung

Es ist eine jener Ironien der Technikgeschichte, die sich erst im Rückblick in ihrer ganzen Tragweite erschließen: Ein Spiel, das Millionen von Menschen dazu brachte, mit gesenktem Blick durch die Straßen zu ziehen und nach virtuellen Monstern zu suchen, hat über Jahre hinweg die wohl detaillierteste 3D-Karte der Welt aus der Fußgängerperspektive erschaffen. Was als Augmented-Reality-Spiel begann, entpuppt sich heute als strategisches Fundament für die nächste Generation autonomer Systeme.

Im Mai 2025 vollzog Niantic, das Unternehmen hinter Pokémon Go, einen tiefgreifenden strategischen Wandel: Die Spielesparte wurde an den Scopely-Konzern verkauft, während das verbleibende Unternehmen als Niantic Spatial Inc. neu gegründet wurde – mit einer klaren Mission: dem Aufbau eines „Large Geospatial Model“ (LGM), einer räumlichen Intelligenz für Maschinen . Die 30 Milliarden Bilder, die Spieler im Laufe der Jahre von PokéStops und Wegen gescannt hatten, wurden damit vom Spielcontent zur strategischen Ressource .

Dieser Artikel zeichnet nach, wie aus einem vermeintlichen Spiel-Feature eine hochpräzise 3D-Weltkarte entstand, welche technologischen Verfahren dabei zum Einsatz kamen und warum diese Entwicklung die Debatte über Datenhoheit, Privatsphäre und die Zukunft der Arbeit neu entfacht.

Die Geburt der 3D-Karte: Spieler als „Kartografen“

Die Geschichte beginnt nicht erst mit der Ausgründung, sondern bereits im Jahr 2020. Damals führte Niantic die sogenannte „AR-Scanning“-Funktion in Pokémon Go ein. Spieler wurden dazu aufgerufen, PokéStops – also öffentliche Kunstwerke, Denkmäler oder besondere Orte – im Video zu umrunden. Die Belohnung: im Spiel seltene Items wie „Poffins“. Es war eine klassische Crowdsourcing-Maßnahme: Die Spieler lieferten Daten, Niantic erhielt eine wertvolle Ressource.

Doch was damals wie ein nettes Feature wirkte, folgte einem präzisen technischen Plan. Die gescannten Videos waren nicht einfach nur Fotos. Sie enthielten umfangreiche Metadaten: die genaue GPS-Position des Handys, die Ausrichtung des Geräts im Raum, die Blickwinkel, Zeitstempel und sogar Informationen über die Beleuchtungssituation. Aus diesen 15 bis 30 Sekunden langen Videoclips extrahierte das System später etwa 300 Einzelbilder pro Scan .

Technische Grundlagen: Vom Video zur 3D-Mesh

Die Umwandlung dieser Millionen von 2D-Videos in eine konsistente 3D-Welt ist ein hochkomplexes computer Vision-Verfahren. Niantic beschreibt diesen Prozess in fünf Stufen :

Segmentierung: Lange Scans werden in kleinere, handhabbare Einheiten aufgeteilt. Dies ist notwendig, da bei ausgedehnten Orten häufig Positionsdrift auftritt – ein Phänomen, bei dem das Handy durch kumulierte Messfehler seine Position im Raum „verliert“.
Lokalisierung: Die groben GPS-Daten werden durch ein Verfahren verfeinert, das die Bildinformationen mit bereits existierenden Karten abgleicht. Das Ziel ist eine Zentimeter-genaue Bestimmung von Position und Ausrichtung.
Verbindung: Die einzelnen gescannten Einheiten werden zueinander in Beziehung gesetzt. Hier entsteht die Kohärenz: Die KI erkennt, dass Scan A an Scan B angrenzt und bildet eine zusammenhängende Sequenz.
3D-Rekonstruktion: Der entscheidende Schritt. Für jedes Bild wird eine Tiefenkarte berechnet („Many-Depth“), die für jedes Pixel die Entfernung zur Kamera angibt. Aus diesen Tiefeninformationen entsteht ein 3D-Mesh – ein Netz aus Millionen von Dreiecken, die die Oberfläche des Ortes abbilden, versehen mit einer hochaufgelösten Textur.
Semantik: Die KI klassifiziert schließlich, was sie „sieht“. Pixel werden als „Baum“, „Boden“, „Gebäude“ oder „Himmel“ kategorisiert. Diese semantische Ebene ist entscheidend für Maschinen, die später verstehen müssen, ob sie auf einem Gehweg oder einer Fahrbahn navigieren.

Das Ergebnis sind zwei verschiedene Kartentypen: eine maschinenlesbare Karte (Map) für die reine Positionsbestimmung und eine für Menschen und Entwickler sichtbare 3D-Mesh, die die Umgebung visualisiert . Bis zum Sommer 2025 waren auf diese Weise über 100.000 VPS-aktivierte Orte weltweit entstanden .

Der Wendepunkt: Vom Spiel zur räumlichen Intelligenz

Die Weichenstellung für den heutigen Erfolg erfolgte mit der Gründung von Niantic Spatial im Mai 2025. Die Firma startete mit 250 Millionen US-Dollar Finanzierung und einem klaren Fokus auf „Spatial Intelligence“ . Der bisherige CEO John Hanke, ein Veteran der Geodaten-Branche (er war Mitbegründer von Keyhole, das später zu Google Earth wurde), stellte die Firma neu auf.

Die Logik dahinter ist aus technologischer Sicht bestechend: Large Language Models (LLMs) wie ChatGPT haben gezeigt, dass maschinelles Lernen auf riesigen Textdatenbasen zu scheinbar intelligentem Verhalten führen kann. Niantics These lautet: Das Gleiche ist für den Raum möglich. Ein Large Geospatial Model (LGM) soll nicht nur wissen, dass an einer Stelle ein Baum ist, sondern auch, wie dieser Baum aussieht, wie er sich im Licht verändert und in welcher räumlichen Relation er zu seiner Umgebung steht .

Die Datenbasis dafür ist einmalig. Während Google Maps primär mit Autos Straßen befährt und Luftbilder nutzt, besteht Niantics Karte aus 30 Milliarden Bildern aus der Fußgängerperspektive . Das ist genau die Perspektive, die für Lieferroboter, die auf Gehwegen fahren, oder für AR-Brillen, die von Menschen getragen werden, relevant ist.

Der VPS-Mechanismus im Detail

Das Herzstück des Systems ist das Visual Positioning System (VPS). Im Gegensatz zu GPS, das in dichten Stadtvierteln oft einen Fehler von 50 Metern oder mehr aufweist, funktioniert VPS bildbasiert .

Wenn ein Roboter oder ein Smartphone seinen Standort bestimmen möchte, macht es ein Foto der Umgebung. Dieses Foto wird an Niantics Cloud gesendet. Das System gleicht die visuellen Merkmale des Fotos mit der bestehenden 3D-Datenbank ab. Innerhalb von Sekunden wird nicht nur die Position auf wenige Zentimeter genau bestimmt, sondern auch die genaue Blickrichtung. Wie Niantic in seiner technischen Dokumentation erklärt, werden dafür die gespeicherten „Maps“ als eine Art Funktion genutzt: Bild rein, Position und Ausrichtung raus .

Ein entscheidender technischer Punkt: VPS kommt ohne spezielle Tiefensensoren (LiDAR) aus. Es funktioniert mit den handelsüblichen Kameras jedes Smartphones oder Roboters . Dies senkt die Einstiegshürde für Hardware-Hersteller massiv.

Die Anwendung: Wenn der Lieferroboter Pokémon Go spielt

Die bislang sichtbarste und kommerziell relevanteste Anwendung dieser Technologie ist die Partnerschaft mit Coco Robotics, die im März 2026 öffentlich wurde . Coco Robotics betreibt eine Flotte von etwa 1.000 Lieferrobotern in Städten wie Los Angeles, Chicago und Helsinki. Diese Roboter, etwa so groß wie ein Koffer, liefern Pizza und Lebensmittel aus.

Das Problem, das Niantic Spatial hier löst, ist das des „letzten Meters“. Während die Fahrt zum Straßenblock dank GPS meist problemlos funktioniert, scheitern autonome Systeme oft daran, den genauen Eingang eines Restaurants oder die richtige Tür eines Wohnhauses zu finden. Brian McClendon, CTO von Niantic Spatial, brachte es im MIT Technology Review auf den Punkt: „Der blaue Punkt auf Ihrem Telefon driftet oft um 50 Meter, sodass Sie sich in einer anderen Straße, in einer anderen Richtung und auf der falschen Straßenseite wiederfinden“ .

Durch die Integration von Niantics VPS können die Coco-Roboter nun ihre Position mit Zentimetergenauigkeit bestimmen. Sie wissen, ob sie vor dem Restaurant anhalten müssen oder ob sie noch fünf Meter weiter zur Seiteneingangstür fahren sollen. Zach Rush, CEO von Coco Robotics, betonte, dass die Zusammenarbeit „stabilen Zugang zu Positionierungsdiensten“ ermögliche, die die Navigationsgenauigkeit „weiter verbessern“ .

Kontinuität und Wandel

Interessant ist, dass dieses kommerzielle Geschäft parallel zum Spielbetrieb läuft. Spieler können weiterhin PokéStops scannen und erhalten dafür Belohnungen. In der Niantic Wayfarer-Community wird jedoch intensiv diskutiert, ob die gesammelten Scans noch für die Spiel-AR genutzt werden oder ob sie primär in die industrielle Datenpipeline fließen . Die Frage, ob Spieler in Zukunft weiterhin Poffins für das Trainieren von Lieferrobotern erhalten, markiert eine neue Qualität der Plattformarbeit.

Kritische Einordnung: Datenkrake oder technologischer Fortschritt?

So innovativ die Technologie ist, so tiefgreifend sind die ethischen und gesellschaftlichen Implikationen. Die Entwicklung von Niantic Spatial lässt sich als Fallstudie für die Ökonomie der Aufmerksamkeit im Zeitalter der KI lesen.

1. Transparenz und informierte Einwilligung

Die überwältigende Mehrheit der Pokémon Go-Spieler hat beim Scannen von PokéStops wahrscheinlich nicht damit gerechnet, eine 3D-Karte für Lieferroboter zu bauen. Zwar weist Niantic in seinen Entwicklerblogs darauf hin, dass die Daten für den „3D-AR-Map der Zukunft“ genutzt werden , doch im Spiel selbst steht der unmittelbare Nutzen – das Freischalten von Belohnungen – im Vordergrund. Die Frage ist, ob eine solche Zweckentfremdung von Nutzerdaten (von der Spielmechanik hin zur industriellen Robotik) im Sinne der informierten Einwilligung der Nutzer liegt.

2. Die Macht der Datenmonopole

Niantic verfügt über eine Datenbasis, die kein anderer Konzern in dieser Form aus der Fußgängerperspektive besitzt. Mit der Ausgründung Niantic Spatial und der Finanzierung von 250 Millionen Dollar wird dieses Monopol kommerzialisiert. Während die Technologie kleineren Robotik-Startups hilft, könnte sie langfristig auch zu einer Abhängigkeit führen: Wer autonome Systeme in städtischen Räumen betreiben will, muss möglicherweise bei Niantic „mieten“.

3. Arbeitsmarkt und urbane Räume

Die Partnerschaft mit Coco Robotics ist ein weiterer Schritt in Richtung Automatisierung der „letzten Meile“. Für die Logistikbranche bedeutet dies Effizienzgewinne. Für die Menschen, die derzeit noch als Essenslieferanten auf Fahrrädern oder in Autos unterwegs sind, könnte dies langfristig eine Bedrohung darstellen. Es entsteht eine neue Form der Konkurrenz: menschliche Gig-Economy-Arbeiter gegen datengespeiste Roboter.

4. Überwachungs- und Sicherheitsrisiken

Zentimetergenaue 3D-Karten sind nicht nur für Roboter nützlich. Experten warnen vor den Implikationen für die Überwachung. Eine Datenbank, die jeden Baum, jede Tür und jeden Hydranten in einer Stadt vermisst, könnte in Verbindung mit Gesichtserkennung oder Drohnen zu einem mächtigen Werkzeug staatlicher oder privater Überwachung werden. Niantic betont zwar, dass die Scans automatisch anonymisiert werden , doch die Existenz der Daten an sich birgt Risiken.

Ausblick: Die Brücke zwischen physischer und digitaler Welt

Niantic Spatial hat sich ehrgeizige Ziele gesetzt. Kurzfristig geht es um Enterprise-Kunden in Logistik, Immobilien und Fertigung . Langfristig strebt das Unternehmen jedoch etwas viel Größeres an: die Schaffung eines Betriebssystems für die reale Welt.

Die Vision ist, dass alle Maschinen – von humanoiden Robotern über autonome Fahrzeuge bis hin zu AR-Brillen – auf dieses Large Geospatial Model zugreifen, um sich zu orientieren. In dieser Zukunft wäre die 3D-Karte nicht statisch, sondern „lebendig“: Sie würde sich in Echtzeit aktualisieren, sobald Spieler oder Roboter vorbeikommen.

Für die Spieler von Pokémon Go bedeutet dies eine seltsame Art der Unsterblichkeit. Die Routen, die sie einst gingen, um ein seltenes Pokémon zu fangen, sind nun in den Algorithmen von Lieferrobotern kodiert. Sie haben, ohne es zu wissen, an der größten dezentralen Kartierungsaktion der Menschheitsgeschichte teilgenommen. Ob dies als Triumph des Crowdsourcings oder als Warnung vor der allumfassenden Datenökonomie gewertet wird, bleibt eine Frage der Perspektive. Fest steht: Die Grenzen zwischen Spiel, Arbeit und Datenausbeutung sind endgültig verschwimmt.

Quellen

Niantic Wayfarer Community: „What happened — and what will happen — to AR scans? – Wayfarer AMA – 2025“, 2025-10-11.
GIGAZINE: „A delivery robot that learns from spatial information obtained from games like ‚Pokémon GO‘ has been born“, 2026-03-11.
Niantic Spatial, Inc.: „Day One for Niantic Spatial“, 2025-05-28.
Niantic Labs: „Lightship VPS: Building Our 3D Map From Crowdsourced Scans“, o.D.
Numerama: „Les images de Pokémon Go servent désormais à guider des robots-livreurs de pizza“, 2026-03-12.
AWE USA: „AWE Talks: Building a Large Geospatial Model“, 2025-07-31.
Niantic Spatial: „VPSに関するよくある質問（FAQ）“, o.D.
pokecon.jp: „「ポケモンGO」などで得た空間情報で学習した配送ロボットが誕生 – GIGAZINE“, 2026-03-11.
BigData-Insider: „Wie Pokémon-Go-Spieler die letzte Meile der Robotik ebnen“, 2026-03-19.
Niantic Spatial: „VPS Frequently Asked Questions (FAQ)“, o.D.

neustes