ポケモンGOプレイヤーが知らずに作った「300億枚の地図」が、ロボットの目になった


2016年、世界中の人々がスマホを片手に街を歩き回り、ポケモンを捕まえていました。あれから10年。あの時プレイヤーが知らず知らずのうちに撮影していた300億枚の画像が、いまAIとロボットの「目」として使われ始めています。

Niantic(ナイアンティック)のスピンオフ企業「Niantic Spatial」が、ポケモンGOのプレイヤーから集めた膨大な画像データを使い、ロボットが現実世界をセンチメートル単位の精度で認識できるAIモデルを構築しました。MIT Technology Reviewが独占レポートとして報じています。


ポケモンGOが「データ収集マシン」だった

ポケモンGOは、AR(拡張現実=スマホのカメラを通して現実世界にデジタルコンテンツを重ねて表示する技術)を使ったゲームです。プレイ中、スマホのカメラは常にオンになっていました。

2020年秋からは「フィールドリサーチ」というタスクが追加され、プレイヤーはポケストップやジムといったゲーム内のランドマーク(目印となる場所)を歩き回りながら、周囲をスキャンすることが求められました。スキャンを完了するとゲーム内報酬がもらえる仕組みです。

ここが重要なポイントです。各ランドマークは、何千人ものプレイヤーによって、異なる角度から、異なる時間帯に、異なる天候のもとでスキャンされていました。朝の晴天、夜の雨、冬の雪、週末の人混み——同じ場所の画像が、自然な多様性を持って何千枚も蓄積されていったのです。

NVIDIAのCEOジェンスン・ファン氏も「ポケモンGOは世界最大の写真測量アプリだった」とコメントしています。カメラカーを走らせるどんな地図会社も、このような多様性を同じスピードとコストで再現することはできなかったでしょう。

結果として蓄積された画像は300億枚。世界中の100万箇所以上のランドマークをカバーする、人類史上最大規模の地上レベルの視覚データセットが出来上がりました。


Niantic Spatialとは

2025年3月、NianticはゲームスタジオのScopely(サウジアラビアの投資ファンドが所有)にモバイルゲーム事業を35億ドル(約5250億円)で売却しました。同時に、AR・AI・地理空間技術の部門を「Niantic Spatial」として独立させています。

Niantic Spatialは2億5000万ドルの資金でスタートし、CEOにはNianticの創業者ジョン・ハンケ氏、CTOにはGoogle Earthの共同創設者ブライアン・マクレンドン氏が就任しました。つまり、Google マップとGoogle Earthを作ったチームが、次は「ロボットのための地図」を作ろうとしているわけです。


VPS — GPSを超える「視覚測位システム」

Niantic Spatialの中核技術が「VPS(Visual Positioning System=視覚測位システム)」です。

GPSは衛星からの電波で位置を特定しますが、ビルが林立する都市部では電波が建物に反射して精度が大きく低下します。数メートルのズレは、配達ロボットにとっては「歩道」と「車道の真ん中」の違いになりかねません。

VPSは衛星を一切使いません。ロボットに搭載されたカメラが周囲の建物や看板、歩道などを撮影し、Niantic Spatialの300億枚の画像データベースとリアルタイムに照合することで、現在位置をセンチメートル単位で特定します。

マクレンドンCTOは「私たちは、あなたが数センチの精度でどこに立っているか、そして何より重要なことに、どこを見ているかを把握できます」と語っています。


配達ロボットが最初の「お客様」

VPSの最初の大規模な商用導入先が、Coco Robotics(ココ・ロボティクス)です。

Coco Roboticsは、歩道を走る小型配達ロボットを運用するスタートアップで、ロサンゼルス、シカゴ、マイアミ、ジャージーシティ、ヘルシンキで食品やグロサリーの配達サービスを展開しています。約1000台のロボットが、これまでに数百万マイルの配達を完了しています。

これらのロボットは、レストランの正確なピックアップ位置で停止し、歩道を正確に走行し、正しい玄関先に到着する必要があります。GPSの5メートル誤差では「隣の家に配達してしまった」ということが起きますが、VPSのセンチメートル精度なら、そのリスクはほぼゼロになります。

さらに興味深いのは、ロボットのカメラが撮影した画像がNiantic Spatialのデータベースにフィードバックされる「継続的改善ループ」が組み込まれている点です。ロボットが走れば走るほど、地図はより正確になっていきます。


LGM — 「空間を理解するAI」への進化

Niantic Spatialが目指しているのは、単なる高精度な地図ではありません。

同社は「LGM(Large Geospatial Model=大規模地理空間モデル)」の構築を進めています。ChatGPTのようなLLM(大規模言語モデル=大量のテキストから学習し、人間のように文章を理解・生成するAI)が「言語」を理解するように、LGMは「物理的な空間」を理解するAIです。

LGMは、ポケモンGOの画像だけでなく、3Dスキャン、LiDAR(ライダー=レーザー光で距離を測定する技術)データ、ドローン映像、VPSのアンカーポイント(基準点)など、多様なデータソースから学習しています。

将来的にはAIが空間の中にある物体を認識し、その意味や関係性を理解する「セマンティック理解(意味の理解)」機能も追加される予定です。たとえば、「この場所にはベンチがあって、その隣にゴミ箱がある」といった空間の意味的な把握が可能になります。

マクレンドンCTOは「地図作りを十分に突き詰めていけば、最終的にはすべてを捉えることになる。私たちはまだそこには到達していませんが、現実世界を再現することに全力を注いでいます」と述べています。


プライバシーの問題 — プレイヤーは知っていたのか

この話には、避けて通れない倫理的な問題があります。

ポケモンGOのプレイヤーの多くは、自分がAIの訓練データを提供していることを認識していなかったと考えられます。Nianticの利用規約(サービスを使う際に同意するルール)第5.2条では、ユーザーが提出したARコンテンツに対して、Nianticが自由に使用し、その権利を他の企業に譲渡できると規定されています。

Niantic Spatial側は「データ収集は常にオプトイン(自発的な参加)であり、バックグラウンド(アプリを使っていない時の自動的な)収集は行っていない。すべてのデータはGDPR(EUの一般データ保護規則=個人データの保護に関する欧州の厳格な法律)レベルの保護で匿名化されている」と説明しています。

しかし、Privacy Guidesは「利用規約に同意することと、何に同意しているかを理解することは別の話だ」と指摘しています。ゲームの利用規約を最後まで読む人はほとんどおらず、収集されたデータがロボット訓練に使われるとは想像もしなかったでしょう。

今後、画像からのメタデータ(撮影場所や時刻などの付随情報)削除だけでは位置を隠すことが難しくなる可能性も指摘されており、プライバシーの観点から注視すべきケースです。


中小企業にとっての示唆

Niantic Spatialの事例は、規模の大小を問わず、すべてのビジネスに重要な教訓を含んでいます。

まず、「ゲームのデータがロボットの目になった」という事実は、業種を超えたデータ活用の可能性を示しています。ある目的で集めたデータが、まったく別の価値を生む——これはAI時代のビジネスの本質です。中小企業が日々の業務で蓄積しているデータにも、まだ気づいていない価値が眠っている可能性があります。

次に、「GPSでは足りない」という課題は、物流・配達・小売など多くの業種に共通しています。都市部での正確な位置特定は、配達ロボットだけでなく、ARを使った店舗案内や観光ガイドなど、さまざまなサービスの基盤になり得ます。

5億人がポケモンを捕まえながら作った「見えない地図」が、いまロボットの目として世界を変えようとしています。AIの未来は、意外なところから始まるものです。


参照元

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です