GoogleのFloCは、ウェブ上のプライバシーにとって悪影響だったため廃止されました。しかし、MITの研究者2人が数ヶ月にわたり、技術的なアプローチと高価な非公開データセットを用いてテストするまで、その悪影響は正確には分かりませんでした。透明性を高めることがこれほど困難だったことは、ブラウザユーザーの大多数に影響を与えるウェブの根本的な変化として受け入れがたいものです。インターネットの未来がより分散化され、アクセスしやすく、プライバシーが確保されるためには、FLoC(および最近のトピックス)のような提案には、研究者や一般の人々が有意義なフィードバックを提供できるツールが付属している必要があります。
インターネットが調査ツールから利益主導のエコシステムへと進化するにつれ、それを動かす仕組みはますます中央集権化してきた。今日のインターネットは、90年代の分散化され断片化されたネットワークとはほとんど別物となっている。2000年代初頭に始まったインターネットの再編は、デジタル時代における最も革新的な発明の一つ、オンライン広告オークションによって一気に加速された。2002年にこの発明によってGoogleがようやく収益を上げるまで、Googleは検索エンジンは持っていたものの、注目を収益化する手段を持っていなかった。ショシャナ・ズボフは、今や聖書とも言える著書『監視資本主義の時代』の中で、これが資本とインターネットの転換点になったと主張している。それは「行動余剰」の発明、つまりウェブ上での私たち自身のありふれた行動から生み出される素材であり、数十億ドル規模のデジタル広告市場を活性化させる原動力となった。
この発明こそが、Googleを今日の巨大企業へと押し上げ、マーク・ザッカーバーグを莫大な富へと押し上げ、今や高度に中央集権化され監視社会となったウェブの基盤を形作ったのです。FacebookとGoogleは、2020年のデジタル広告市場の54%以上を合わせて占めました。新たなプライバシー規制は広告インフラの基盤を徐々に崩しつつありますが、まさにこれらの勢力や企業が、インターネットの仕組みを変える新たな提案を通して、ほとんど監視されることなく、広告インフラを再構築しているのです。ウェブのより良い未来を確実にするためには、基盤インフラを変えるプロジェクトには、研究者や一般の人々が有意義なフィードバックを提供できるツールが組み込まれる必要があります。
集中化され、監視され、非常に侵入的な現代社会を支えてきた中核技術の一つが「サードパーティ」Cookieです。サードパーティCookieは、現在アクセスしているウェブサイト以外のドメインでもユーザーの行動の痕跡を残すことを可能にします。これにより、広告会社はユーザーの閲覧履歴に関する詳細なプロファイルを作成したり、ショッピングサイトで閲覧した商品の詳細を収集したりすることが可能になります。この技術をめぐる長年にわたる(非常に収益性の高い)開発とネットワーク構築により、平均的なユーザーの閲覧履歴の少なくとも91%、そして広告ブロッカーを使用するユーザーの行動の最大90%を監視できる、巨大で不透明な業界が誕生しました。
そのため、2020年にGoogleがユーザーのプライバシーをめぐる圧力とキャンペーンの高まりを受けてChromeブラウザでサードパーティCookieを無効にすると発表したとき、同社は収益性の高いウェブ広告主ネットワークを維持しながら別の解決策を見つける必要がありました。Googleの開発者は、サードパーティCookieがもたらす個人追跡のリスクを軽減しながら、興味関心に基づいた広告を可能にする方法として、コホートの連合学習(FLoC)という手法を提案しました。これを実現するために、ブラウザはFLoCアルゴリズムを使用して、ユーザーの閲覧履歴に基づいて「興味関心コホート」を計算します。各コホートには、最近の閲覧履歴が似ている数千人のユーザーが含まれており、このコホートIDが広告主に提供されます。FLoCの背後にある考え方は、閲覧履歴の具体的な詳細ではなく、このコホートIDを使用してユーザーに広告を集中的に表示できるというものです。Googleが2021年にFLoCを試行した結果、広告主の収益はほぼ横ばいであることが示され、Googleと広告ネットワークにとって大きな勝利となりました。
しかし、ユーザーにとってのコストはどれほどだったのでしょうか?FLoCのプライバシーは実際にはどれほど確保されていたのでしょうか?Mozillaと電子フロンティア財団のプライバシー研究者たちは、FloCに関して、ほとんど答えのない重要な疑問をすぐに提起しました。広告主や攻撃者がコホートIDを使って、あなたの人種や性別について何かを知ることができたらどうなるでしょうか?その可能性はどれほどでしょうか?コホートIDは、実際に広告主にあなたを特定するために使用できる追加情報を与えてしまうのでしょうか?Googleによる追加調査がなければ、これらの疑問に答えることは実証研究というより、理論的な演習に過ぎませんでした。Googleのチームは、パイロットから得られた実証データを用いてFLoCのリスクの一部を調査しましたが、その分析は限定的でした。
昨年秋、同僚のアレックス・バークと私は、プライバシーコミュニティが抱えるFLoCに関する疑問のいくつかを独自に検証することにしました。分析の結果、4週間以内に、コホートIDのみでユーザーの95%以上を特定できることが判明しました。これは、FLoCが導入からわずか数週間で、広告業界がウェブ上でユーザーを追跡できるようになり、FLoCの本来の目的がほぼ完全に損なわれてしまうことを意味します。また、驚くべきことに、コホートIDと人種の間に相関関係が見られないことも判明しました。これは、FLoCが略奪的広告や差別的広告に利用されることを懸念する人々にとって朗報です。

しかし、私たちの分析には重大な問題がありました。ハーバード大学の研究室から入手した閲覧履歴のデータセットは、高価であるにもかかわらず、非常に限定的でした。私たちのデータセットは全米9万台以上のデバイスから閲覧データを収集していましたが、Googleのオリジントライアルには少なくとも6000万人のユーザーが含まれていました。同じ分析をGoogleのデータで実行すれば、根本的に異なる結果が得られる可能性があります。しかし、それは不可能です。GitHubで調査結果を詳細に報告し、私たちのような独立した研究者が新しい提案をテストできるようにGoogleにコードやデータセットの公開を要請したところ、Googleが推奨できる公開閲覧履歴データセットは存在しないと言われました。
Googleやその他のオンライン広告マーケットプレイスのデータセットにアクセスできれば、他にも目が回るような疑問が数多く浮かび上がってくる。ティム・ファンは2020年に出版した著書『サブプライム・アテンション・クライシス』の中で、オンライン広告は広告の効果と測定可能性に関する虚偽の主張に支えられた、今にもはじけるバブルであると力強く主張している。ファンは、パーソナライズされたオンライン広告から従来の広告チャネルへと転換した企業が、支出を削減しながらメッセージングのリーチを拡大した事例を数多く挙げている。こうした実験をより適切に公開分析すれば、オンライン広告の将来の「修正」におけるプライバシー保護の主張を検証するだけでなく、オンライン広告の価値そのものについて、切実に求められている透明性を提供できる可能性がある。
問題はデータだけではありません。GoogleがChromeユーザーの閲覧履歴をそのまま提供できないことは理解していますが、FLoCやTopicsのような提案は、すべての人にとってウェブの仕組みを根本的に変える可能性があります。MITの大学院生であるアレックスと私は、FLoCを再実装し、外部の閲覧履歴データセットを処理(そしてアクセス)し、分析を実行するのに数ヶ月を要しました。私たちは、Google以外でFLoCを検証した実証研究を発表した唯一のチームです。なぜなら、FLoCは難しいからです。そうあるべきではありません。
ウェブの中央集権化がもたらすもう一つの下流効果は、その未来を左右するツール、データ、インフラ、そして研究のゲートキーピングです。このゲートキーピングは中央集権化の特徴であり、バグではありません。しかし、必ずしもそうである必要はありません。Googleのような大企業は、私たちのような研究者が新しい技術について次々と質問できるオープンツールキットを公開することができます。彼らは研究プログラムを立ち上げ、FLoCのような新しい提案について独自の疑問を持ちたい研究者に、自社の試験から得られた限定的なデータへのアクセスを提供することもできます。さらに良いのは、ウェブ広告の未来像について、より幅広い人々の参加を促す、オープンで創造的なツールを開発することです。
しかし、なぜそうするのでしょうか?彼らには何のインセンティブもありません。欧州のGDPRやカリフォルニア州のCCPAのような規制は、Googleのような企業にサードパーティCookieの置き換えと(ある程度の)ユーザーデータの保護を促すだけです。意思決定、テスト、そして知識創造のプロセスをよりオープンにすることは、規制当局の関心事ではありません。しかし、一般市民はオンライン広告市場に、プライバシーにとどまらない深い関心を抱いています。最初のオンライン広告市場の創設と同様に、将来のオンライン広告市場の運営方法は、ウェブのコアインフラに大きな影響を与えるでしょう。
Alex Berkeによる追加寄稿。