DOGEの脅威:政府のデータがAI企業に並外れた力を与える

DOGEの脅威:政府のデータがAI企業に並外れた力を与える

政府効率化局(DOGE)は、内国歳入庁(IRS)と社会保障局(SSA)を含む少なくとも7つの機密性の高い連邦データベースへの前例のないアクセスを確保しました。このアクセスは、サイバーセキュリティの脆弱性とプライバシー侵害への懸念を引き起こしました。もう一つの懸念は、あまり注目されていません。それは、これらのデータが民間企業の人工知能システムの訓練に利用される可能性です。

ホワイトハウス報道官は、イーロン・マスク氏がDOGEを掌握しているにもかかわらず、DOGEが収集した政府データはマスク氏のAIモデルの学習に使用されていないと述べた。しかしながら、DOGEの職員がマスク氏の少なくとも1つの企業で同時に役職を務めているという証拠が浮上している。

連邦航空局(FAA)では、SpaceXの従業員が政府機関のメールアドレスを保有しています。この二重雇用により、連邦政府のデータがマスク氏が所有する企業(xAIを含む)に流出する経路が生まれています。同社の最新のGrok AIチャットボットモデルは、こうしたデータの使用について明確な否定を示そうとしません。

政治学者であり、政府データの公開ソースに精通するテクノロジストとして、政府データが民間企業に提供される可能性は、多くの報道が指摘するよりもはるかに大きなプライバシーと権力への影響をもたらすと考えています。人工知能技術を開発できる民間企業は、政府データを利用して競合他社を凌駕し、社会に甚大な影響力を及ぼす可能性があります。

AIにとっての政府データの価値

AI開発者にとって、政府のデータベースは聖杯発見に匹敵するものです。OpenAI、Google、xAIといった企業は現在、公共インターネットから収集した情報に依存していますが、非公開の政府リポジトリははるかに価値のあるもの、つまり人口全体にわたる実際の人間の行動の検証済み記録を提供しています。

これは単なるデータの増加ではなく、根本的に異なるデータです。ソーシャルメディアの投稿やウェブ閲覧履歴は、意図された行動や意図された行動を示しますが、政府のデータベースは実際の意思決定とその結果を捉えています。例えば、メディケアの記録は医療の選択と結果を明らかにします。IRS(内国歳入庁)と財務省のデータは、金融上の意思決定とその長期的な影響を明らかにします。そして、連邦政府の雇用統計と教育統計は、教育の道筋やキャリアの軌跡を明らかにします。

このデータがAIの学習にとって特に価値があるのは、その縦断性と信頼性です。オンラインで入手できる無秩序な情報とは異なり、政府の記録は標準化されたプロトコルに従い、定期的な監査を受け、正確性に関する法的要件を満たさなければなりません。社会保障給付、メディケア請求、連邦政府助成金など、あらゆるものが現実世界の行動に関する検証済みのデータポイントを生み出します。米国において、これほど広範かつ信頼性のあるデータは他に存在しません。

最も重要なのは、政府のデータベースはデジタルアクティブユーザーだけでなく、人口全体を時系列で追跡している点です。ソーシャルメディアを全く利用しない人、オンラインショッピングをしない人、デジタルサービスを積極的に避けている人も含まれます。AI企業にとって、これは人々がオンラインで発信するデジタル的な情報だけでなく、人間の経験の多様性に基づいてシステムを学習させることを意味します。

技術的な優位性

現在のAIシステムは、インターネットからどれだけデータを集めても克服できない根本的な限界に直面しています。ChatGPTやGoogleのGeminiが間違いを犯すのは、多くの場合、人気があるかもしれないが必ずしも真実ではない情報で学習しているためです。政策の効果について人々が何を言っているかは分かりますが、その効果を人口や年を跨いで追跡することはできません。

政府のデータはこの方程式を変える可能性があります。AIシステムを、医療に関する意見だけでなく、何百万人もの患者の実際の治療結果に基づいて学習させることを想像してみてください。ソーシャルメディア上の経済政策に関する議論から学習することと、数十年にわたって様々なコミュニティや人口統計における実際の影響を分析することの違いを考えてみてください。

包括的な政府データで訓練された、大規模で最先端、あるいは最先端のモデルは、政策と結果の実際の関係性を理解できる可能性があります。異なる人口セグメントにおける意図しない結果を追跡し、複雑な社会システムを現実世界で検証しながらモデル化し、過去の証拠に基づいて提案された変更の影響を予測することが可能になります。次世代AIシステムの構築を目指す企業にとって、こうしたデータへのアクセスは、ほぼ克服できないほどの優位性を生み出すでしょう。

重要なシステムの制御

xAIのような企業は、政府のデータで訓練されたモデルを活用することで、より優れたチャットボットやコンテンツジェネレーターを構築するよりもはるかに多くのことを実現できる可能性があります。こうしたシステムは、人々が複雑な社会システムを理解し、管理する方法を根本的に変え、ひいては制御する可能性を秘めています。こうした機能の一部は、責任ある公的機関の管理下では有益となる可能性がありますが、単一の民間企業の手に渡れば脅威となると私は考えています。

メディケアとメディケイドのデータベースには、多様な集団における数十年にわたる治療、結果、費用の記録が保存されています。新たな政府データで訓練されたフロンティアモデルは、他の治療法が失敗する中で成功する治療法を特定し、医療業界を支配する可能性があります。このようなモデルは、地理的な場所、社会経済的地位、併存疾患などの要因を考慮しながら、異なる介入が様々な集団に時間の経過とともにどのように影響するかを理解できる可能性があります。

このモデルを活用する企業は、優れた予測能力と市場人口レベルの洞察を製薬会社や保険会社に示すことで、医療政策に影響を与える可能性があります。

財務省のデータは、おそらく最も価値のある宝物と言えるでしょう。政府の財務データベースには、経済における資金の流れに関する詳細な情報が収録されています。これには、連邦決済システム全体のリアルタイム取引データ、税金の納税と還付の完全な記録、給付金の詳細な配分パターン、そしてパフォーマンス指標に基づいた政府請負業者への支払いなどが含まれます。

このデータにアクセスできるAI企業は、経済予測と市場予測において並外れた能力を発揮できる可能性があります。規制変更の連鎖的影響をモデル化し、危機に発展する前に経済の脆弱性を予測し、従来の手法では不可能な精度で投資戦略を最適化することも可能になります。

イーロン・マスクのxAI社は資金が豊富。

インフラと都市システム

政府のデータベースには、重要なインフラの利用パターン、メンテナンス履歴、緊急対応時間、開発の影響に関する情報が含まれています。連邦政府からの助成金、インフラ検査、緊急対応のすべては、都市や地域の機能をより深く理解するためのAIの学習に役立つデータポイントを生み出します。

その力は、このデータの潜在的な相互接続性にあります。政府のインフラ記録を学習したAIシステムは、交通パターンがエネルギー使用にどう影響するか、住宅政策が緊急時の対応時間にどう影響するか、インフラ投資が地域全体の経済発展にどう影響するかを理解するでしょう。

独占的なアクセスを持つ民間企業は、アメリカ社会の物理的・経済的な動脈に関する独自の洞察を獲得するでしょう。これにより、企業は市当局が依存する「スマートシティ」システムを開発し、都市統治の一部を事実上民営化することが可能になります。民間の情報源から得られるリアルタイムデータと組み合わせることで、その予測能力は現在のシステムの能力をはるかに超えるものとなるでしょう。

絶対的なデータは絶対的に破壊される

xAIのような企業は、マスク氏のリソースとDOGEを通じた優先的なアクセスを活用すれば、競合他社よりもはるかに容易に技術的および政治的な障害を乗り越えることができるだろう。近年の機械学習の進歩は、アルゴリズムが処理するためのデータ準備の負担を軽減し、政府のデータはまさに金鉱であり、アメリカ国民の正当な所有物となっている。

民間企業が政府データにアクセスするという脅威は、個人のプライバシーへの懸念をはるかに超えるものです。個人識別情報を削除したとしても、数百万件もの政府記録のパターンを分析するAIシステムは、人口レベルでの予測や行動への影響といった驚くべき能力を発揮する可能性があります。脅威となるのは、政府データを活用して選挙結果を含む社会に影響を与えるAIシステムです。

情報は力であるがゆえに、明確な政治的思惑を持つ民間団体に前例のないデータが集中することは、共和国にとって深刻な課題となる。問題は、アメリカ国民が、このような集中によって可能となる、民主主義を揺るがす可能性のある腐敗に抵抗できるかどうかにあると私は考える。もしそうでないならば、アメリカ国民は人間的な市民ではなく、デジタル主体となる覚悟をすべきである。会話

アリソン・スタンガー、ミドルベリー大学特別寄付教授

この記事はクリエイティブ・コモンズ・ライセンスに基づきThe Conversationから転載されました。元の記事はこちらです。

Tagged: