生成式 AI がオープンデータを積極的に取り込む時代において、ウィキペディアは「無償で奪われる」関係を正式に商業契約に書き換えることを選択した。マイクロソフト、Google、Amazon から新興の AI 企業まで、現在はコンテンツのライセンス付与と有料サービスを通じてウィキにアクセスしなければならない。
(前提:Grokはウィキペディアの代替を目指すのか?マスク氏がxAIが開発中の「Grokipedia」について明かす:Wikipediaより大きな改良点あり)
(補足:V神が初めてLLMを評価:Grokは本質的にXプラットフォームの「救済」になり、「真実の伝播」に寄与するが、多くの幻覚も存在)
この記事の目次
ウィキメディア財団はウィキペディア創立25周年を祝し、一連のイベントと技術アップデートを実施するとともに、明確に外部にメッセージを発信している。世界最大のオンライン百科事典は、「無料で利用される知識庫」以上の存在となり、多くのAI大手とコンテンツのライセンス契約を結び、正式に商談のテーブルに着くための重要なインフラとなっている。
ウィキペディアは現在、6500万以上の記事を持ち、300以上の言語をカバーし、月間閲覧数は約150億回に達している。これは世界のトップ10流量サイトの中で唯一、非営利組織が運営するプラットフォームであり、また大型言語モデルにとって最も重要な高品質オープンデータセットの一つでもある。
近年、生成型AIの台頭により、テクノロジー企業のウィキペディアコンテンツへの依存は急速に拡大している。この需要に応え、財務の持続性を保つために、ウィキメディアは商用製品Wikimedia Enterpriseを開発し、大規模なコンテンツ再利用と配信サービスを提供している。
財団の最新声明によると、Ecosia、Microsoft、Mistral AI、Perplexity、Pleias、ProRataなどの企業が新たなパートナーとなり、既存のAmazon、Google、Metaなどのテック巨頭とともに加わった。
これは、従来の企業が直接ウィキの内容を取得し、検索結果やAI訓練に利用していた方法から、今や「ライセンス契約」によるアクセスへと変化していることを意味する。Wikimedia Enterpriseは、企業の遅延や安定性、データフォーマットのニーズに応じてAPIやデータストリームを提供し、企業は有料でウィキメディア財団に報酬を支払い、非営利運営とインフラ投資を支える。
ウィキメディアは発表の中で、ウィキペディアが「最高品質」のオープンデータセットの一つとして、多くの評価を受けていることを強調している。その理由は、約25万人のアクティブなボランティア編集者によって内容が維持されており、中立性、検証可能性、信頼できる出典といった厳格な基準に従っていること、そして長期にわたる版次履歴とコミュニティの審査を経ていることにある。これらは、モデル開発者が自力で再構築しにくい構造的資産だ。
AI企業にとって、ウィキの内容を取得することは、単なるライセンスの合法性や倫理的圧力だけでなく、モデルの出力品質や事実把握能力にも関わる。一方、ウィキメディアにとっては、従来の受動的な流量を、予測可能な収入源に変換し、サーバー運営や多言語コミュニティ、技術開発への長期投資を維持する手段となる。
興味深いのは、多くのAI大手とコンテンツライセンス契約を結びながらも、ウィキメディアは自社のAI戦略において、「人間優先」を繰り返し強調している点だ。AIの役割は、ボランティア編集者を補助することであり、置き換えることではない。
財団は、AIを用いて破壊的な編集の検出、問題のある記事のマーク付け、翻訳やコンテンツ発掘を支援し、編集者が出典の解釈、執筆、コミュニティのガバナンスに時間を集中できるようにする計画だ。
CEOのMaryana Iskanderは、ウィキペディアの核心的価値は「人間駆動」の知識生産にあると述べている。AI時代にあっても、プラットフォームは引き続き、世界中のボランティアコミュニティによるガバナンスの枠組みを維持し、AIツールは参加のハードルを下げる補助に過ぎず、コンテンツの意思決定を引き継ぐ主体ではない。