ミラ・ジョヴォヴィッチはAIで「満点プロジェクト」を作ったのか?開発者が実測:本当に中身があるのか、それとも誇大な宣伝・煽りなのか?

AI の記憶システム「MemPalace」を、ミラ・ジョヴォヴィッチが開発に参加しているとする同システムは、テストで満点を取って大バズりしたものの、コミュニティからテストが不正(チート)であり、データを誤導している疑いを追及された。実測の結果、効果は誇大で、かつ大量の誤りがあることが判明した。チームは欠陥を認め、現在修復に取り組んでいる。

ミラ・ジョヴォヴィッチがAI記憶の「メモリ宮殿」を構築、注目を集める

昨日(4/7)、AI界隈で大きなニュースがあった。『バイオハザード』や『第5元素』で知られるハリウッド女優のミラ・ジョヴォヴィッチ(Milla Jovovich)が、開発者の Ben Sigman とともに Claude Code を使って「MemPalace」というオープンソースのAI記憶システムを開発した、というものだ。

一気に、「ハリウッドの大スターがクロスオーバーして満点級のプロジェクトを作った」という話が広まり、MemPalace はこれまで GitHub 上で2万以上のスターを獲得している。だが、すぐに開発者コミュニティから疑問が噴出した。本当に中身があるのか、それとも誇大広告なのか?

まず、MemPalace が生まれた動機を説明しよう。公式ドキュメントによれば、現状のAIシステムでは、ユーザーとAIの対話内容、意思決定のプロセス、そしてアーキテクチャの議論が、作業セッションの終了後に消えてしまうことが多い。そのため、数か月の努力が ゼロまで落ちる(歸零)という制約があるという。

この問題を解決するため、MemPalace は空間構造を用いて記憶を保存し、情報を「人物」または「プロジェクト」を表すエリア、そして廊下・部屋・引き出しといった異なる階層の構造へ明確に分類する。さらに、対話の原文を後続の意味検索のために保持する。

開発チームは、MemPalace が長期記憶評価の基準「LongMemEval」で100%の完璧な成績を収め、かつ外部APIを一切呼び出さずに 96.6% の精度を達成していると主張している。また、クラウドサービスのサブスク不要で、完全にローカル端末で動作できるとされ、さらに「30倍のロスレス圧縮」を達成できると謳う AAAK 方言システムを搭載している。

出典:GitHub ミラ・ジョヴォヴィッチ ハリウッドの映画スターがAI記憶のメモリ宮殿を構築、注目を集める

同業者とコミュニティが一斉に疑問視、テスト手法と宣伝に瑕疵

しかし、MemPalace が LongMemEval で満点を取ったという成績は、すぐに同業者から疑いを持たれた。

同じくAIの記憶システムを制作する PenfieldLabs は、MemPalace が LoCoMo データセットで満点を獲得したと主張しているが、数学的にあり得ないと指摘した。なぜなら、このデータセットの標準解答自体に 99 個の誤りが含まれているからだ。

PenfieldLabs の分析では、MemPalace の100%成績は、検索回数を50回に設定したことに由来している。しかし、テストデータセットの対話における最高段階数はわずか32回しかない。つまりシステムは検索段階を直接すり抜け、すべてのデータをAIモデルに読み込ませていることになる。

LongMemEval での100%成績について、開発チームが「開発集中で起きる」3つの特定の問題に対し、専用の修復コードを書いていたことが判明し、テストセット不正(チート)の疑いがある。

出典:Reddit 同業者 PenfieldLabs が指摘:MemPalace は LoCoMo データセットで満点を獲得したと主張しており、数学的にあり得ない

GitHubユーザーの実測:ベンチマークにミスリード要素

GitHub ユーザーの hugooconnor は、実測後に次のようにコメントした。MemPalace が 96.6% の検索精度だと主張しているにもかかわらず、実際には MemPalace が看板にしている「メモリ宮殿」構造をまったく使っていないという。hugooconnor によれば、彼らのテストは単に下層のデータベース「ChromaDB」のデフォルト機能を呼び出しただけで、プロジェクトが強調するエリア、部屋、引き出しといった分類ロジックには一切関与していないとのことだ。

hugooconnor のテストでは、システムが本当にこれらのメモリ宮殿専用の分類ロジックを有効にすると、検索成績はむしろ悪化することが分かった。部屋モードの例では精度が 89.4% まで低下し、さらに AAAK の圧縮技術を有効にすると精度は 84.2% まで下がり、いずれもデフォルトのデータベース性能を下回った。

hugooconnor はテスト方法も批判している。MemPalace のテスト環境は、各問題の検索範囲を意図的に約50の対話ステージにまで縮小し、極めて小さなサンプルデータベースの中から答えを探すのは簡単すぎるという。

検索範囲を現実シナリオの 19,000 以上の対話ステージに広げると、従来のキーワード検索の精度は 30% まで大幅に下がるはずで、MemPalace が現在のテスト方式で実際の検索の難しさを隠していることが示される。

出典:GitHub GitHubユーザーの実測:MemPalace のベンチマークにはミスリード要素

また、開発チームが訂正声明をすでに出し、AAAK 技術が実際には「ロスあり圧縮(有損圧縮)」として検証されており、コミュニティの厳しい批判を踏まえて説明ドキュメントとシステム設計を修正すると約束しているにもかかわらず、プロジェクトの主要な説明ドキュメントには依然として未修正の誇大表現が複数残っている。たとえば「30倍のロスレス圧縮」や「34% の検索向上」などの主張であり、さらに他の競合相手との比較グラフに関しても、出典がまったく示されていない。

MemPalace の元コードには複数の Bug がある

より多くの開発者がテストをダウンロードするにつれて、GitHub 上では MemPalace の元コードに関する大量のバグ報告が現れている。

ユーザーの cktang88 は重大な不備を列挙している。圧縮コマンドが動作せずシステムがクラッシュする、要約の文字数計算ロジックの誤り、部屋を掘り起こす統計データが不正確であること、そしてサーバーが呼び出しのたびにすべての解釈データをメモリに読み込むため、深刻なリソース消費問題が生じていることなどが含まれる。

ほかに指摘されている問題として、システムが開発者の家族メンバー名をデフォルト設定ファイルに強制的に書き込むことや、照会状態で 1 万件のデータを超える場合の表示上限が強制されていることが挙げられる。

これらの問題に対して、オープンソースコミュニティはすでに積極的に修復を始めている。**ユーザー adv3nt3 が複数の修復要求を提出し、掘り起こしの統計データを修正し、デフォルトの家族メンバー名を削除し、知識グラフの初期化時間を遅延させることを含む。**開発チームも後にこれらの誤りを認めており、コミュニティとの協力により段階的にコードの問題を解決していっている。

ミラ・ジョヴォヴィッチのVibe Codingはかっこいい、マーケはかっこよくない

MemPalace というプロジェクトについて、Hacker News のユーザー darkhanakh は次のような結論を下している。MemPalace は OpenClaw っぽい印象を与える。つまり、人為的にベンチマーク結果を操作して完璧に見せ、その後それを何らかの重大なブレークスルーとして包んでマーケティングする、ということだ。

彼は、MemPalace の基盤技術自体は確かに面白い可能性があるが、テスト手法にこのような瑕疵がある状況で、しかも「史上公開最高スコア」を掲げて宣伝しているのはあまり適切ではないと考えている。「とはいえ、ミラ・ジョヴォヴィッチが Vibe Coding をやってる件については、僕はやっぱり結構クールだと思う。」

続きの読み物:
AIがコード作ったらトラブル! コンビニの期限間近アプリ「惜食獵人」がセキュリティ問題で炎上、家のGPSが丸見えに

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

AequiSolvaは4月30日に、機関投資家向け資産検証のためのSentinelスタックAIアーキテクチャをローンチしました

AequiSolvaによると、同社は2026年4月30日に、Sentinel Stack™をAI統合型の取引所アーキテクチャとして立ち上げました。そこでは決定論的実行、AIによる市場監視、そして継続的な暗号学的準備金の証明のためのOmni-Attest Engine™が特徴として挙げられています。このプラットフォームは3つの中核を組み合わせています

GateNews49分前

カーパシー親揭:LLMで個人のナレッジベースを作るための完全な方法

OpenAI の共同創業チームメンバーであり、Tesla の元 AI 最高監督官(チーフ AI ディレクター)である Andrej Karpathy が X で「LLM Knowledge Bases(LLM ナレッジベース)」のワークフローを公開し、彼が最近、大量のトークン使用量を「コードの操作」から「知識の操作」へと切り替えた理由を説明した。LLM を使って、散らばった論文、記事、フォルダ、画像を、自己メンテナンス型の個人 wiki にまとめていくというものだ。こうした一連のプロセスは、彼自身の研究プロジェクトで約 100 本の記事、約 40 万字を積み上げており、全工程が LLM によって書き込みと更新が行われている。この記事では、Karpathy の完全なセットアップを整理し、自分でも複製したい開発者向けに実装可能なチェックリストを提示する。 中核となる理念:生データ → LLM によるコンパイル → wiki → Q&A Karpathy の設計思想は一文に要約できる。

ChainNewsAbmedia7時間前

ビットコイン・トレジャリーのKウェーブ・メディアが、AIインフラ構築のために最大$485M を確保

ChainCatcherによると、NASDAQ上場のビットコイン・トレジャリー企業K Wave Mediaは5月4日、AIインフラへの戦略転換を発表し、データセンター投資、GPUレンタルサービス、AIインフラの買収および提携に向けて最大4億8,500万ドル($485 million)の資本支援を確保した。 その会社

GateNews8時間前

反物質(Antimatter)は、€300Mの資金調達でAIデータセンター計画を発表

反物質(Antimatter)は、AIワークロード向けのクラウド基盤を提供するフランス拠点の企業で、既存3社であるDatafactory、Policloud、Hivenetを統合して5月4日に立ち上げました。同社は、AI推論のために2026年に100のマイクロデータセンター・ユニットを展開する資金として3億ユーロ(351百万USドル)を調達しています。

CryptoFrontier9時間前

教育省「館館有AI」図書館が無料でChatGPT、Claudeを利用できます!利用時間と場所を一度に確認

教育省は「館館有AI」を推進しており、今年の第4四半期から国家図書館などの国立図書館に各館5台のAIコンピューターを設置する。市民は貸出用の身分証だけでChatGPT、Claude、Geminiなどのツールを無料で利用でき、課金型AIの格差を縮小するとともに、47の国立大学図書館へも拡大する。資金は学校側が自己調達するか、補助金を申請して賄う。あわせて、利用時間、アカウント管理、プライバシー、ライセンスといった課題を克服する必要がある。

ChainNewsAbmedia10時間前

AI バーチャルモデルの経済学:Aitana、Emily と4つのMarkdownシステム解析

AI仮想モデルは、話題実験から月に数万ドルを稼ぐ商業実体へと進み、技術スタック全体が18か月で急速に成熟しました。この記事では3つの典型的なケースを整理します:The Clueless傘下のAitana López(バルセロナ、月収€10,000)、匿名のクリエイターが作ったEmily Pellegrini(週収は約1万ドル)、そして最近X(旧Twitter)上で拡散している「Maya」事例——テキサス州の学生が、4つのmarkdownファイルで構築したとされるAI仮想人格で、初月にOnlyFansのアカウント上で4.3万ドルの収益を上げたケースです。 Aitana López:The Clueless自社の仮想モデル、月収最高€10,000 Aitana López は西

ChainNewsAbmedia13時間前
コメント
0/400
コメントなし