最近のインタビューでYann LeCunが述べたところによると、大規模言語モデルは、その価値にもかかわらず、人工汎用知能につながることはできません。というのも、行動の結果を予測し、抽象的な空間で計画する能力が欠けているためであり、それは真の人間レベルの推論に不可欠です。LeCunは、LLMの成功は言語の離散的な性質に依存していると強調しましたが、現実世界は連続的で高次元であるため、次のトークンを予測するだけではなく、物理的因果関係を理解する必要があります。
LeCunは代替としてJoint Embedding Predictive Architecture(JEPA)を提案しており、個々のピクセルを復元するのではなく、意味表現空間における将来の状態を予測します。LeWorldModelに関する2026年3月の論文では、JEPAの可能性が示されました。15-million-parameterのモデルが、制御タスクで96%の成功率を達成し、さらに大規模な事前学習データセットを必要とせずに、計画速度が最大50倍向上したのです。