Laut OneMillion_AI hat Mistral AI kürzlich Leanstral 1.5 veröffentlicht, ein formales Beweismodell für Lean 4 mit insgesamt 119 Milliarden Parametern und 65 Milliarden aktiven Parametern. Das Modell wird unter der Apache-2.0-Lizenz mit kostenlosem API-Zugang veröffentlicht. Im PutnamBench erreicht Leanstral 1.5 durchschnittliche Kosten von etwa 4 US-Dollar pro Problem, deutlich niedriger als frühere Systeme, die zwischen zehn und hundert US-Dollar pro Problem kosteten.
Das Modell löst 587 von 672 PutnamBench-Problemen und erreicht 87% im abstrakten Algebra-Benchmark FATE-H sowie 34% in FATE-X, was neue Leistungsrekorde in seiner Kategorie aufstellt. Über mathematische Beweise hinaus wurde Leanstral 1.5 auch auf Code-Verifikation angewendet und entdeckte 11 echte Fehler in 57 Open-Source-Rust-Repositories, davon 5 zuvor nicht gemeldete.