"DEEPSEEK"検索結果
本日
09:00

Baidu QianfanがDeepSeek-V4向けのDay 0サポートをAPIサービスで提供開始

Gate Newsメッセージ、4月25日—DeepSeek-V4のプレビューバージョンが4月25日に公開され、オープンソース化されました。Baidu Intelligent Cloudの下で、Baidu QianfanプラットフォームがDay 0のAPIサービス適応を提供しています。このモデルは100万トークンの拡張コンテキストウィンドウを特徴としており、2つのバージョンで提供されます:DeepSeek-V4
もっと
12:31

DeepSeekがV4-ProとV4-Flashモデルを、OpenAIのGPT-5.5 Proより98%低コストでリリース

ゲートニュース(4月25日)— DeepSeekは4月24日にV4-ProおよびV4-Flashのプレビュー版をリリースした。どちらも100万トークンのコンテキストウィンドウを持つオープンウェイトモデルである。V4-Proは総パラメータ1.6兆を備えるが、Mixture-of-Expertsアーキテクチャを用いて推論1回あたり49億のみを有効化する。
もっと
05:33

Baidu Intelligent Cloud、Qianfan プラットフォームで DeepSeek-V4 API をローンチ

ゲートニュース 4月25日 — Baidu Intelligent Cloud は DeepSeek-V4 を自社の Qianfan プラットフォームに導入し、新たにリリースされた AI モデルへの API アクセスを提供しました。DeepSeek-V4 は 2 つのバージョン—DeepSeek-V4-Pro および DeepSeek-V4-Flash—があり、100万トークンの拡張コンテキストウィンドウを備えています。 企業やデ
もっと
14:42

DeepSeek V4 は 1M コンテキストウィンドウで登場。Huawei Ascend と Cambricon チップは完全な互換性を実現

ゲートニュース 4月24日 — DeepSeek V4-Pro と DeepSeek V4-Flash は 4月24日に正式にリリースされ、オープンソース化されました。コンテキスト処理長は 128K から 1M へ大幅に拡張され、ほぼ10倍の収容能力増を示しています。Huawei Computing は、その Ascend スーパーノード製品が
もっと
05:21

DeepSeek V4が米国の議論を呼ぶ:Think Tankがチップ使用に疑問、ReplitのCEOがオープンなイノベーションを擁護

Gate Newsメッセージ、4月24日 — 米国でDeepSeek V4の技術的能力とコンプライアンスをめぐる議論が巻き起こっている。外交問題評議会の上級フェローであるChris McGuire氏 (CFR) および、元ホワイトハウス国家安全保障会議と国防総省の職員は、V4が米中のAI競争環境を変えていないとする分析を公表した。McGuire氏によれば、DeepSeek自身のV4レポートは、その推論能力が最先端モデルに対して約3〜6か月遅れていることを認めており、6か月前にリリースされたGPT-5.2およびGemini 3.0 Proをベンチマークにしているという。
もっと
03:21

DeepSeekの学習データが33Tまで倍増、リリースを遅らせた不安定性が発生

Gate Newsメッセージ、4月24日 — DeepSeekのV4技術レポートによると、V4-FlashとV4-Proはそれぞれ32Tおよび33Tトークンで事前学習されており、V3で使用された約15Tトークンの約2倍です。レポートでは、学習中に「重大な不安定性の課題」に遭遇したことを認めており、損失スパイクがMixture-of-Experts MoE層の異常によって繰り返し発生していました。ルーティング機構そのものがこれらの異常を悪化させており、単純なロールバックでは問題を解決できないとしています。
もっと
03:04

MITライセンスと1.6Tパラメータを備えたDeepSeekのV4オープンソースモデルシリーズをリリース

ゲートニュース速報、4月24日—DeepSeekは、MITライセンスのもとでオープンソースのV4シリーズモデルをリリースしました。重みは現在Hugging FaceおよびModelScopeで利用可能です。このシリーズには2つのモーダル・エキスパート (MoE)モデルが含まれています。V4-Proは総パラメータ1.6兆で、1トークンあたり490億が有効化される構成です。
もっと
09:45

DeepSeekがオープンソース化、TileKernels:大規模モデルの学習と推論のためのGPUカーネルライブラリ

Gate Newsのメッセージ、4月23日 — DeepSeekはMITライセンスのもとでTileKernelsをオープンソース化しました。TileKernelsは、大規模言語モデルの学習と推論のためにTileLangで書かれたGPUカーネルライブラリです。TileLangは、tile-aiチームによって開発された、Pythonで高性能なGPUカーネルを記述するためのドメイン固有言語であり、
もっと