NVIDIA Developer2026/06/24 00:00

Boost Inference Performance up to 15x on NVIDIA Blackwell Using DFlash Speculative Decoding

NVIDIAは、投機的デコーディング技術「DFlash」を用いることで、NVIDIA Blackwellプラットフォーム上での推論性能を最大15倍向上できると発表した。AIシステムが単発のやり取りから複数エージェントによる協調型ワークフローへ移行する中、自己回帰型LLMの低遅延推論の重要性が高まっている。

原文を読む（NVIDIA Developer）→

この要約は Claude (Anthropic) が生成したものです。記事の著作権は配信元（NVIDIA Developer）に帰属します。正確な内容は原文をご確認ください。

Boost Inference Performance up to 15x on NVIDIA Blackwell Using DFlash Speculative Decoding

関連記事