製品・ソフトウェアに関する情報
vLLMにおける複数の脆弱性
Title vLLMにおける複数の脆弱性
Summary

vLLMは大規模言語モデル(LLM)の推論およびサービングエンジンです。0.20.0より前のバージョンでは、vLLMのextract_hidden_states投機的デコーディング提案者が、最初のデコードステップ後に誤った形状のテンソルを返し、EngineCoreプロセスがクラッシュするRuntimeErrorを引き起こしていました。このクラッシュは、バッチ内の任意のリクエストがサンプリングペナルティパラメーター(repetition_penalty、frequency_penalty、presence_penalty)を使用した場合に発生しました。単一のリクエストにペナルティパラメーター(例: "repetition_penalty": 1.1)が設定されているだけでサーバーがクラッシュしました。この脆弱性は0.20.0で修正されています。

Possible impacts 当該ソフトウェアが扱う情報について、外部への漏えいは発生しません。 また、当該ソフトウェアが扱う情報について、書き換えは発生しません。 さらに、当該ソフトウェアが完全に停止する可能性があります。 そして、この脆弱性を悪用した攻撃の影響は、他のソフトウェアには及びません。 
Solution

正式な対策が公開されています。ベンダ情報を参照して適切な対策を実施してください。

Publication Date May 12, 2026, midnight
Registration Date May 18, 2026, 12:12 p.m.
Last Update May 18, 2026, 12:12 p.m.
CVSS3.0 : 警告
Score 6.5
Vector CVSS:3.0/AV:N/AC:L/PR:L/UI:N/S:U/C:N/I:N/A:H
Affected System
vLLM
vLLM 0.18.0 以上 0.20.0 未満
CVE (情報セキュリティ 共通脆弱性識別子)
CWE (共通脆弱性タイプ一覧)
ベンダー情報
その他
Change Log
No Changed Details Date of change
1 [2026年05月18日]
  掲載
May 18, 2026, 12:12 p.m.

NVD Vulnerability Information
CVE-2026-44223
Summary

vLLM is an inference and serving engine for large language models (LLMs). From to before 0.20.0, the extract_hidden_states speculative decoding proposer in vLLM returns a tensor with an incorrect shape after the first decode step, causing a RuntimeError that crashes the EngineCore process. The crash is triggered when any request in the batch uses sampling penalty parameters (repetition_penalty, frequency_penalty, or presence_penalty). A single request with a penalty parameter (e.g., "repetition_penalty": 1.1) is sufficient to crash the server. This vulnerability is fixed in 0.20.0.

Publication Date May 13, 2026, 5:16 a.m.
Registration Date May 15, 2026, 4:18 a.m.
Last Update May 16, 2026, 12:16 a.m.
Affected software configurations
Configuration1 or higher or less more than less than
cpe:2.3:a:vllm:vllm:*:*:*:*:*:*:*:* 0.18.0 0.20.0
Related information, measures and tools
Common Vulnerabilities List