vLLMにおける複数の脆弱性
タイトル vLLMにおける複数の脆弱性
概要

vLLMは大規模言語モデル(LLM)の推論およびサービングエンジンです。0.20.0より前のバージョンでは、vLLMのextract_hidden_states投機的デコーディング提案者が、最初のデコードステップ後に誤った形状のテンソルを返し、EngineCoreプロセスがクラッシュするRuntimeErrorを引き起こしていました。このクラッシュは、バッチ内の任意のリクエストがサンプリングペナルティパラメーター(repetition_penalty、frequency_penalty、presence_penalty)を使用した場合に発生しました。単一のリクエストにペナルティパラメーター(例: "repetition_penalty": 1.1)が設定されているだけでサーバーがクラッシュしました。この脆弱性は0.20.0で修正されています。

想定される影響 当該ソフトウェアが扱う情報について、外部への漏えいは発生しません。 また、当該ソフトウェアが扱う情報について、書き換えは発生しません。 さらに、当該ソフトウェアが完全に停止する可能性があります。 そして、この脆弱性を悪用した攻撃の影響は、他のソフトウェアには及びません。 
対策

正式な対策が公開されています。ベンダ情報を参照して適切な対策を実施してください。

公表日 2026年5月12日0:00
登録日 2026年5月18日12:12
最終更新日 2026年5月18日12:12
CVSS3.0 : 警告
スコア 6.5
ベクター CVSS:3.0/AV:N/AC:L/PR:L/UI:N/S:U/C:N/I:N/A:H
影響を受けるシステム
vLLM
vLLM 0.18.0 以上 0.20.0 未満
CVE (情報セキュリティ 共通脆弱性識別子)
CWE (共通脆弱性タイプ一覧)
ベンダー情報
その他
変更履歴
No 変更内容 変更日
1 [2026年05月18日]
  掲載
2026年5月18日12:12

NVD脆弱性情報
CVE-2026-44223
概要

vLLM is an inference and serving engine for large language models (LLMs). From to before 0.20.0, the extract_hidden_states speculative decoding proposer in vLLM returns a tensor with an incorrect shape after the first decode step, causing a RuntimeError that crashes the EngineCore process. The crash is triggered when any request in the batch uses sampling penalty parameters (repetition_penalty, frequency_penalty, or presence_penalty). A single request with a penalty parameter (e.g., "repetition_penalty": 1.1) is sufficient to crash the server. This vulnerability is fixed in 0.20.0.

公表日 2026年5月13日5:16
登録日 2026年5月15日4:18
最終更新日 2026年5月16日0:16
影響を受けるソフトウェアの構成
構成1 以上 以下 より上 未満
cpe:2.3:a:vllm:vllm:*:*:*:*:*:*:*:* 0.18.0 0.20.0
関連情報、対策とツール
共通脆弱性一覧