Update vLLM container version to 25.11-py3

2026-06-18 04:22:21 +00:00 · 2025-12-02 16:25:52 -08:00 · 2025-12-02 16:25:52 -08:00 · be2db4604f
commit be2db4604f
parent 373591c46f
1 changed files with 6 additions and 6 deletions
--- a/nvidia/vllm/README.md
+++ b/nvidia/vllm/README.md
@ -57,9 +57,9 @@ support for ARM64.

 ## Step 1. Pull vLLM container image

-Find the latest container build from https://catalog.ngc.nvidia.com/orgs/nvidia/containers/vllm?version=25.09-py3
+Find the latest container build from https://catalog.ngc.nvidia.com/orgs/nvidia/containers/vllm?version=25.11-py3
 ```
-docker pull nvcr.io/nvidia/vllm:25.09-py3
+docker pull nvcr.io/nvidia/vllm:25.11-py3
 ```

 ## Step 2. Test vLLM in container
@ -68,7 +68,7 @@ Launch the container and start vLLM server with a test model to verify basic fun

 ```bash
 docker run -it --gpus all -p 8000:8000 \
-nvcr.io/nvidia/vllm:25.09-py3 \
+nvcr.io/nvidia/vllm:25.11-py3 \
 vllm serve "Qwen/Qwen2.5-Math-1.5B-Instruct"
 ```

@ -96,7 +96,7 @@ Expected response should contain `"content": "204"` or similar mathematical calc
 For container approach (non-destructive):

 ```bash
-docker rm $(docker ps -aq --filter ancestor=nvcr.io/nvidia/vllm:25.09-py3)
+docker rm $(docker ps -aq --filter ancestor=nvcr.io/nvidia/vllm:25.11-py3)
 docker rmi nvcr.io/nvidia/vllm
 ```

@ -150,8 +150,8 @@ After this, you should be able to run docker commands without using `sudo`.


 ```bash
-docker pull nvcr.io/nvidia/vllm:25.09-py3
-export VLLM_IMAGE=nvcr.io/nvidia/vllm:25.09-py3
+docker pull nvcr.io/nvidia/vllm:25.11-py3
+export VLLM_IMAGE=nvcr.io/nvidia/vllm:25.11-py3
 ```