LLM inferencing using vLLM