Qwen3使用vllm如何取消thinking模式
query的时候加个不要think的参数就好了:
response = client.chat.completions.create(
model="chat", # 使用的模型名称
messages=[{"role": "user", "content": "Why is the sky blue?"}],
extra_body={"chat_template_kwargs": {"enable_thinking": False}},
)

