Qwen3使用vllm如何取消thinking模式
query的时候加个不要think的参数就好了:
response = client.chat.completions.create( model="chat", # 使用的模型名称 messages=[{"role": "user", "content": "Why is the sky blue?"}], extra_body={"chat_template_kwargs": {"enable_thinking": False}}, )