Qwen3使用vllm如何取消thinking模式

作者: adm 分类: AI 发布时间: 2025-03-01

query的时候加个不要think的参数就好了:

response = client.chat.completions.create(
model="chat", # 使用的模型名称
messages=[{"role": "user", "content": "Why is the sky blue?"}],
extra_body={"chat_template_kwargs": {"enable_thinking": False}},
)

如果觉得我的文章对您有用,请随意赞赏。您的支持将鼓励我继续创作!