工具调用

工具调用被当作核心能力，而不是附加功能

原始 Qwen README 为工具调用、ReAct Prompting、system prompt 和 Code Interpreter 都提供了独立章节与评测表。

System PromptReAct PromptingCode Interpreter

System Prompt 说明

上游 README 说明 Qwen-1.8B-Chat 与 Qwen-72B-Chat 在多样 system prompt 和多轮复杂交互上做了额外训练。

这些增强被用于上下文中的角色扮演、风格迁移、任务设定与行为设定。

中文工具调用评测

模型	Tool Selection	Tool Input	False Positive Error
GPT-4	98.0%	0.953	23.9%
GPT-3.5	74.5%	0.807	80.6%
Qwen-1.8B-Chat	85.0%	0.839	27.6%
Qwen-7B-Chat	95.5%	0.900	11.6%
Qwen-14B-Chat	96.9%	0.917	5.6%
Qwen-72B-Chat	98.2%	0.927	1.1%

该表来自上游 README 中的 20231206 中文工具调用评测基准。

Code Interpreter 评测

模型	Math	Visualization-Hard	Visualization-Easy	Executable Rate
GPT-4	82.8	66.7	60.8	82.8
GPT-3.5	47.3	33.3	55.7	74.1
Qwen-1.8B-Chat	25.6	21.4	22.8	65.5
Qwen-7B-Chat	41.9	23.8	38.0	67.2
Qwen-14B-Chat	58.4	31.0	45.6	65.5
Qwen-72B-Chat	72.7	41.7	43.0	82.8

该表镜像自上游 README 中的 20231206 Code Interpreter 评测。

实现思路

上游文档把工具调用实现与 ReAct Prompting 示例关联起来，同时在 `openai_api.py` 中给出了 function calling 支持。

如果需要更深入的 Agent 工作流与 Code Interpreter 评测资产，则进一步指向 Qwen-Agent。

完整文档路线

文档页之间按固定顺序镜像，当前页面会在列表中高亮。

安装

安装与快速开始

围绕历史版 Qwen 产品线整理的运行环境、快速开始与部署相关安装说明。

模型

模型与变体

原始 Qwen 模型家族的上下文长度、显存信息与公开检查点入口。

评测

评测结果

为历史版 Qwen 产品线保留的性能表格，并明确给出来源。

演示

Demo 与部署路径

原始 README 中的 Web UI、CLI、vLLM 与 FastChat 等运行面。

API

API 能力

原始 Qwen 产品线的类 OpenAI 本地 API、函数调用与托管 API 入口。

工具调用

当前页面

工具调用与 System Prompt

原始 README 中关于 system prompt、ReAct、函数调用与 Code Interpreter 的公开内容。

长上下文

长上下文

原始 Qwen 产品线中的长上下文方法说明与评测结果。

FAQ

常见问题

基于 README 公开信息与蓝图边界条件整理的公共 FAQ。

协议

许可与引用

镜像原始 Qwen README 中的源代码授权、模型协议说明与引用信息。

来源锚点

README: system prompt 与 tool usage Qwen-Agent benchmark

工具调用与 System Prompt | Qwen Code