工具调用

工具调用被当作核心能力,而不是附加功能

原始 Qwen README 为工具调用、ReAct Prompting、system prompt 和 Code Interpreter 都提供了独立章节与评测表。

System PromptReAct PromptingCode Interpreter

System Prompt 说明

上游 README 说明 Qwen-1.8B-Chat 与 Qwen-72B-Chat 在多样 system prompt 和多轮复杂交互上做了额外训练。

这些增强被用于上下文中的角色扮演、风格迁移、任务设定与行为设定。

中文工具调用评测

模型Tool SelectionTool InputFalse Positive Error
GPT-498.0%0.95323.9%
GPT-3.574.5%0.80780.6%
Qwen-1.8B-Chat85.0%0.83927.6%
Qwen-7B-Chat95.5%0.90011.6%
Qwen-14B-Chat96.9%0.9175.6%
Qwen-72B-Chat98.2%0.9271.1%

该表来自上游 README 中的 20231206 中文工具调用评测基准。

Code Interpreter 评测

模型MathVisualization-HardVisualization-EasyExecutable Rate
GPT-482.866.760.882.8
GPT-3.547.333.355.774.1
Qwen-1.8B-Chat25.621.422.865.5
Qwen-7B-Chat41.923.838.067.2
Qwen-14B-Chat58.431.045.665.5
Qwen-72B-Chat72.741.743.082.8

该表镜像自上游 README 中的 20231206 Code Interpreter 评测。

实现思路

上游文档把工具调用实现与 ReAct Prompting 示例关联起来,同时在 `openai_api.py` 中给出了 function calling 支持。

如果需要更深入的 Agent 工作流与 Code Interpreter 评测资产,则进一步指向 Qwen-Agent。

来源锚点

工具调用与 System Prompt | Qwen Code