APIGen:自动生成函数调用数据

APIGen是一款能够通过自然语言指令执行功能性API调用的软件。例如,你只需要说“我要查询某地的天气”,模型会自动生成并执行相关API,无需手动对接专门的天气API。APIGen旨在为函数调用应用程序生成高质量的可验证数据集。
软件功能
- 自动生成函数调用数据集,覆盖多种API调用场景
- 通过统一的JSON格式,标准化API描述和调用
- 三层验证:格式检查、实际函数执行和语义验证,确保数据可靠性和正确性
- 高准确性:人类评估600个样本数据点,正确率超过95%
- 训练数据集:用于训练1.3B和6.7B规模的功能调用模型
软件特点
- 自动化的数据生成流水线
- 标准化数据结构,易于处理
- 高可靠性:通过三层验证确保数据正确性
- 高性能:6.7B模型在Berkeley功能调用排行榜上排名第六,超越GPT-4o和Gemini-1.5-Pro
- 广泛实验:1.3B模型性能超过GPT-3.5-Turbo
应用场景
- 自然语言指令执行功能性API调用
- 数据集生成,为函数调用应用程序提供高质量数据
- 模型训练,利用生成的数据集训练高性能功能调用模型
- API调用标准化,简化API调用和处理