HuggingFace Papers · 编程工具

FrontierSmith:大规模合成开放性编程问题

FrontierSmith 提出一种可扩展的数据合成方法,用于生成具有明确需求与多种解法路径的编程问题。该方法通过分解复杂任务、迭代细化与自动验证,构建出训练集质量可与人工标注匹敌的开放型题目。实验表明,用合成数据训练的代码模型在 HumanEval 等基准上表现接近人工数据训练的模型,且覆盖更多解题策略,为代码大模型的数据扩充提供了有效思路。

域名
huggingface.co
评分
4 · 重要更新
收录
2026-05-17
FrontierSmith:大规模合成开放性编程问题

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。