Open R1 项目进展第三期

钿稳铆 · 2025-6-1 18:38:14

Open R1 项目进展第三期

本次更新带来三大突破性进展:

CodeForces-CoTs 数据集: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本，同时包含 C++ 和 Python 双语言解题方案
IOI 基准测试: 基于 2024 国际信息学奥林匹克竞赛 (IOI) 构建的全新挑战性基准
OlympicCoder 模型: 7B/32B 双版本代码模型，在 IOI 问题上超越 Claude 3.7 Sonnet 等闭源前沿模型

下图展示了 OlympicCoder 与各类指令微调模型、推理模型的性能对比。通过 CodeForces-CoTs 训练出的模型展现顶尖性能，其中 32B 版本甚至超越了我们测试过的所有开源模型 (包括某些参数量百倍于它的模型)
来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

账号		自动登录	找回密码
密码			立即注册