语言模型-代码
2024年12月15日小于 1 分钟
语言模型-代码
OpenAI O1的复现版,专注于编程的O1-CODER
它的核心在于强化了编程能力
它结合了强化学习和蒙特卡洛树搜索来增强模型的system-2思维能力,生成更有逻辑性的代码,可执行复杂的推理任务
它用了一个测试用例生成器进行验证,用伪代码到实现代码的两阶段生成模式,实现推理到编程端到端自动化流程
Github:https://github.com/ADaM-BJTU/O1-CODER?continueFlag=5b41813d9af5c4c6f64b8145653bfa51