该方法仅从 100 个种子问题出发,通过三个智能体的协同进化,自动生成高质量、难度自适应的课程,并持续提升模型推理能力。一个仅用 100个种子问题启动的 32B Generator,竟能产出优于 GPT-5…...