2025/10/02 工具本身的反哺
有了基本的、可用的模型之后,可以利用此模型生成高质量数据,然后再反哺给模型,以提高模型的能力。 获得高质量数据的方法多种多样,RL 只是其中一种。
这个模式跟编译器、OS 类似;可以用 C 编译器开发 C 编译器,用 Linux 开发 Linux。
有了基本的、可用的模型之后,可以利用此模型生成高质量数据,然后再反哺给模型,以提高模型的能力。 获得高质量数据的方法多种多样,RL 只是其中一种。
这个模式跟编译器、OS 类似;可以用 C 编译器开发 C 编译器,用 Linux 开发 Linux。