北京大学:2025年DeepSeek-R1、Kimi1.5及类强推理模型开发解读报告.pdf
北京大学:2025年DeepSeek-R1、Kimi1.5及类强推理模型开发解读报告.pdf DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 Outline 2 ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界...
共益星球报告库