北京大学:2025年DeepSeek-R1、Kimi1.5及类强推理模型开发解读报告.pdf

分类:研报

价格:3 星球币

文件大小:9.1 MB

创建时间:2026-02-21 20:56:32

北京大学:2025年DeepSeek-R1、Kimi1.5及类强推理模型开发解读报告.pdf DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 Outline 2 ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界...

AI 解读对话

文档预览

正在准备预览...

相关推荐