Coggle专业的数据科学、大模型和数据竞赛社区
首页竞赛博客教程模型应用
首页竞赛博客教程模型应用常见链接在线工具

内容

  • 竞赛
  • 博客
  • 教程
  • 模型

资源

  • 常见链接
  • 工具
  • 应用

关于

  • 关于 Coggle
  • 隐私政策

© 2026 Coggle Community. All rights reserved.

  1. 模型库
  2. DeepSeek-R1

DeepSeek-R1

DeepSeek 推出的推理增强大语言模型,通过强化学习训练,在数学、编程和推理任务上表现优异。

发布方:DeepSeek发布日期:2025年1月20日类别:大语言模型
LLM推理开源
论文代码仓库官方网站

DeepSeek-R1 是 DeepSeek 推出的推理增强大语言模型,通过强化学习训练,在数学、编程和推理任务上表现优异。

核心特性

  • 推理能力:采用强化学习训练,在复杂推理任务上表现突出
  • 开源:模型权重完全开源,支持研究和商业使用
  • 多尺寸:提供多种参数规模的版本

性能表现

在多项数学和编程基准测试中,DeepSeek-R1 达到了领先水平,尤其是在数学推理(MATH、GSM8K)和代码生成(HumanEval)任务上。

使用方式

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-R1-Distill-Qwen-7B")
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-R1-Distill-Qwen-7B")