DeepSeek 推出的推理增强大语言模型,通过强化学习训练,在数学、编程和推理任务上表现优异。
DeepSeek-R1 是 DeepSeek 推出的推理增强大语言模型,通过强化学习训练,在数学、编程和推理任务上表现优异。
在多项数学和编程基准测试中,DeepSeek-R1 达到了领先水平,尤其是在数学推理(MATH、GSM8K)和代码生成(HumanEval)任务上。
from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-R1-Distill-Qwen-7B")
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-R1-Distill-Qwen-7B")