DeepSeek R1

DeepSeek 推理模型,适合复杂逻辑、数学和代码分析

已发布

DeepSeek R1 是 DeepSeek 面向推理任务推出的模型,重点能力在复杂逻辑、数学推导、代码分析和多步骤问题拆解。它常被用于需要明确推理过程的场景,也是国内推理模型生态中的重要选择

stars能力特性

code函数调用stream流式输出

payments上下文与价格

上下文长度131,072
最大输出16,384
输入价格¥4/ 每 1M tokens
输出价格¥16/ 每 1M tokens
缓存输入价格¥0.8/ 每 1M tokens

description详细介绍

模型概述

DeepSeek R1 是 DeepSeek 面向推理任务推出的模型,重点能力在复杂逻辑、数学推导、代码分析和多步骤问题拆解。它常被用于需要明确推理过程的场景,也是国内推理模型生态中的重要选择

使用建议

建议根据任务复杂度、上下文长度、成本和延迟要求选择该模型。对于高价值或严肃场景,应结合人工复核、日志监控和安全策略使用

lightbulb典型场景

  • 复杂逻辑分析
  • 数学推导
  • 代码问题定位
  • 方案比较和决策辅助

thumb_up优势特点

  • 推理能力突出
  • 中文场景友好
  • 性价比具备吸引力

info局限性

  • 普通对话不一定需要使用
  • 多模态能力不是重点
  • 需要注意推理输出的事实校验

compare_arrows替代模型

link参考来源

以上内容综合整理自官方文档与公开资料,具体以官方为准