DeepSeek 公司近日宣布,其最新研发的推理模型 DeepSeek-R1-Lite...
DeepSeek 公司近日宣布,其最新研发的推理模型 DeepSeek-R1-Lite 预览版已正式上线。
该模型通过强化学习训练,具备长思维链推理能力,长度可达数万字,尤其在数学、编程和复杂逻辑推理任务上表现出色,被认为推理效果可与 OpenAI 的 o1-preview 相媲美,甚至能展示 o1 未公开的完整思考过程。
在 AMC 的 AIME 和 codeforces 等国际竞赛评测中,DeepSeek-R1-Lite 超越了 GPT-4o 等知名模型。尽管目前仅支持网页使用,且处于迭代开发阶段,但官方承诺正式版 DeepSeek-R1 模型将完全开源,并提供技术报告及 API 服务,以释放长思维链的全部潜力。
本文系作者 @
2024年11月22日
原创发布在 妈咪助手 ,未经许可,禁止转载。
有帮助?