跳动百科

第三方平台 DeepSeek-R1 稳定性测评:性能差异引发热议

宰友龙   来源:网易

第三方平台 DeepSeek-R1 稳定性测评:性能差异引发热议

近日,中国AI公司DeepSeek推出的推理模型DeepSeek-R1在第三方平台的稳定性表现成为热议话题。据多项测评数据显示,DeepSeek-R1在不同托管平台上的性能差异显著,完整性、准确性和推理时间均有所不同。

在一项由中国软件评测中心牵头的跨平台稳定性测试中,DeepSeek-R1在纳米AI搜索平台上表现尤为突出,因接入“满血版”并免费提供,获得高响应率和稳定输出。然而,在阿里百炼等平台上,DeepSeek-R1在处理复杂任务时常因显存消耗过高而被截断输出,导致客户端卡顿。

此外,用户反馈显示,DeepSeek-R1在单次对话输出超过3000字时易陷入死循环,更适合知识挖掘而非精确任务。部分用户通过API联网等方案尝试优化使用体验。

此次测评揭示了模型部署的复杂性,也为用户选择托管服务提供了重要参考。DeepSeek官方被呼吁提供更多硬件支持或付费层级,以缓解免费服务的拥堵问题。