
消息:美出口禁令阻碍DeepSeek新模型进程
The Epoch Times
美国媒体报导说,美国芯片出口管制措施已经阻碍了中国人工智能公司DeepSeek(深度求索)的新模型进程。
The Information周四(6月26日)引述知情人士的消息说,因为中国市场短缺英伟达(Nvidia)服务器芯片,这将限制中国云服务商为DeepSeek新模型提供服务的速度和规模。
知情人士是向企业客户提供DeepSeek模型的中国主要云服务提供商的员工。他们表示,预计DeepSeek即将推出的大型语言模型R2在中国的普及速度和规模可能都不如其前身R1。
DeepSeek依靠英伟达的硬件和软件进行训练,并且在英伟达芯片上运行时性能最佳。知情人士还透露,虽然中国国内芯片公司——包括华为等提供了英伟达芯片的替代品,但DeepSeek的模型完全以英伟达硬件和软件为基础进行优化,因此换中国芯片来运行这些模型会更难管理,效率也会更低。
中国云计算公司的员工表示,如果R2模型的性能超越现有的开源模型,那么对它的后续需求将使中国的云服务提供商不堪重负,因为这些服务提供商已经在努力应对英伟达芯片短缺的问题。
他们表示,在目前使用R1模型的云客户中,大多数都使用英伟达的H20芯片运行模型。
尽管DeepSeek尚未确定何时发布R2,但云计算公司员工透露,该公司一直在与一些中国云计算公司保持密切沟通,为他们提供技术规范,以指导他们在服务器上托管和分发该模型。这些计划包括为希望使用完整版R2的客户准备足够的H20芯片。
美国4月份的禁令粉碎了中国云计算公司囤积更多H20芯片的希望。如果依赖中国现有的H20芯片库存,这可能会限制企业使用R2的程度。
美国禁令凸显中国仍然严重依赖美国技术的现实。H20芯片于2023年发布,是英伟达对美国收紧出口限制的回应,该限制实际上禁止英伟达向中国销售其强大的Hopper系列图形处理器芯片。随后,英伟达订制面向中国市场销售的缩减版H20芯片。













