国产AI大模型DeepSeek的产业影响力还在蔓延。最近,南京智算中心携手寒武纪,用国产芯片、国产算力设备运行大模型DeepSeek并赋能零售业务场景,国产芯片与AI大模型的协同适配取得实质性进展。
2月12日下午,记者来到位于南京麒麟科创园的南京智能计算中心,机房里,800余台智算服务器正在不停运转。其中也有一些,就是为全国产芯DeepSeek服务。训练一个大模型,首先要有GPU,即图形处理器。南京智算中心运营公司(中科逆熵)主任工程师周国军告诉记者,DeepSeek发布后,他们全力跟进,抢占先机上线全国产芯DeepSeek。
周国军告诉记者:“其实在DeepSeek火爆之前,很多行业的用户已经找上了我们,他们之前都是基于英伟达去做一些生态上的适配以及使用。在部署方面,我们是其实跟英伟达的生态是1:1的,甚至有些时候使用起来会更方便,在性能上和精度上也是完全符合要求的。”
尽管DeepSeek本身降低了对模型预训练的算力需求,但却激发了大量推理算力需求,引爆了整个AI生态链更大的应用需求。南京智算中心运营公司(中科逆熵)运营总监洪晨曦介绍,上线全国产芯DeepSeek,意味着这一国产大模型未来可以在国产算力基础设施上完成训练、推理和使用:“我们所有的设备都是国产化设备,包括它的一些操作系统也是国产化的操作系统。优点很明显——可以做到技术的全自主可控。”
洪晨曦也介绍,对于一些企业来说,大模型输出依旧存在不可控性,如果直接面对客户仍存在安全隐患:“很多的企业要把数据做私有化部署,换句话说就是训练出我自己的DeepSeek。因此,必须要把它部署到自己的算力上面,并且用自己的数据去教。这种场景是不可能放到公网上去开放的,只有找我们这样的计算中心提供设备,让他们去训练。”
因此,全国产芯DeepSeek的上线,也意味着这也给国内的各行各业适配需求提供了选择。比如,国产化适配后的DeepSeek模型与网购大模型深度协作,基于网购平台零售场景,打造的“搜索助手”实现了零售场景的智能化转型。
“接入了大模型之后,用户智能化的搜索导购会有全新的改变。以往,大家在购买商品的时候,都是通过传统的关键词去进行检索。通过大模型,就可以基于用户的这个数据以及商品数据,更智能化地把匹配用户需求的商品推荐出来,大大提升了供应链物流决策分析、内容营销和智能客服导购等场景应用能力。”一家南京的零售企业技术总监彭燕卿告诉记者。
据了解,目前,华为云、腾讯云、阿里云、百度云等厂商均陆续在其云服务平台上线了DeepSeek大模型,华为昇腾、沐曦、海光信息等AI芯片厂商也均适配DeepSeek,多家算力企业宣布与DeepSeek完成适配。国产芯片密集适配DeepSeek,适配成功可实现深度学习框架与国内自主硬件的深度融合,充分发挥国内GPU算力优势,提升DeepSeek模型训练和推理的计算效率,减少对国外硬件平台的依赖,从而降低技术风险和成本,提升国产GPU在AI领域的影响力。