发布日期:2026-04-10 13:05 点击次数:61

记者 沈欢然 2月13日,一位英伟达代理商告诉经济不雅察网记者,春节后第一周,两家中国科技企业为支握开源大模子DeepSeek的推理事业,进攻向他们公司采购了L20 GPU算力修复。“前年,客户下单总要反复推敲和比价,当今连库存的禁售型号齐抢空了”。
DeepSeek的出现颠覆了商场将高性能GPU视为AI赛谈中枢的传统默契,导致动作高性能GPU控制者的英伟达当先被商场看空。
关联词,更多产业东谈主士发现,近期,不管是高性能的H系列GPU,如故RTX 40系列的高端显卡,英伟达的GPU再行变得供不应求。
算力需求爆发
前述英伟达代理商目下正加紧为客户调配英伟达的居品。他发现,英伟达芯片在中国商场全线紧缺,一些依然禁售的H800系列存货一卡难求。
伸开剩余72%此时,接入DeepSeek的中外企业已达数百家,国内云事业、互联网、手机、芯片、金融、医疗、汽车等行业齐在上线和部署DeepSeek。
迅速增长的用户量为上述企业带来“泼天隆盛”:云事业借此兜销算力、芯片企业借此试验居品、车企以更低本钱升级我方的软件、上市公司借此推升市值。
一家IT厂商对经济不雅察网记者称,其调用DeepSeek的平台在上线首日加多了上万个用户,事业器险些崩溃,现存算力依然跟不上用户的需求。团队为缓解压力,不得不进攻调配更多英伟达GPU。许多上线DeepSeek的平台涌现事业器繁忙,本体上是平台提供的算力跟不上迅速增长的用户需求。
向金融、科研、航空航天等企业提供超算云事业的并行科技(839493.BJ)董事长陈健称,模子的人命周期经常是先训导,然后部署为事业,终末进行推理。目下是企业在DeepSeek模子推理流程中爆发了大齐算力需求。
据经济不雅察网记者统计,英伟达在中国正当销售的型号包括:H20、L20,T4;游戏显卡涵盖RTX 40系列(除RTX 4090外)和RTX 30系列及更早型号,还有新推出的RTX 5090为止版5090D。
目下市面上有十几款国产GPU品牌,但无边在性能、清楚性和生态上与英伟达存在一定差距,英伟达卡仍是企业们的最优收受。
DeepSeek的R1模子发布后,英伟达股价遇到往日一年来最大跌幅17%,但自2月3日启动出现反弹,目下回升了13%。
国内某模子厂商一位东谈主士对经济不雅察网记者称,DeepSeek的出现让业界反想算力泡沫,AI训导是否不错不再依赖大鸿沟的高端GPU集群,可是跟着提供模子和使用模子的个东谈主和企业齐在爆发式增长,大齐的模子推理再一次推升了对英伟达卡的需求。
陈健觉得,DeepSeek带给产业界的转换是AIGC大模子训导、推理算力消费大幅缩小。比拟模子推理,模子训导的需求并莫得在短期内出现爆发式增长。
算力需求可握续吗?
DeepSeek展现出纷乱的推理能力与优秀的文华,可是提供DeepSeek事业的代价也很大。
上述国内模子厂商东谈主士暗示,目下DeepSeek满血版对硬件竖立条目绝顶高,至少需要两台H800卡才能运行起来,而国内大多数基础模子只需要一台4090卡就能运行。
经常来说,模子能力与参数目和精度密切关连,参数目影响AI的学问量,精度影响AI的准确性和推理能力,这亦然为什么好多平台上线的DeepSeek看起来“才调”不及,因为背后的算力不及以支握模子在参数目和精度上达到最好状况。
不外,上述国内模子厂商东谈主士觉得,这种急迫的算力需求巧合握续很久。在本体欺诈中,开垦者经常会将跨越600B参数目的模子进行蒸馏,压缩到更低参数鸿沟,再用于买卖化。而DeepSeek发展得太快以致于团队还没来得及完成蒸馏开云(中国)kaiyun网页版登录入口,可能后续几个月蒸馏好后,那些上线DeepSeek的企业不错简易一些推理算力。
发布于:北京市Powered by 开云(中国)kaiyun网页版登录入口 @2013-2022 RSS地图 HTML地图