您的位置:主页 > 公告动态 > 投资资讯 > 投资资讯

云算力之外,一场始于AI的隐秘战役

本年3月,面临汹涌而来的AI潮,“硅谷刀王”一改往日本性,自动站到台前,宣告推出DGX云,把AI专用的GPU放到云上「租借」。

以往,出售算力这种事都是云核算公司在干。它们购买多种类型显卡与人工智能加快器,依据硬件功能或运用时长等方法定价,然后租给下流客户。

这个进程中,英伟达将GPU要么卖给云核算途径,要么直接出售给AI公司,比方*台NVIDIA DGX超级核算机便是2016年迈黄亲身交付给OpenAI的,并没有直接出售算力,顶多算「卖铲人」。

而DGX上云这个事,尽管英伟达仍需求将其托管到云途径,但本质上现已是跨过鸿沟了。

一贯屈居暗地的英伟达,这次为何要走向台前?

本轮AI潮英伟达毫无疑问是*的获益者,乃至能够没有之一。

用于练习AI的GPU芯片价格疯长,海外A100和H100的每片价格别离涨到了1.5万美元和4万美元,国内一台装备8颗A100和80G存储空间的AI服务器,价格也从上一年中旬的8万/台飙升至当时的165万/台。

但这些钱并没有都流入英伟达的口袋,溢价都被途径拿走了,要害是这种倒买倒卖英伟达还一点方法没有。

DGX云就在这种情况下应运而生,要害价格看似还很廉价。装备8个H100 GPU模组的DGX云,每月套餐费只需3.7万美元,相当于单片H100的价格。

关于急需算力资金又绰绰有余的AI公司来说,DGX云无疑是渴睡时天降的一个枕头;对英伟达而言,出售云算力既能挣钱又绑定了客户。

而看似双赢的背面,却隐藏着一场始于AI的隐秘战役。

01 算力平权

从工业特色看,今日依据云算力的AIGC和从前的加密财物挖矿极端相似,但需求的资源远高于后者。

国盛证券曾在《Web3 视角下的AIGC算力进化论》中,比较了加密财物挖矿和AIGC工业的异同点:

1 AIGC工业耗电量大约会在1.6-7.5年间超越当时比特币挖矿工业耗电量,首要驱动要素是GPT类大言语模型在模型参数、日活和模型数量上的高速添加;

2 和比特币挖矿相似,AIGC工业由算力驱动的内容处于高强度比赛中,参与者只要继续、快速生产出高质量内容,才干确保自己获取到的用户注意力不会下降。

这就导致AIGC工业的两大特色:高本钱和继续性。

其间,本钱侧不止是耗电量,当然耗电量能够作为一个十分直观的依据。比方百度用于练习推理文心一言的阳泉超算中心,每小时耗电64000kW·h(度),依照0.45元/kW·h的商业用电规范,一年电费就到达2.5亿。

而更大的本钱则是来自算力投入。

以ChatGPT为例,不考虑与日活高度相关推理进程所需的算力,仅考虑练习进程,依据测算,1750亿参数的GPT-3练习一次大约需求6000张英伟达A100显卡,假如考虑互联丢失,大约需求上万张A100。

按单张A100芯片10万核算,大规划练习就需求投入约10亿,一般厂商底子承担不起。而GPT-4的模型参数更大,练习的标识符更多,所需算力更为可观。

并且,跟着更多AIGC大模型的发布,其所需算力直线狂飙。

依据OpenAI测算,自2012年至2018年,用于练习AI所需求的算力大约每隔3-4个月翻倍,一共添加了30万倍(而摩尔定律在相同时间只要7倍的添加), 每年头部练习模型所需算力添加幅度高达10倍,全体出现指数级上涨。

这个时分就体现出云算力的优势了,总结下来能够归结为8个字:化整为零,按需付费。

云算力能让AIGC大模型厂商无需购买英伟达A100显卡等硬件,而直接按需租借云算力途径供给的算力,这使得草创企业或非头部模型厂商也能测验进入AIGC范畴。

乃至这种“化整为零”的方法,对工业链各方都有好处:

1)对上游算力生产商而言,在算力硬件进入冷季、库存趋增时,能经过售卖云算力的方法,滑润收入的动摇,并为旺季储藏“有生”力气,及时满意回弹的商场需求;

2)对中游云服务厂商而言,则有助于添加客流;

3) 对下流算力需求方而言,能*化下降运用算力的门槛,驱动全民AIGC 年代来临。

假如AIGC大模型厂商乐意让渡更多资源,还能够更深化地与云途径协作。这方面的典型事例是微软云与OpenAI的协作,两者的协作没有停留在算力租借上,而深化到了股权与产品的交融。

别的,在大模型比赛中,除了显性的硬件投入本钱,还有一个隐形的时间本钱。

一般来说,大模型关于算力的需求分为两个阶段,一是练习出类ChatGPT大模型的进程;二是将这个模型商业化的推理进程。

并且这个进程越继续大模型就越好。所以现在再来看英伟达DGX云,就不难搞懂老黄干了一件什么事。

用云的方法把用于AI练习的GPU价格打下来,算力平权拉拢中小公司,再依据大模型练习的继续性要素绑定客户,“硅谷刀王”一箭双雕。

02 获益的未必是英伟达

从上一年12月开端,英伟达A100的价格5个月累计涨幅到达37.5%,同期A800价格累计涨幅也到达了20.0%。

GPU价格暴升无疑添加了AIGC练习大模型的门槛,但关于头部厂商而言,涨多少价GPU都是要买的。但关于腰部公司来说,不提价或许咬咬牙还能下单,一提价就只能望GPU兴叹了,王慧文创业拿到的5000万美金融资,或许连练习所需的显卡都买不全。

所以,老黄在这个时分拿出DGX云,就像开了一家豪车租借公司,让买不起的人也能租借。

当然,这背面英伟达的另一层考量,即抢在比赛对手前面,绑定更多的中小客户。

本轮AI热潮中除OpenAI外,最出圈的AI公司非Midjourney和Authropic莫属了。前者是一款AI绘图运用,最近同QQ频道协作敞开了国内事务,后者的创始人则是出自OpenAI,其对话机器人Claude直接对标ChatGPT。

这两家公司有一个相同点,便是都没有购买英伟达GPU建立超算,而是运用Google的算力服务。

该服务由一个集成4096块TPU v4的超算体系供给,重点是Google自研。

别的一家搞自研芯片的巨子是本轮AI浪潮的引领者微软,风闻这款名叫Athena的芯片选用5nm先进制程,由台积电代工,研制团队人数现已挨近300人。

很明显,这款芯片方针便是代替贵重的A100/H100,给OpenAI供给算力引擎,并终究一定会经过微软的Azure云服务来争夺英伟达的蛋糕。

除了云核算公司的背刺,英伟达的大客户特斯拉也要自己单作。

2021年8月,马斯克就向外界展现了用3000块自家D1芯片建立的超算Dojo ExaPOD。其间D1芯片由台积电代工,选用7nm工艺,3000块D1芯片直接让Dojo成为全球第五大算力规划的核算机。

相较之下,受禁令影响的国内公司虽也有代替方案,但短期内仍严峻依靠英伟达。

国产芯片能够做对信息颗粒度要求没有那么高的云端推理作业,但大多现在无法处理超高算力需求的云端练习。

燧原科技、壁仞科技、天数智芯、寒武纪等公司都推出了自己的云端产品,且理论功能指标不弱。

据此前曝光的信息,百度用于练习推理文心一言的阳泉超算中心,除了A100还用了一些国产化的产品,比方百度自研的昆仑芯和寒武纪的思元590,其间有音讯显现2023年收购方案思元大约占10%-20%。

其间,文心一言的芯片层中心才能来自昆仑芯2代AI芯片,其选用自研XPU-R架构、7nm工艺和GDDR6高速显存,通用性和功能明显提高;具有256 TOPS@INT8和128 TFLOPS@FP16的算力水平,较一代提高2-3倍。

本年3月,李彦宏也在亚布力我国企业家论坛上共享,昆仑芯片现在很合适做大模型的推理,将来会合适做练习。

03 结尾

从RIVA128开端,英伟达就展现了自己惊人的商场调查才能。曩昔的十几年里,从加密钱银挖矿到元世界,再到AI潮,英伟达顺势将显卡的客户从游戏玩家拓宽到了科技巨子。

伴跟着烽火延伸,英伟达市值也一路高歌,从一个二线芯片公司变成了全职业的No.1。仅仅,黄仁勋说AI的iPhone时间已到来,那么诺基亚都被苹果打败,英伟达又怎能是*的呢。

参考资料

[1] AIGC的看多期权:AI云算力,国盛证券

[2] Web3 视角下的AIGC 算力进化论,国盛证券

[3] 英伟达帝国的一道裂缝,远川研究所

[4] 云算力挖矿或许是现在进场比特币最稳的路,Odaily星球日报

[5] 百度“文心一言”专家解读,独角兽智库

[6] 大模型年代,国产GPU加快「狂飙」,数字时氪

[7] 英伟达黄仁勋:将经过我国云服务商供给AI超算才能,AI的iPhone时间到来! *财经

[8] AI算力工业链整理:技能迭代推进瓶颈打破,AIgc场景增多驱动算力需求提高,安信证券