云算力之外，一场始于AI的隐秘战役-民众期货

您的位置：主页 > 公告动态 > 投资资讯 > 投资资讯

云算力之外，一场始于AI的隐秘战役

2023-05-30 09:52 来源：民众期货官网作者：民众期货点击：次

本年3月，面临汹涌而来的AI潮，“硅谷刀王”一改往日本性，自动站到台前，宣告推出DGX云，把AI专用的GPU放到云上「租借」。

以往，出售算力这种事都是云核算公司在干。它们购买多种类型显卡与人工智能加快器，依据硬件功能或运用时长等方法定价，然后租给下流客户。

这个进程中，英伟达将GPU要么卖给云核算途径，要么直接出售给AI公司，比方*台NVIDIA DGX超级核算机便是2016年迈黄亲身交付给OpenAI的，并没有直接出售算力，顶多算「卖铲人」。

而DGX上云这个事，尽管英伟达仍需求将其托管到云途径，但本质上现已是跨过鸿沟了。

一贯屈居暗地的英伟达，这次为何要走向台前？

本轮AI潮英伟达毫无疑问是*的获益者，乃至能够没有之一。

用于练习AI的GPU芯片价格疯长，海外A100和H100的每片价格别离涨到了1.5万美元和4万美元，国内一台装备8颗A100和80G存储空间的AI服务器，价格也从上一年中旬的8万/台飙升至当时的165万/台。

但这些钱并没有都流入英伟达的口袋，溢价都被途径拿走了，要害是这种倒买倒卖英伟达还一点方法没有。

DGX云就在这种情况下应运而生，要害价格看似还很廉价。装备8个H100 GPU模组的DGX云，每月套餐费只需3.7万美元，相当于单片H100的价格。

关于急需算力资金又绰绰有余的AI公司来说，DGX云无疑是渴睡时天降的一个枕头；对英伟达而言，出售云算力既能挣钱又绑定了客户。

而看似双赢的背面，却隐藏着一场始于AI的隐秘战役。

01 算力平权

从工业特色看，今日依据云算力的AIGC和从前的加密财物挖矿极端相似，但需求的资源远高于后者。

国盛证券曾在《Web3 视角下的AIGC算力进化论》中，比较了加密财物挖矿和AIGC工业的异同点:

1 AIGC工业耗电量大约会在1.6-7.5年间超越当时比特币挖矿工业耗电量，首要驱动要素是GPT类大言语模型在模型参数、日活和模型数量上的高速添加；

2 和比特币挖矿相似，AIGC工业由算力驱动的内容处于高强度比赛中，参与者只要继续、快速生产出高质量内容，才干确保自己获取到的用户注意力不会下降。

这就导致AIGC工业的两大特色：高本钱和继续性。

其间，本钱侧不止是耗电量，当然耗电量能够作为一个十分直观的依据。比方百度用于练习推理文心一言的阳泉超算中心，每小时耗电64000kW·h（度），依照0.45元/kW·h的商业用电规范，一年电费就到达2.5亿。

而更大的本钱则是来自算力投入。

以ChatGPT为例，不考虑与日活高度相关推理进程所需的算力，仅考虑练习进程，依据测算，1750亿参数的GPT-3练习一次大约需求6000张英伟达A100显卡，假如考虑互联丢失，大约需求上万张A100。

按单张A100芯片10万核算，大规划练习就需求投入约10亿，一般厂商底子承担不起。而GPT-4的模型参数更大，练习的标识符更多，所需算力更为可观。

并且，跟着更多AIGC大模型的发布，其所需算力直线狂飙。

依据OpenAI测算，自2012年至2018年，用于练习AI所需求的算力大约每隔3-4个月翻倍，一共添加了30万倍（而摩尔定律在相同时间只要7倍的添加），每年头部练习模型所需算力添加幅度高达10倍，全体出现指数级上涨。

这个时分就体现出云算力的优势了，总结下来能够归结为8个字：化整为零，按需付费。

云算力能让AIGC大模型厂商无需购买英伟达A100显卡等硬件，而直接按需租借云算力途径供给的算力，这使得草创企业或非头部模型厂商也能测验进入AIGC范畴。

乃至这种“化整为零”的方法，对工业链各方都有好处：

1）对上游算力生产商而言，在算力硬件进入冷季、库存趋增时，能经过售卖云算力的方法，滑润收入的动摇，并为旺季储藏“有生”力气，及时满意回弹的商场需求；

2）对中游云服务厂商而言，则有助于添加客流；

3）对下流算力需求方而言，能*化下降运用算力的门槛，驱动全民AIGC 年代来临。

假如AIGC大模型厂商乐意让渡更多资源，还能够更深化地与云途径协作。这方面的典型事例是微软云与OpenAI的协作，两者的协作没有停留在算力租借上，而深化到了股权与产品的交融。

别的，在大模型比赛中，除了显性的硬件投入本钱，还有一个隐形的时间本钱。

一般来说，大模型关于算力的需求分为两个阶段，一是练习出类ChatGPT大模型的进程；二是将这个模型商业化的推理进程。

并且这个进程越继续大模型就越好。所以现在再来看英伟达DGX云，就不难搞懂老黄干了一件什么事。

用云的方法把用于AI练习的GPU价格打下来，算力平权拉拢中小公司，再依据大模型练习的继续性要素绑定客户，“硅谷刀王”一箭双雕。

02 获益的未必是英伟达

从上一年12月开端，英伟达A100的价格5个月累计涨幅到达37.5%，同期A800价格累计涨幅也到达了20.0%。

GPU价格暴升无疑添加了AIGC练习大模型的门槛，但关于头部厂商而言，涨多少价GPU都是要买的。但关于腰部公司来说，不提价或许咬咬牙还能下单，一提价就只能望GPU兴叹了，王慧文创业拿到的5000万美金融资，或许连练习所需的显卡都买不全。

所以，老黄在这个时分拿出DGX云，就像开了一家豪车租借公司，让买不起的人也能租借。

当然，这背面英伟达的另一层考量，即抢在比赛对手前面，绑定更多的中小客户。

本轮AI热潮中除OpenAI外，最出圈的AI公司非Midjourney和Authropic莫属了。前者是一款AI绘图运用，最近同QQ频道协作敞开了国内事务，后者的创始人则是出自OpenAI，其对话机器人Claude直接对标ChatGPT。

这两家公司有一个相同点，便是都没有购买英伟达GPU建立超算，而是运用Google的算力服务。

该服务由一个集成4096块TPU v4的超算体系供给，重点是Google自研。

别的一家搞自研芯片的巨子是本轮AI浪潮的引领者微软，风闻这款名叫Athena的芯片选用5nm先进制程，由台积电代工，研制团队人数现已挨近300人。

很明显，这款芯片方针便是代替贵重的A100/H100，给OpenAI供给算力引擎，并终究一定会经过微软的Azure云服务来争夺英伟达的蛋糕。

除了云核算公司的背刺，英伟达的大客户特斯拉也要自己单作。

2021年8月，马斯克就向外界展现了用3000块自家D1芯片建立的超算Dojo ExaPOD。其间D1芯片由台积电代工，选用7nm工艺，3000块D1芯片直接让Dojo成为全球第五大算力规划的核算机。

相较之下，受禁令影响的国内公司虽也有代替方案，但短期内仍严峻依靠英伟达。

国产芯片能够做对信息颗粒度要求没有那么高的云端推理作业，但大多现在无法处理超高算力需求的云端练习。

燧原科技、壁仞科技、天数智芯、寒武纪等公司都推出了自己的云端产品，且理论功能指标不弱。

据此前曝光的信息，百度用于练习推理文心一言的阳泉超算中心，除了A100还用了一些国产化的产品，比方百度自研的昆仑芯和寒武纪的思元590，其间有音讯显现2023年收购方案思元大约占10%-20%。

其间，文心一言的芯片层中心才能来自昆仑芯2代AI芯片，其选用自研XPU-R架构、7nm工艺和GDDR6高速显存，通用性和功能明显提高；具有256 TOPS@INT8和128 TFLOPS@FP16的算力水平，较一代提高2-3倍。

本年3月，李彦宏也在亚布力我国企业家论坛上共享，昆仑芯片现在很合适做大模型的推理，将来会合适做练习。

03 结尾

从RIVA128开端，英伟达就展现了自己惊人的商场调查才能。曩昔的十几年里，从加密钱银挖矿到元世界，再到AI潮，英伟达顺势将显卡的客户从游戏玩家拓宽到了科技巨子。

伴跟着烽火延伸，英伟达市值也一路高歌，从一个二线芯片公司变成了全职业的No.1。仅仅，黄仁勋说AI的iPhone时间已到来，那么诺基亚都被苹果打败，英伟达又怎能是*的呢。

参考资料

[1] AIGC的看多期权：AI云算力，国盛证券

[2] Web3 视角下的AIGC 算力进化论，国盛证券

[3] 英伟达帝国的一道裂缝，远川研究所

[4] 云算力挖矿或许是现在进场比特币最稳的路，Odaily星球日报

[5] 百度“文心一言”专家解读，独角兽智库

[6] 大模型年代，国产GPU加快「狂飙」，数字时氪

[7] 英伟达黄仁勋：将经过我国云服务商供给AI超算才能，AI的iPhone时间到来！ *财经

[8] AI算力工业链整理：技能迭代推进瓶颈打破，AIgc场景增多驱动算力需求提高，安信证券

上一篇：黄仁勋讲演全文：我曾阅历三次失利

下一篇：金鼎本钱刘扬：万亿级蓝海初启，共赴大健康工