时间在变,空间随着时间也在变,不变的唯有真知灼见。
2024年12月25日  星期三
首页
财经
参考
ESG
公告
市场
研究
IPO
公司
周报
动态
推荐
首页 > 观察

生成式AI火了,最大赢家却不是ChatGPT:一文读懂生成式 AI 商业生态现状

来源:真灼传媒 时间:2023-02-01 14:02:01

字号

我们开始看到人工智能领域正在步入技术堆栈的早期阶段(注:“技术堆栈”一词描述了一组应用程序,数字工具和平台,供应商,数据源或编程语言,它们组合在一起以提供战略业务功能)。数以百计的新创业公司正涌入市场,开发基础模型、构建 AI 原生应用程序并建立基础设施/工具。


许多热门技术趋势在被市场赶上之前就被过度炒作了。但是,生成式人工智能的繁荣伴随着来自市场的实际收益,以及来自相关应用的真实吸引力。Stable Diffusion 和 ChatGPT 等模型正在创造用户增长的历史记录,多个应用程序在推出后不到一年的时间就达到了 1 亿美元的年化收入。对比显示,人工智能在某些任务中的表现优于人类多个量级。


因此,有足够的早期数据表明大规模变革正在发生。但关键问题是:这个市场的价值将在哪里?


在过去的一年里,我们会见了数十位直接与生成 AI 打交道的初创公司创始人和运营商。我们观察到,基础架构供应商可能是该市场迄今为止的最大赢家,占据了流经该领域的大部分资金。应用程序公司的收入增长非常快,但往往在留存率、产品差异化和毛利率方面苦苦挣扎。而大多数模型提供商,虽然对于这个市场的存在不可或缺,但尚未实现大规模的商业规模。


换句话说,创造最大价值的公司——即训练生成式 AI 模型并将其应用于新程序——并没有获得大部分价值。很难预测接下来会发生什么,但我们认为要了解的关键是堆栈的哪些部分是真正差异化和可防御的。这将对市场结构和长期价值的驱动因素(例如利润率和保留率)产生重大影响。到目前为止,除了传统的公司护城河要素之外,我们很难在堆栈之中找到其他结构性防御要素。


我们非常看好生成式人工智能,相信它将对软件行业及其他行业产生巨大影响。这篇文章的目的是描绘出市场动态,并尝试回答有关生成式 AI 商业模式的更广泛问题。


技术堆栈:基础架构、模型和应用程序

要了解生成式人工智能市场是如何形成的,我们首先需要搞明白堆栈如今的情况。

1.png

堆栈可以分为三层(需要注意的是:这不是市场地图,而是分析市场的框架):


  • 将生成式 AI 模型集成到面向用户产品的应用程序

  • 为 AI 产品提供支持的模型

  • 为生成人工智能模型运行训练和推理工作负载的基础设施供应商(即云平台和硬件制造商)

第一波生成式 AI 应用程序开始形成规模,但在留存率和差异化方面举步维艰

在之前的技术周期中,传统观点认为,一家大型独立公司想要立足必须拥有终端客户——无论是个人消费者还是 B2B 买家。循着这个思路。人们很容易相信生成式AI领域的大公司也将面对终端用户。但到目前为止,还不清楚是否如此。


可以肯定的是,在纯粹的新奇感和大量用例的推动下,生成式 AI 应用程序的增长一直是惊人的。事实上,据我们所知,至少在图像生成、文案撰写和代码编写这三个产品类别的年收入已经超过 1 亿美元。


然而,仅靠增长还不足以建立经久不衰的软件公司,至关重要的是,增长必须是有利可图的——从某种意义上说,用户和客户一旦注册,就会产生利润(高毛利率)并长期坚持(高保留率)。在缺乏强大技术差异性的情况下,B2B 和 B2C 应用程序通过网络效应、立足数据或构建日益复杂的工作流程来推动长期客户价值。


在生成式AI中,这些假设不一定成立。在我们交谈过的应用程序公司中,毛利率区间很大——在少数情况下高达 90%,但更常见的是低至 50-60%,这主要是受模型推理成本的影响。Top-of-funnel(注:即销售过程的第一阶段,此阶段通常指获取更多的曝光,积累更多的用户数据的过程)的增长非常惊人,但目前尚不清楚当前的客户获取策略是否具有可扩展性——我们已经看到付费获客的有效性和保留率开始下降。许多应用程序之间也没有差异化,因为它们依赖于类似的底层人工智能模型,并且尚没有拥有竞争对手难以复制的明显网络效应或数据/工作流。

2.png

因此,尚不得知面对终端用户的应用程序是否是建立可持续的生成式 AI 业务的唯一甚至最佳途径。随着语言模型的竞争和效率的提高,利润率应该会提高(更多内容见下文)。随着 AI 市场进一步整合,留存率应该会增加。有一个强有力的论据表明,垂直整合的应用程序在提高差异化方面具有优势,但是还有很多东西需要证明。


展望未来,生成式 AI 应用程序公司面临的一些重大问题包括:


  • 垂直整合(“模型+应用程序”)。一方面,将 AI 模型作为一种服务来使用,可以让应用程序开发人员随着技术的进步快速迭代。另一方面,一些开发人员认为产品就是模型,将产品数据持续投入到模型之中进行训练是建立防御性的唯一方法,但这是以更大的资金耗费和产品团队的灵活度下降作为代价的。

  • 层出不穷的形式 vs应用程序。生成式 AI 产品有多种不同的形式:桌面应用程序、移动应用程序、Figma/Photoshop 插件、Chrome 扩展程序,甚至是 Discord 机器人。在用户已经使用的领域集成 AI 产品很容易,因为 UI 通常只是一个文本框。在这其中,哪些将成为独立的公司,哪些将被微软或谷歌等现有企业吸收并纳入其AI产品线?

  • 随技术成熟度曲线管理公司。目前尚不清楚这些剧烈扰动是当前生成式 AI 产品固有的,还是因市场处于早期所产生的。再比如,随着市场情绪的消退,其对生成式AI的兴趣是否会下降。这些问题对应用程序公司具有重要意义,包括何时积极募集资金、如何主动地投入获客成本、哪些细分用户需要优先考虑以及何时宣布产品-市场匹配度。

模型提供商们发明了生成式人工智能,但尚未达到大规模商业规模

如果没有像Google、OpenAI和Stability之类的公司所做出研发贡献,现在所说的生成式 AI 根本不会存在。通过它们创新性的模型架构和扩展训练通道所付出的巨大努力,当前大型语言模型 (LLM) 和图像生成模型令人惊叹的功能令所有人受益。


然而,与使用量和口碑相比,这些公司与之相关的收入仍然相对较小。在图像生成方面,在包含用户交互、产品托管和微调模型在内的生态系统的支持下,Stable Diffusion出现了爆炸性的用户社群增长。但Stability 基于业务的核心原则将这些关键服务免费提供。在自然语言模型中,OpenAI 凭借GPT-3/3.5和ChatGPT 占据主导地位,但到目前为止,基于 OpenAI 构建的杀手级应用依然相对较少,即使价格已经下降了一次。

3.png

这可能只是暂时的现象。Stability 是一家尚未专注于赚钱的新公司。OpenAI 有潜力成为一项庞大的业务,随着越来越多的杀手级应用程序的构建,它在所有 NLP 类别的收入中占据很大一部分——特别是如果它们顺利集成到 Microsoft 的产品组合中。鉴于这些模型的大量使用,大规模的收入可能并不遥远。

4.png

但也有相反的一面。作为开源发布的模型可以由任何人托管,包括不承担与大规模模型训练相关的费用(高达数千万或数亿美元)的外部公司。并且目前尚不清楚是否有任何闭源模型可以无限期地保持其优势。例如,我们开始看到由 Anthropic、Cohere 和 Character.ai 等公司构建的 LLMs 更接近 OpenAI 的性能水平,它们都是在类似的数据集(即互联网)上训练并使用类似的模型架构。Stable Diffusion 的例子表明,如果开源模型达到足够的性能水平和社区支持,那么专有替代品可能会发现很难与之竞争。


到目前为止,对于模型提供商来说,最清晰的收获可能是觉察到托管服务在商业化层面大有可为。对专有 API(例如来自 OpenAI)的需求正在迅速增长,开源模型(例如 Hugging Face 和 Replicate)的托管服务正在成为方便共享和集成模型的有用中心——甚至在模型提供商和消费者之间产生一些间接的网络效应。还有一个有力的假设是,可以通过与企业客户的微调和托管协议来获利。


不过,除此之外,模型提供商还面临许多重大问题:


  • 商业化。人们普遍认为,随着时间的推移,AI模型的性能会趋于一致。然而在与应用程序开发人员交谈后发现这一趋势很明显还没有发生。在文本和图像模型方面都有强大的领导者,它们的优势不是基于独特的模型架构,而是基于更大的资金支持、专有产品交互数据和拥有稀缺的 AI 人才。这些会成为一个持久的优势吗?

  • 脱钩风险。依赖模型提供商是应用程序公司起步甚至发展业务的好方法。但是,一旦达到规模,他们就有动力构建和/或托管自己的模型。许多模型提供商的客户集中度非常高,少数应用程序提供了大部分收入,如果这些重要客户转向内部开发AI会发生什么?

  • 钱重要吗?生成式 AI 的前景如此广阔——也可能如此有害——以至于许多模型提供商组织了公共利益公司(B corps)或以其他方式将公益明确纳入其使命,这些丝毫没有阻碍他们的融资活动。但是,围绕大多数模型提供商是否真的想要获取价值以及他们是否应该获取价值存在争议。

基础设施供应商触及一切,并获得回报

生成式 AI 中的几乎一切都在某种程度上通过云托管 GPU(或 TPU)。无论是运行训练负载的模型提供商/研究实验室、运行推理/微调的托管公司,还是进行两者某种组合的应用程序公司——FLOPS(每秒浮点运算次数)都是生成式 AI 的命脉。这是很长一段时间以来首次,最具颠覆性的计算技术的进步受到算力的限制。

5.png

因此,生成式AI市场的大量资金最终流向了基础设施公司。下面列出一些非常粗略的数字:我们估计,平均而言,应用程序公司将大约 20-40% 的收入用于模型推理和微调,而这通常直接支付给云提供商或第三方模型提供商——后者又将大约一半的收入用于云基础设施。因此,有理由猜测今天生成式AI总收入的 10-20% 流向了云提供商。


最重要的是,训练自己模型的初创公司已经从风投那里筹集了数十亿美元——其中大部分(早期高达 80-90%)通常也用于云提供商。许多上市科技公司每年花费数亿美元用于模型训练,要么与外部云提供商合作,要么直接与硬件制造商合作。


用技术术语来说,这就是我们所说的“大量资金”——尤其是对于新兴市场而言。其中大部分用于三大云:亚马逊网络服务 (AWS)、谷歌云平台 (GCP) 和 Microsoft Azure。这些云提供商每年总支出超过1000 亿美元,以确保他们拥有最全面、可靠且具有成本优势的平台。特别是在生成式 AI 中,他们还受益于供应限制,因为他们可以优先使用稀缺硬件(例如 Nvidia A100 和 H100 GPU)。


不过,有趣的是,我们开始看到可观的竞争出现。像甲骨文这样的挑战者已经通过大笔资本支出和销售激励措施取得了进展。一些初创公司,如 Coreweave 和 Lambda Labs,凭借专门针对大型模型开发人员的解决方案迅速成长。他们在成本、可用性和个性化支持方面展开竞争。它们还公开了更细粒度的资源抽象,而由于 GPU 虚拟化限制,大型云仅提供 VM 实例。

6.png


在幕后运行绝大多数 AI 工作负载的Nvidia可能是迄今为止生成式 AI 领域的最大赢家。该公司报告称,其 2023 财年第三季度的数据中心 GPU 收入为 38亿美元,其中相当一部分用于生成式 AI 用例。通过数十年来对 GPU 架构的投资、强大的软件生态系统以及在学术界的深入使用,他们围绕这项业务建立了强大的护城河。最近的一项分析发现,Nvidia GPU 在研究论文中的引用次数是顶级 AI 芯片初创公司总和的 90 倍。


确实存在其他硬件选项,包括 Google Tensor Processing Units (TPU)、AMD Instinct GPU、AWS Inferentia 和 Trainium 芯片以及 Cerebras、Sambanova 和 Graphcore 等初创公司的 AI 芯片。迟到的英特尔也以其高端 Habana 芯片和 Ponte Vecchio GPU 进入市场。但到目前为止,这些新芯片中占据显著市场份额的很少。值得关注的两个例外是谷歌和台积电,谷歌的TPU 在 Stable Diffusion 社区和一些大型 GCP 交易中获得了关注,而台积电被认为制造了这里列出的所有芯片,包括 Nvidia GPU(英特尔混合使用其自己的晶圆厂和台积电来制造芯片)。


换句话说,基础设施是当下堆栈中有利可图、可持续且看似可防御的一层。基础设施公司需要回答的重大问题包括:


  • 坚持无状态工作负载。无论在哪里租用 Nvidia GPU,它们都是一样的。大多数 AI 工作负载是无状态的,因为模型推理不需要附加的数据库或存储(模型权重本身除外)。这意味着 AI 工作负载可能比传统应用程序工作负载更易于跨云移植。在这种情况下,云提供商如何创造粘性并防止客户跳到更便宜的选择?

  • 在芯片稀缺中幸存下来。云提供商和 Nvidia 的定价得到了先进 GPU 供应稀缺的支撑。一位供应商告诉我们,A100 的实际价格较发布价上涨,这对于计算硬件来说是非常不寻常的。当通过增加芯片产量和/或采用新硬件平台最终消除这种供应限制时,这将如何影响云提供商?

  • 云领域是否有挑战者能够突围?我们坚信,垂直云将通过更专业的产品从三巨头那里夺取市场份额。到目前为止,在 AI 领域,挑战者已经通过适度的技术差异化和 Nvidia 的支持获得了有意义的突破——对 Nvidia 来说,现有的云提供商既是最大的客户,也是新兴的竞争对手。更加深远的问题是,挑战者们是否足以克服三巨头的规模优势?

那么……价值将在哪里累积?

当然,我们还不知道。但根据我们拥有的生成式 AI 的早期数据,结合我们与早期 AI/ML 公司的经验,我们的直觉如下:


今天,生成式人工智能似乎没有任何系统性的护城河。应用程序缺乏很强的产品差异化,因为它们使用相似的模型;模型在长期来看也面临同质化,因为它们是在具有相似架构的相似数据集上训练的;云提供商缺乏深度的技术差异化,因为他们运行相同的 GPU;甚至硬件公司也在同一家工厂生产芯片。


当然,还有标准的护城河:规模护城河(“我拥有或可以筹集到比你更多的钱!”)、供应链护城河(“我有 GPU,你没有!”)、生态系统护城河(“每个人都已经在使用我的软件了!”)、算法护城河(“我们比你聪明!”)、分销护城河(“我已经有一个销售团队和比你更多的客户!”)和数据管道护城河(“我在互联网上爬取的数据比你多!”)。但从长远来看,这些护城河都不会持久。现在判断强大、直接的网络效应是否在堆栈的任何层中占据主导地位还为时过早。


根据可用数据,尚不清楚生成式 AI 是否会出现长期的、赢者通吃的动态。


这很奇怪。但对我们来说,这是个好消息。这个市场的潜在规模很难把握——介于所有软件和人的努力之间——所以我们期待在堆栈的各个级别都有很多玩家并产生健康的竞争。我们还期望横向和纵向公司都能够以经过最终市场和最终用户检验的模式获得成功。例如,如果最终产品的主要差异化是 AI 本身,那么垂直化(即将面向用户的应用程序与本土模型紧密耦合)很可能会胜出。而如果 AI 是更大的长尾特征集的一部分,那么它更有可能向水平化趋势发展。当然,随着时间的推移,我们还应该看到更多传统护城河的建立——我们甚至可能会看到新型护城河站稳脚跟。


无论如何,我们可以肯定的是,生成式 AI 会改变游戏规则,将会释放出巨大的价值,因此技术领域将变得非常非常不同。我们为此而来!


本文为「IPO Global」编译

编者|子任

微信公众号:IPO-Globa


注:这篇文章中的所有图片均由 Midjourney 创作

原文链接:https://a16z.com/2023/01/19/who-owns-the-generative-ai-platform/





微信扫码 > 右上角点击 > 分享