AIGC,可能是下个10年最重要的投资机遇之一( 四 )


大模型在目前也很难生成高质量的视频 。AI模型生成的视频真实感差、分辨率低 。以下是Google的Imagen Video模型(2022年10月)生成的视频图像 。在AI技术领域,这个模型的“高保真度、可控性和真实世界知识”被业界专家广为称赞 。但不难看出,AIGC要生成好莱坞大片还为时尚早 。

AIGC,可能是下个10年最重要的投资机遇之一

文章插图


Google的Imagen Video模型(2022年10月)生成的视频图像
AIGC,可能是下个10年最重要的投资机遇之一

文章插图


Google的Imagen Video模型(2022年10月)生成的视频图像
基于文本的视频生成模型可能至少需要 2-3 年才能达到以假乱真的效果,而此类模型可能需要 3-5 年才能在商业应用上发挥作用 。但在此之前,这些模型可能适用于对保真度和可控性要求较低的场景 。
尽管 AI 研究社区普遍看好大模型,AI创业社区仍在争论到底“更大”还是“更专”才是最佳出路 。
一个典型的例子是OpenAI和Tabine在代码生成领域发展思路的不同 。OpenAI一如既往地选择构建一个超大的通用模型Codex,成为了Github 代码生成模型Copilot背后的功臣 。然而Copilot的主要竞争对手Tabine采取了完全不同的方法 , 为30多种编程语言构建了一系列的专用模型 。这两种发展路径孰强孰弱会对大模型的落地起到决定性的作用 。
由于当前AI模型的局限性 , 低风险、快节奏的游戏设计可能是一个理想的AIGC应用领域 。在这个领域里,速度和创新比模型的准确性和可靠性更重要 。比如,AI合成的语音听起来还是很有机器人的生硬感、真实性低,虽然尚不适合销售等领域,但游戏玩家应该不会介意,甚至会有点喜欢像机器人的NPC 。此外,AI 生成的音乐还远远不及Spotify上的热门歌曲,但可能成为绝佳的游戏背景音乐 。因为制作游戏的视觉效果和音乐非常昂贵 , AIGC的出现提供了一种极大降低游戏制作成本的解决方案 。
除了游戏制作之外,当前一代的 AI 模型非常适合 重复性高但报酬高的任务,以及 人类可以在产出循环中及时纠偏的任务 。编程、营销和视频编辑都是AI可以很好地协助人类专家完成的任务,让他们能够更快、更好地进行原创产出 。
AIGC: 泡沫还是机遇?
在研究了之前由GPT-3驱动的一波AI热和当前的AIGC格局之后,我们认为有些AIGC领域肯定被炒作过头了,但也有被低估和忽视的机遇 。以下是我们对这个新兴领域市场机会的一些拙见:
被高估的领域
特别卷的领域 – 还是别卷了 。
到目前为止,已经有超过20家公司在做AI文编和营销 , 市场竞争异常激烈 。使初创公司集中在这一领域的原因是GPT-3和类似语言模型的特定能力 。当这些模型在两年前发布时,它们已经非常擅长修改草稿,但由于技术水平不够,写不出很多原创内容或者有意义的对话 。所以毫不奇怪,那个时候成立的初创公司都去卷营销和销售领域了 。
在一些拥挤的领域 , 早入场的公司可能有很强的先发优势 。(这就是为什么顶级的VC基金,比如红杉资本 , 相信会有产品在垂直领域持续领先 。)早期玩家可以用用户的数据来调试模型并且进一步改善用户体验 。这也使新玩家很难打入市?。购笃谕蹲矢岩匀〉镁薮蟪晒?。不过 , 新模型的发布可能会为新公司提供进入市场的机会 。
过度承诺的 AI 产品 。
一个惊艳的AIGC模型发布时,总能在硅谷引起巨大的轰动和兴奋 。DALLE-2和Stable Diffusion让投资人开始讨论AIGC什么时候可以取代导演和人类演员,而ChatGPT的首次亮相又制造出了很多AGI(通用人工智能)出现或者ChatGPT取代Google的谣言 。这种兴奋使资本涌入雄心勃勃但往往过度承诺的项目,只可惜技术不到位,产品达不到预期的效果 。

相关经验推荐