OpenAI的DALL _oad

文章插图

DALL-E可以基于其属性的描述来创建图像，例如“五边形绿色时钟”或“桌上摆着一副眼镜” 。在后一个示例中，它将饮料杯和眼镜放在成功的桌上。
它还可以绘制并组合多个对象，并提供不同的视角，包括切面和对象内部。与过去的文本到图像程序不同，它甚至可以推断出描述中未提及但对于逼真的图像而言是必需的细节。例如，使用“冬天坐在田野上的狐狸的画”的描述，代理商可以确定是否需要阴影。
“不同于必须明确且完整地指定其输入的3D渲染引擎，当标题暗示图像必须包含未明确说明的某些细节时，DALL·E通常能够'填入空白'，”根据OpenAI团队的说法。
【OpenAI的DALL】

文章插图

OpenAI还利用一种称为“零击推理”的功能。这使代理无需任何额外培训即可从描述和提示生成答案，并且已被用于翻译和其他杂务。这次，研究人员将其应用于视觉领域，以执行图像到图像和文本到图像的翻译。在一个示例中，它能够从草图生成猫的图像，提示是“顶部和底部的草图完全相同。 ”
该系统还有许多其他才能，例如了解电话和其他对象如何随时间变化，掌握地理事实和地标以及以摄影，插图甚至剪贴画风格创建图像。
目前，DALL-E还很有限。有时，它可以提供您从描述中获得的期望，而其他时候，您只会得到一些奇怪或破烂的图像。与其他AI系统一样，由于系统的黑匣子性质，即使是研究人员本身也无法确切了解它如何生成某些图像。
尽管如此，如果进一步发展，DALL-E具有巨大的潜力颠覆诸如摄影和插画等领域，并伴随着一切好与坏。 “将来，我们计划分析像DALL·E这样的模型如何与社会问题联系起来，例如对某些工作流程和职业的经济影响，模型输出中可能存在的偏见以及该技术所隐含的长期道德挑战，”团队写道。要自己玩DALL-E，请查看OpenAI的博客。

OpenAI的DALL

相关经验推荐

废黄河高程和85高程相差多少废黄河高程与85高程相差多少

西胡芦怎么炒好吃

充电提示音在哪里设置 oppo充电提示音在哪里设置

仙剑奇侠传七什么时候发售仙剑奇侠传7上市时间是怎样的

有哪些丝绸洗涤保养方法

安卓|1999起价格破灭！Redmi K50电竞版来了：安卓最强马达+骁龙8

作为一款风靡全网的正版授权随机塔防类游戏|《随机点数大师》不删档上线全员登录即送传说

晚上这么睡，竟有补肾奇效，让你阳气十足！

何首乌和制首乌的区别

比利时蓝牛寿命牛长什么样子?比利时蓝牛中国能养吗

国王排名|国王排名：初代国王又坑儿子？二王子应该还有机会复原

自称第一却被轮番教育,T1就这水平?

宝宝缺铁的症状有哪些

非人哉|非人哉：星君找人理发差点被烫，非人哉“坑爹”发型师再登场

暗区突围独狼攻略暗区突围独狼玩法介绍

王者又有英雄“挨刀”，芈月改动被热议，用户：这游戏没法玩了

阴阳师二月神秘图案怎么画

住房怎么装修房子怎么装修，3万可以简单装修吗

2023广州元旦返乡在哪里报备

折叠屏|折叠屏时代的翻盖设计，能否替代昙花一现的滑盖手机，成主流？