搜索
写经验 领红包

给张图就能反推Prompt,AI绘画神器能够「看图说话」了,会比人类手写的更好吗?

问:给张图就能反推Prompt,AI绘画神器能够「看图说话」了,会比人类手写的更好吗?

在各种AIGC产品层出不穷的今天,让AI画一张图已经不是什么难事。尽管有着「无需动笔」、「零门槛作画」等一系列优点,但很多人并不能借助AI之手轻松获得一幅理想中的作品 —— 难点在于「prompt」。Prompt方法是一门极深的管理学问:如果不输入精准的命令描述,生成结果就可能十分随机,甚至与预期相去甚远。但归根结底,如何给出完美的prompt,如何让模型按照人类用户预设的方式输出结果,甚至如何降低花在prompt上的成本,很少有人清楚。正因此,AIGC产业衍生出了一种专门的职业 ——prompt工程师。前段时间,初创公司Anthropic在旧金山招聘「prompt工程师和图书馆员」,给出的薪水高达33.5万美元。或许,这一过程也能让AI代劳呢?AI会做的比人类更好吗?最近,AI绘画神器Midjourney就上新了一个功能:/describe。「今天,我们发布了一个 /describe命令,可让您将图像转换为文字。」具体来说,Midjourney学会了从图像中反推prompt。如果你在Midjourney上传一张图片,它会提供给四个版本的描述,你可以直接拿来并进行调整,然后去生成自己想要的图片变体。Midjourney是一款2022年3月发布的AI绘画工具,此前刚刚推出第五代版本,由于生成效果十分「炸裂,大量用户迅速涌入,以至于该公司不得不关闭了免费注册通道。这一次功能的更新意义重大:改进可访问性:通过用于Web显示的ALT文本元素,图像描述让有视觉障碍或阅读困难的人更容易访问数字内容;增强的可搜索性:描述可以通过搜索引擎启用更好的搜索功能和索引;用于标题:可以包含描述,使图像更加清晰;详细prompt:描述可用于创建更详细的prompt以制作新变体,可以为快速工程提供灵感。怎么使用?用户只需从写一个「 /describe」开始,Midjourney提供了上传图像的位置:上传图片后,点击进入:然后,Midjourney根据图像返回四个描述:底部的四个数字是混合按钮,每个数字都与相应的描述相匹配。单击数字,Midjourney会根据新的描述重新混合图像。AI绘画神器Midjourney能够“看图说话”了_澎湃号·湃客_澎湃新闻-The Paper

答:

Midjourney绘画神器能够「看图说话」无疑是AI技术在图像处理和自然语言处理领域取得的重要成果。我认为这个发展有以下几个方面的影响:

给张图就能反推Prompt,AI绘画神器能够「看图说话」了,会比人类手写的更好吗?

更广泛的应用场景:有了看图说话的能力,Midjourney绘画神器可以在更多领域发挥作用,例如新闻报道、广告设计、社交媒体内容生成等。这将有助于推动AI技术在各行各业的普及和应用。

提高生产效率:借助Midjourney绘画神器,用户可以快速为图片生成描述,节省时间和精力。这将有助于提高内容生产的效率,使创作者能够更专注于创意思考和设计过程。

个性化体验:Midjourney绘画神器可以根据用户的喜好和需求生成个性化的描述,提供更丰富的用户体验。这将有助于吸引更多用户使用该工具,从而推动其市场推广和普及。

技术挑战与改进:虽然Midjourney绘画神器在看图说话方面已经取得了很大进展,但仍存在诸如准确性、逻辑性和一致性等方面的挑战。这些挑战将促使研究人员和开发者不断改进和优化模型,使AI技术在未来得到更好的发展。

给张图就能反推Prompt,AI绘画神器能够「看图说话」了,会比人类手写的更好吗?

总之,Midjourney绘画神器具备看图说话的能力是AI领域的重要突破,这将为相关行业带来便利,并推动AI技术的进一步发展。然而,我们也应关注其中的技术挑战,以确保AI技术在未来能够更好地服务于人类。