分享

计算摄影技术目标是将耗时或乏味的任务自动化:调整场景中的灯光,替换平坦的天空筛选数百张相似的照片.但对很多摄影师来说,分配关键词和写文字描述让这些动作看起来令人兴奋。

当我们看一张照片时,图像应该自己说话。然而在很多方面它都不能。我们与成千上万的数字图像库打交道,所以当我们在满屏的缩略图中扫描时,无法保证某一张特定的照片会出现在屏幕上。但人工智能可以提供帮助。

关键词、术语、描述词、短语、表达……

我怎么强调在图像中应用关键词的好处都不为过。有多少次你发现自己在翻阅照片,试图回忆你想要的照片是什么时候拍摄的?你有多少次跳过它们,或者意识到它们存储在另一个位置?如果这些图片包含关键字,通常可以在几分钟或更短的时间内找到这些照片。

挑战在于一开始就给照片加上标签。

在我看来,人们似乎落在关键字谱的两端。一方面是超描述性的方法,其思想是应用尽可能多的术语来描述图像的内容。这些可以分为层次和子类别和相关概念,以及各种迷人但晦涩难懂的杂项。

另一方面,我怀疑大多数人都是这样认为的:关键词是一种浪费时间和精力的行为。摄影师想要编辑,而不是分类!

这正是人工智能技术发挥作用的地方。许多应用程序使用图像检测来确定照片的内容,并在你进行搜索时使用这些数据。

苹果照片中的人工智能功能截图
Apple Photos找到了向日葵和土豆泥的照片。杰夫·卡尔森

相关:计算摄影解释:下一个图像制作时代已经到来

例如,在Apple Photos中,输入“向日葵”会弹出我库中包含向日葵的图片(令人费解的是,还有一张土豆泥的快照)。在每一种情况下,我都没有为图像分配特定的关键字。

同样,Lightroom桌面(更新的应用程序,不是Lightroom Classic)利用了Adobe唤醒当我在搜索栏中输入“向日葵”时,它会提示搜索结果。虽然我的一些图片被分配了关键词(在结果列表的顶部),它也建议“向日葵日落”作为一个术语。

苹果照片中的人工智能功能截图
我没有在这张图片中添加“向日葵”关键字,就像你在信息面板中看到的那样,但是照片识别出了这朵花。杰夫·卡尔森

这很有帮助,但实现也相当不透明。Lightroom和Photos正在访问它们自己的内部数据,而不是创建可以查看的关键字。

如果你不用这两款应用怎么办?也许您的库在Lightroom Classic中,或者它存在于您在磁盘上创建的文件夹层次结构中?

用Excire Foto创建关键词

我拿了两个工具Excire看看他们会怎么做。Excire有意者是一个独立的应用程序,可以对照片进行图像识别,并生成我所说的那种元数据。Excire搜索2进行同样的操作,就像Lightroom Classic插件一样。

我在Exire Foto中加载了895张图片,它在短短几分钟内扫描并标记了图片。它在创建描述图像的关键词方面做得很好;以人为例,它区分了成人和儿童。您可以添加或删除关键字,然后将它们保存回图像或RAW图像的sidecar文件中。

Excire Foto截图的AI工具。
Excire Foto分析了选定的图像,并提出了描述照片各个方面的关键词。杰夫·卡尔森

因此,如果添加关键字的想法让你想站起来做几乎任何其他事情,你现在可以获得关键字的一些好处,而不做繁重的工作。

为图像生成“alt文本”

文字不仅仅是用来应用关键词和搜索照片的。许多盲人或视力受损的人仍然会在网上看到图片,他们依靠屏幕阅读器技术大声朗读内容。因此,在分享图片时,尽可能包含描述图片内容的替代文本是很重要的。

在Instagram中添加alt文本的屏幕截图。
上面展示了如何在Instagram上添加alt文本。杰夫·卡尔森

例如,当你在Instagram或Facebook上添加一张图片时,你可以添加alt文本——尽管如何添加并不总是很明显。在Instagram上,一旦你选择了一张照片,可以选择写标题,向下滚动到“高级设置”,点击它,然后在“辅助功能”下点击“写Alt文本”。

然而,这些都是额外的步骤,产生了障碍,使人们不太可能创建这些信息。

话虽如此,拥有Instagram和Facebook的Meta正在使用人工智能为你生成替代文本。在2021年1月的一篇博客文章中,该公司详细说明:Facebook是如何利用人工智能为盲人或视障人士改善照片描述的.”

图片编辑窗口中叶子上的水的特写照片。
facebook自动生成的alt文本在识别上面照片中的内容方面做得不错。杰夫·卡尔森

上面这张树叶照片的替换文本被Facebook描述为“可能是大自然的特写”,这在技术上是准确的,但并没有太大的帮助。

当画面中有更多特定的物品时,AI的表现会更好一些。在下面这张图片中——一张放纵的无人机自拍——facebook想出了“可能是两个人的图片,站着的人和路。”

一张B&W的照片,两个男人在图像编辑窗口撑着一把伞。
该图像的alt文本更准确一些,尽管文本仍然没有完全描述图像。杰夫·卡尔森

另一个例子是微软正在进行的使用机器学习创建文本标题的工作。在去年的一篇论文中,研究人员提出了一种名为VIVO(视觉词汇预训练)用于生成更具体的标题。

因此,虽然有进步,但仍有很大的改进空间。

是的,请自动处理

当摄影师们面对AI可能以某种方式取代他们的概念时,他们会感到焦虑,但创建关键字、写标题和替换文本似乎并不适用于同样的方式。这是一个我当然乐意让机器承担部分工作的领域,当然前提是结果是准确的。