![一个戴眼镜的女人,她的镜片里有电脑屏幕的反光。](http://www.jenniboo.com/uploads/2022/03/10/AI-tagging-scaled.jpg?auto=webp&width=1440&height=960.1875)
计算摄影技术目标是将耗时或乏味的任务自动化:调整场景中的灯光,替换平坦的天空,筛选数百张相似的照片.但对很多摄影师来说,分配关键词和写文字描述让这些动作看起来令人兴奋。
当我们看一张照片时,图像应该自己说话。然而在很多方面它都不能。我们与成千上万的数字图像库打交道,所以当我们在满屏的缩略图中扫描时,无法保证某一张特定的照片会出现在屏幕上。但人工智能可以提供帮助。
关键词、术语、描述词、短语、表达……
我怎么强调在图像中应用关键词的好处都不为过。有多少次你发现自己在翻阅照片,试图回忆你想要的照片是什么时候拍摄的?你有多少次跳过它们,或者意识到它们存储在另一个位置?如果这些图片包含关键字,通常可以在几分钟或更短的时间内找到这些照片。
挑战在于一开始就给照片加上标签。
在我看来,人们似乎落在关键字谱的两端。一方面是超描述性的方法,其思想是应用尽可能多的术语来描述图像的内容。这些可以分为层次和子类别和相关概念,以及各种迷人但晦涩难懂的杂项。
另一方面,我怀疑大多数人都是这样认为的:关键词是一种浪费时间和精力的行为。摄影师想要编辑,而不是分类!
这正是人工智能技术发挥作用的地方。许多应用程序使用图像检测来确定照片的内容,并在你进行搜索时使用这些数据。
![苹果照片中的人工智能功能截图](http://www.jenniboo.com/uploads/2022/03/09/Smarter7-01.png)
例如,在Apple Photos中,输入“向日葵”会弹出我库中包含向日葵的图片(令人费解的是,还有一张土豆泥的快照)。在每一种情况下,我都没有为图像分配特定的关键字。
同样,Lightroom桌面(更新的应用程序,不是Lightroom Classic)利用了Adobe唤醒当我在搜索栏中输入“向日葵”时,它会提示搜索结果。虽然我的一些图片被分配了关键词(在结果列表的顶部),它也建议“向日葵日落”作为一个术语。
![苹果照片中的人工智能功能截图](http://www.jenniboo.com/uploads/2022/03/09/Smarter7-02.png)
这很有帮助,但实现也相当不透明。Lightroom和Photos正在访问它们自己的内部数据,而不是创建可以查看的关键字。
如果你不用这两款应用怎么办?也许您的库在Lightroom Classic中,或者它存在于您在磁盘上创建的文件夹层次结构中?
用Excire Foto创建关键词
我拿了两个工具Excire看看他们会怎么做。Excire有意者是一个独立的应用程序,可以对照片进行图像识别,并生成我所说的那种元数据。Excire搜索2进行同样的操作,就像Lightroom Classic插件一样。
我在Exire Foto中加载了895张图片,它在短短几分钟内扫描并标记了图片。它在创建描述图像的关键词方面做得很好;以人为例,它区分了成人和儿童。您可以添加或删除关键字,然后将它们保存回图像或RAW图像的sidecar文件中。
![Excire Foto截图的AI工具。](http://www.jenniboo.com/uploads/2022/03/09/Smarter7-03.png)
因此,如果添加关键字的想法让你想站起来做几乎任何其他事情,你现在可以获得关键字的一些好处,而不做繁重的工作。
为图像生成“alt文本”
文字不仅仅是用来应用关键词和搜索照片的。许多盲人或视力受损的人仍然会在网上看到图片,他们依靠屏幕阅读器技术大声朗读内容。因此,在分享图片时,尽可能包含描述图片内容的替代文本是很重要的。
![在Instagram中添加alt文本的屏幕截图。](http://www.jenniboo.com/uploads/2022/03/09/Smarter7-04.png)
例如,当你在Instagram或Facebook上添加一张图片时,你可以添加alt文本——尽管如何添加并不总是很明显。在Instagram上,一旦你选择了一张照片,可以选择写标题,向下滚动到“高级设置”,点击它,然后在“辅助功能”下点击“写Alt文本”。
然而,这些都是额外的步骤,产生了障碍,使人们不太可能创建这些信息。
话虽如此,拥有Instagram和Facebook的Meta正在使用人工智能为你生成替代文本。在2021年1月的一篇博客文章中,该公司详细说明:Facebook是如何利用人工智能为盲人或视障人士改善照片描述的.”
![图片编辑窗口中叶子上的水的特写照片。](http://www.jenniboo.com/uploads/2022/03/09/Smarter7-05.png)
上面这张树叶照片的替换文本被Facebook描述为“可能是大自然的特写”,这在技术上是准确的,但并没有太大的帮助。
当画面中有更多特定的物品时,AI的表现会更好一些。在下面这张图片中——一张放纵的无人机自拍——facebook想出了“可能是两个人的图片,站着的人和路。”
![一张B&W的照片,两个男人在图像编辑窗口撑着一把伞。](http://www.jenniboo.com/uploads/2022/03/09/Smarter7-06.png)
另一个例子是微软正在进行的使用机器学习创建文本标题的工作。在去年的一篇论文中,研究人员提出了一种名为VIVO(视觉词汇预训练)用于生成更具体的标题。
因此,虽然有进步,但仍有很大的改进空间。
是的,请自动处理
当摄影师们面对AI可能以某种方式取代他们的概念时,他们会感到焦虑,但创建关键字、写标题和替换文本似乎并不适用于同样的方式。这是一个我当然乐意让机器承担部分工作的领域,当然前提是结果是准确的。