如何找到重复的照片?

我可以用什么来查找重复的照片,包括已resize的照片?

的digiKam 通过软件中心安装

将所有照片添加到您的collections中。 在菜单中,选择“工具/查找重复项”。 这将在整个集合中查找重复项。

findimagedupes 通过软件中心安装

命令行工具。 在命令行上传递要比较的所有图像。

Geeqie (原GQview ) 通过软件中心安装

在菜单中,选择“文件/查找副本”。 拖放图像文件执行重复窗口。 您可以删除目录以递归方式添加其内容。 对于图像的视觉比较,下拉菜单中有特定的非默认选项。 “自定义”相似度允许仅将配对限制在最高相似度,但必须在“首选项”上设置为99.即使这样,它至少对于某些类型的图像也不能完美地工作,如线 – 艺术。 遗憾的是,它没有提供具有合理标准的自动选择机制,例如分辨率,日期等等,自动选择似乎只是随机选择第一个作为保留参考的图像。 删除许多图像可能会非常慢,因为它会尝试在每次删除时更新结果计数。


所有这三个工具都找到了可视副本,而不仅仅是字节相同的文件。

FSlint 安装FSlint

fslint是一个图形程序,可以通过md5sum查找任何类型的重复文件。 如果图像不相同,则不会将它们标记为重复。 下图显示了我的下载目录中的一堆重复的pdf文件:

在此处输入图像描述

您可以更改高级搜索参数以按文件类型搜索,并仅限制自己使用图像。 这是通过将“额外查找参数”更改为find命令选项来完成的。 例如,这里我只查找*.jpg文件(在同一路径中,只查看我的“下载”文件夹:

在此处输入图像描述

fdupes 安装fdupes

fdupes是一个基于命令行的等效工具。 两者都在回购中。

fdupes 安装fdupes

您可以使用名为fdupes的命令行工具来查找重复文件(有关详细信息,请参阅man fdupes )。 我不知道有任何方法可以找到已resize的“重复”。 执行此操作的程序将需要某种智能算法来分析图像内容,因为在调整图像大小时,其数据会发生变化,因此传统的重复查找方法将无法工作。

imgSeek 安装imgseek

imgSeek可以找到重复的以及类似的图片(因此它应该能够找到具有不同文件名和元数据的已resize的照片和照片),甚至可以根据草图搜索照片。 它有桌面和服务器版本。

不过,我实际上并没有尝试过。

dupeGuru图片版绝对精彩,值得一试。

他们有一个Launchpad PPA , dupeguru (新的一体化包)或dupeguru-pe (旧图片版包)可以使用这些命令从它安装:

 sudo add-apt-repository ppa:hsoft/ppa sudo apt-get update sudo apt-get install dupeguru 

Visipics

Visipics是一个免费的Windows应用程序用于该function,但在Linux上通过葡萄酒工作得很好(当然,它比geeqie / gqview关于重复项的排序更好(geeqie的结果绝对是“不可排序的”))。

您可以告诉它根据标准自动选择图像,例如较小的文件大小,非压缩类型,较低的分辨率(虽然它不会相反,但您需要手动执行,这不是比在geeqie上做得好得多,除了选择不需要按住Shift / Ctrl ),甚至优先考虑文件夹(但最后一个优先级是文件夹优先级)。

但是,您必须注意符号链接 – 它可以“随机”选择将符号链接保存到文件,同时将实际文件删除为“副本”。 真是太遗憾了。