916 字
5 分钟
关于图片搜索,我想说的
2025-04-28

找图的方法与区别#

目前我所了解的搜图,无非两种办法:

  1. 人找
  2. 机找

人找很好理解,有认识这张图的人,看到了求助者发的图片,认了出来,找到了。在人足够多的情况下,这种方法是最好的,而且找起来很快,认识的人一眼就能看出来,但关键就是这个前提 - “人足够多”,没有前提就没法往下进行。

机找包括了各种工具和搜索引擎的查找,不管你是用什么,都是在庞大图片数据库的加持下实现的,什么强力的搜图算法都得要更强大的数据库,因为算法只是用来比较图片是否相似的,拿什么比较?足够多的图片啊!

所以对于不在数据库内的图片,搜索工具也没什么办法,毕竟工具又不可能给你临摹一张(或许未来能用 AI 实现)。

图片数据库从哪来#

那么图片数据库是怎么来的呢?也是存在几种方式,第一种就是“我”自己就是做图片相关产业的,比如 Pixiv,他自己是一个图片源头,保存了很多图片

第二种是搜索引擎这类的,他们是通过从一个网站的链接跳到另一个网站的方式(就像一张蜘蛛网)去收录网站,除了保存文字,还保存相关的图片,数据库就是从这种常年累月的收集中做出来的。

所以你能看出两种方法的区别了吗?方法一的数据是最全的,因为他本身就是一个图片站点,大家都用它发布图片。

而方法二是一个收集者,图 A 图 B 的页面有关联,那么他能收集到,如果图 C 页面“孤立无援”,他是收集不到的,所以搜索引擎等工具他能找到的图片有限

要注意,每一个搜索引擎收录的网站都不一样,所以他们的数据库也不一样,甲没有的图,可能乙那有。

关于动图#

对于动图,目前没有什么好的搜索方法,都是将动图转换为静态图进行的,因为对于算法来说,搜索动图等同于搜索很多张静态图,成本一下就拉高了。

所以动图、视频还是需要截取其中的一些画面去搜索,需要反复尝试,而且成功率没有静态图高,之前也说了,搜图是通过图片比对实现的,你截图出来的那一秒,可能别人没有截到过,或者截到了没有发上网,进不了数据库,自然就搜索不到

选择图片的讲究#

基于以上几点,搜图提供的图片是有讲究的:

  1. 算法比较图片相似度搜图,所以求助者提供的图片需要尽量完整、保持原样,越完整找到的概率越大
  2. 不要用“喧宾夺主”的图案遮挡,这会影响相似度比较
  3. 动图、视频需要多次截图尝试
  4. 可以换着搜索工具进行,尝试多种数据库

一些心得#

搜图不是一蹴而就的,原图搜索不到的情况很常见,这时候就需要你有好的眼力和推理水平,通过搜索结果判断和原图是否有关系(比如背景装饰、画风、衣物等),有什么关系,从而推导出来源。

关于图片搜索,我想说的
https://blog.erio.work/posts/关于图片搜索我想说的/
作者
Dupfioire
发布于
2025-04-28
许可协议
CC BY-NC-SA 4.0