主题 : 头条、油条商标有多像:Python 检测发现相似度高达 98.4%
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605058
威望: 529687 点
无痕币: 65 WHB
贡献值: 0 点
在线时间: 62590(时)
注册时间: 2008-12-25
最后登录: 2024-05-18

0 头条、油条商标有多像:Python 检测发现相似度高达 98.4%

近日,一家名叫 “今日油条”的店铺,因被今日头条起诉而广为大众所知,就这样火了一把。

这家油条店可是把今日头条从里到外模仿的透透的,无论是 logo、配色还是标语都有着极高的相似度,远看还真让人以为是今日头条开了家油条店呢。
我们看着都眼熟,计算机就更看不下去了!
文摘菌把两家的 logo 放到一个图片检测的项目里一对比,二者的直方图距离计算结果不仅有着大部分重合,而且平均哈希算法告诉我,两个 logo 的相似度高达 96.9% (62/64),感知哈希算法计算出的相似度则更高,为 98.4% (63/64) 。

这回,数据直接为我们解答了为何今日头条要起诉这家油条店咯。
想知道文摘菌是怎么检测图像相似度的吗?继续看下去吧~
4 种算法对比 “头条”与 “油条”logo,相似度高达 98.4%
在本菌一番猛烈的搜索下,发现了 Github 上一个用 Python 检测图片相似度的项目 identify similar images :

在这个项目中一共提到了用 4 种算法检测图片相似度,分别是:直方图距离计算;平均哈希算法;感知哈希算法以及差异哈希算法。
文摘菌二话不说立刻下载了代码,迫不及待的想要上手尝试一番~
于是问题来了,首先要有两个大小一致的 logo,要尽量排除一些其他因素以保证结果的准确性。文摘菌在网上找啊找,没有特别合适的图片,于是找了一个相对清晰的今日油条网络图片,然后搬出了深藏的小学生 PS 技术,微调了一下图片的角度以及色调等,最终得到了这幅模样:

文摘菌尽力了 ...
然后又在网上找了一个今日头条的 logo:

接下来就是配置环境、跑代码啦,调试成功后,可以看到以下结果,这是利用直方图距离计算图片相似度的结论图:

从下图中的数据显示,根据图片直方图距离计算出的相似度约为 55.2%,不得不说这个算法得出的相似度确实不是很高。

放大直方图的话,可以看出一些细节的重合度确实差异较大。

但是,接下来利用平均哈希算法和感知哈希算法计算出的百分比就高多了。

除了差异哈希算法得出的结果不怎么理想,平均哈希算法、以及感知哈希算法计算出的图片相似度高达 96.9% 和 98.4% ,简直就是 “石锤”了~
计算机能把我们眼中的 “相似”、“眼熟”转化为准确的数据,让论据更加具有说服力,这大概就是数据的魅力吧~
如果有小伙伴对这个项目感兴趣,可以去 Github 上下载代码自己跑一跑,文摘菌在这里给出 Github 链接:
https://github.com/SkyeBeFreeman/identify-similar-images
级别: 十方秋水

UID: 88
精华: 0
发帖: 130120
威望: 221902 点
无痕币: 107420 WHB
贡献值: 0 点
在线时间: 51973(时)
注册时间: 2008-03-18
最后登录: 2024-04-25

又一精品。谢谢楼主。
Total 0.031981(s) query 5, Time now is:05-18 18:43, Gzip enabled 粤ICP备07514325号-1
Powered by PHPWind v7.3.2 Certificate Code © 2003-13 秋无痕论坛