文章图片
文章图片
看到没有?只要保留线条 , 就算是简单的黑白线条 , 查重率还是 100%。 而且线条的数据量一看就比颜色小得多 , 处理起来更容易 。
知道要提取哪方面的特征之后 , 我们还得把特征量化成数字 。 咱们再来看看下面这张图 , 系统会先砍掉大部分色彩及尺寸数据 , 得到 32 * 32 像素的灰度图 。
文章图片
接下来 , 对这张黑白马赛克的线条特征进行一次信息提取 。
文章图片
可以看出来 , 线条部分像素灰度变化大( 红圈内 ) , 相同灰度像素点出现的频次较低 。
而大面积着色部分像素灰度变化小( 绿圈内 ) , 相同灰度像素点出现频次较多 。
根据这个特征 , 我们就可以对像素点进行一次重排 , 把出现频次低的像素点扔到左上角的位置 。
文章图片
这样一来 , 我们就可以用左上角的这些像素来表示这张图片的线条 , 这一下子又省事了不少 。
【特征|想防裸照被发,得先自己上传,脸书搞色色搞了个寂寞。】但这还不够 , 还得想办法把它变成一个字符串 。
处理办法也不难 , 系统会在这一步计算出这堆像素点的平均灰度值 。
像素点灰度低于这个平均值的计为 0, 高于平均值的计为 1, 之后我们就会得到一串字符串 , 它就是图像的二进制哈希值代表 , 当然 , 实际运用中还会继续换算成十六进制哈希值 。
文章图片
从图片变成一小段字符 , 数据比对的工作效率一下子就高多了 。
这项技术最早由微软与 Hany Farid 教授共同开发 , 如今已经发展得非常成熟 , 特别是在打击违法文件传播的工作中应用十分广泛 。
没错 , 如果有人用网盘传给你的远古色图被夹了 , 那一定就是这项技术的功劳 。
几个月前 , 苹果为了打击儿童色情犯罪行为 , 扫描用户相册使用的也是哈希技术 。 只要通过对比 CSAM ( 儿童性虐待材料 )数据库中已存在的哈希值序列 , 就可以检测用户手机中是否存在违规照片 。
文章图片
但它只能在广泛流传的文件中奏效 , 如果想用同样的方法毙掉网上的私密照片 ,不好意思 , 服务器上没有你裸照对应的哈希值 。
推荐阅读
- 硬件|纽约设计师展示“风力涡轮机墙”将发电变成一种美学特征
- 特征|顺网科技:公司算力具有海量、分布式的特征,目前来看符合元宇宙的需求
- 特征|百度获AR背景音频处理方法专利授权
- 数据|OPPO公开安全防护专利,可模拟危险对象的防护对象特征
- 特征|汉王科技:公司人脸识别及生物特征识别重点布局泛安防领域,目前以考勤、安防为主,并形成了智慧校园、智慧园区、智慧工地等解决方案
- 全球化|当今世界时势变化的八大特征
- 视点·观察|App适老化改造调研出炉:长辈喜欢的App有五大特征
- 化石|30万年前古人类面容复原!我国学者发现东亚最早具有现代人面部特征的人类化石
- 信号特征|中华白海豚各有“方言”
- 软件和应用|Explorer Patcher:让Windows 11恢复Windows 10的行为特征