【技术分享】百度云是如何识别出A片的? heatlevel heatlevel

myang  于 2016-5-31 20:29:15 |只看大图 回帖奖励 |阅读模式
41 13921
[color=rgba(0, 0, 0, 0.8)]如今网盘行业已经倒得差不多了,只剩下360云盘,百度云,华为云盘等等,而百度云里面大部分的XX影片都不能看了(不要问我是怎么知道的)百度云是如何识别出这类电影的呢?下面把话筒转向知乎大神↓
[color=rgba(0, 0, 0, 0.8)]————————————————–步骤1:数学筛选——————————————————–
[color=rgba(0, 0, 0, 0.8)]首先把百度云上的视频采样分析。例如每个片子截取100张图片,然后自动分析图片内容。
值得注意的是,自动分析黄片内容不是不可能的,例如:

[color=rgba(0, 0, 0, 0.8)]使用颜色特征分析来测量图片中皮肤的面积。。。然后确定是不是黄片。
[color=rgba(0, 0, 0, 0.8)]我听说黄片中的人物一般都不穿衣服,所以整部片子中皮肤面积会占屏幕比重比较大,特征明显。
[color=rgba(0, 0, 0, 0.8)]不过我是好孩子所以也不清楚到底是不是真的。

[color=rgba(0, 0, 0, 0.8)]然后用一些算法进行评分处理。。例如:

[color=rgba(0, 0, 0, 0.8)]通过皮肤的位置和分布分析是不是黄片儿:

[color=rgba(0, 0, 0, 0.8)]把图片特征量化,通过这些量化的数据进一步分析做到黄片的筛选。
[color=rgba(0, 0, 0, 0.8)]

[color=rgba(0, 0, 0, 0.8)]————————————————–步骤2:玄学筛选——————————————————–
[color=rgba(0, 0, 0, 0.8)]光通过数据分析不可能做到完美筛选全部黄片,但是本着宁可错杀一千不能放过一部的原则,我们可以通过实践(改变通过的变量)肯定找到一个能筛选出所有黄片的算法。这个算法可能误杀大量正(绅)常(士)视频,但是也能排除绝大多数非黄片。
[color=rgba(0, 0, 0, 0.8)]剩下来的糟粕可以进一步用机器学习来筛选。。
例如某同学的硕士毕业论文:
[color=rgba(0, 0, 0, 0.8)]当然,也可以跳过第一步直接上第二步,如果计算能力和精确度都不是问题的话。
[color=rgba(0, 0, 0, 0.8)]————————————————–步骤3:人工筛选——————————————————–
[color=rgba(0, 0, 0, 0.8)]最后剩下的交给他审核一下。。。
[color=rgba(0, 0, 0, 0.8)]
[color=rgba(0, 0, 0, 0.8)]
————————————————步骤4:举报机制——————————————————–
人人都是小小鉴黄师
比如这类AV。。。
就需要各位小鉴黄师们的努力了。


[color=rgba(0, 0, 0, 0.8)]当然,还有一种更神奇的方法。。检测音频中的叫床声。


| 57 人收藏
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    1727733811 发表于 2016-6-2 00:56:16 来自手机 | 只看该作者
    推荐
    anchangxin 发表于 2016-6-1 18:49
    全特么,主要是检测文件大小

    知道什么叫MD5吗?  通过已知的文件md5进行拦截就能做到屏蔽,但是弊端还是很大,通过修改文件的md5就能复活了,关文件大小没啥事。所有网盘都这么干的,还有关于“秒传”就是说,你一个10GB大的文件,一秒就上传完毕了,这也是通过md5来实现的,网盘上传时扫描
    你文件的md5对比已经存在网盘上的数据,如果如果一致,就从服务器存在的文件复制一份给你。
    回复 支持 5 反对 0

    使用道具 举报

    1316231028 发表于 2016-6-9 14:10:23 来自手机 | 只看该作者
    推荐
    回复 支持 3 反对 0

    使用道具 举报

    AresgGUO 发表于 2016-6-5 20:29:32 来自手机 | 只看该作者
    推荐
    是个鸡鸡我百度云里一堆片没一个给测到

    点评

    我怎么回被封  详情 回复 发表于 2016-8-27 13:16
    加我QQ私聊2757876088  详情 回复 发表于 2016-7-29 21:41
    回复 支持 3 反对 0

    使用道具 举报

    asdffdsas 发表于 2016-6-3 21:08:34 来自手机 | 只看该作者
    推荐
    回复 支持 3 反对 0

    使用道具 举报

    anchangxin 发表于 2016-6-4 09:16:20 来自手机 | 只看该作者
    推荐
    1727733811 发表于 2016-6-2 00:56
    知道什么叫MD5吗?  通过已知的文件md5进行拦截就能做到屏蔽,但是弊端还是很大,通过修改文件的md5就能 ...

    赞哦!但是改文件大小不是最有效的嘛?,嘿嘿,我知道那个什么md5,还有sha1,crc32。
    回复 支持 2 反对 0

    使用道具 举报

    waf923 发表于 2016-7-2 21:12:00 来自手机 | 只看该作者
    推荐
    用ES文件浏览器压缩后改扩展名就行了,比如一个文件123.apk压缩后得到123.apk.zip修改扩展名为123.apk.minecraft再上传就行了
    回复 支持 1 反对 0

    使用道具 举报

    Outsider22 发表于 2016-6-1 22:20:04 来自手机 | 只看该作者
    板凳
    回复

    使用道具 举报

    Josie 发表于 2016-6-3 14:06:25 来自手机 | 只看该作者
    5#
    回复

    使用道具 举报

    quhhhc 发表于 2016-6-8 20:44:39 来自手机 | 只看该作者
    9#
    回复

    使用道具 举报

    12345下一页
    版主

    5

    主题

    8

    帖子

    0

    积分
    常见问题 更多
      关注我们
    地址:上海市张江高科技园区达尔文路88号6号楼2楼 客服电话:021-51905998 联系电子邮箱:info@dalongyun.com
    抵制不良网络游戏,拒绝盗版游戏。 注意自我保护,谨防受骗上当。 适度游戏益脑,沉迷游戏伤身。 合理安排时间,享受健康生活。所有游戏:适合18岁以上使用。
    沪网文[2018] 2534-178号 沪公网安备31011502007990号 沪ICP备12049517号-5   经营许可证 沪B2-20180327 工商电子营业执照
    © 2010-2018达龙云电脑.All rights reserved.