zoukankan      html  css  js  c++  java
  • 真的有人在偷听我们讲话么?

    阅读本文大概需要 3 分钟。

    作为互联网的忠实用户,我们在生活中已经很难离开它,随之而然也出现很多相关的问题,其中最让人头疼就是隐私问题。前有 12306 数据贩卖,今有传闻美团饿了么在偷听我们讲话,显然大家已经被以前各种隐私暴露的事情吓怕了。

    前几天,就有这么一档子事儿,一些媒体进行跟风报道:

    通过模拟使用场景,对安卓手机、iPhone 和 iPad 上的饿了么和美团外卖进行多轮测试后发现,谈话提及某种食物后,出现相关推荐的概率高达 60% 到 70%。还有的用户说,在刚谈到想吃什么后,打开外卖 App 就可见到对相关店铺的推荐,疑似出现 App 麦克风「偷听」。

    不少用户看到这种新闻,都会一下子惊到,纷纷说他们自己也碰到过类似情况。

    更有甚者是这么说的:我有一次想买一本书,都没跟别人说过,后来突然淘宝就给他推荐了那本书。

    还有个妹子是这么说的:我和男朋友分手两个月,打开淘宝,竟然给我推荐了 ziweiqi !难道以前我跟男朋友晚上那个,淘宝也偷听了!细思极恐!

    类似的非常之多,大体上就是前面刚跟朋友说想吃什么,后脚点外卖发现外卖上就推荐了这家;前面刚说想买什么东西,后脚淘宝就给你推荐了这个商品。这档子事还直接排到了热搜,并在热搜榜待了很久。

    不过,说美团、饿了么等 App 监听聊天内容,是实话太扯了,冒着那么大的风险分析用户语音聊天信息,就为了给用户推荐一份二三十块钱的外卖?我都要感动哭了(前两天简历大数据公司被端的消息还热乎着呢)。

    虽然逻辑上不太对,但是网友并不都从逻辑的角度出发去考虑问题,他们大多数人并不懂技术,但也有人是懂一些技术的,比如,有的人就会拿安全专家的话来证明:安全专家说,这种技术现在是可以实现的。 既然,可以实现,美团饿了么们就有可能会用,公司都是以利益驱动的。

    安全专家都说可以了,那美团、饿了么这一类的外卖软件、淘宝这一类购物软件会放过这么好的机会?绝逼 24 小时监听自己手机发出的声音,然后进行分析,然后给他们做推荐。

    你过去一段时间每天吃什么他们都知道,再通过监听你说话的声音,为什么这个推荐准确率才不到 70%?这技术不太合格啊。要是给我一个人连续几个月的外卖点单记录,不用那么高深的技术,通过一些常规的推荐方法,也有把握对一大部分用户命中 80% 以上。

    美团、饿了么们既然都掌握了用户的餐饮记录与习惯,只需要不断优化自己的算法就行了,再分析语音记录有什么意思呢?

    有些杠精可能还不服气,那从技术角度来思考下:

    1. 技术上能实现麦克风监控,当我自己安装这类软件的时候也不许使用麦克风的权限吧,一般涉及到语音输入这块才会向你发出申请,你还可以不授权,那么没权限,它还怎么监控呢?Android,iOS可不是摆设。

    2. 光做监控还不行,语音这东西电脑是不认识的,那么就还需要把这些监控到的语音进行处理,将其转换为文字,再从文字里面提取有效信息。这语音识别的复杂度不低吧,毕竟百度、阿里、讯飞这些东西挤破头的进来搞。还会涉及到识别准确率,网上是说能有94%-98%,这还是在实验环境,生产环境不得而知,不过不可能比实验环境要高。

    3. 我去查了一下,中国有 10 亿多的 4G 用户;美团外卖月活 2千万+,饿了外卖月活 7千万+,按照这个月活,注册用户肯定是上亿的。那么监控的设备数,以及收集的数据量是海量的,先不说平台方面,就说用户方面。手机正常使用的是接近 CD 音质,128kbps , 1.0 MB/分钟 。1 小时为 60 分钟,那么录音 1 小时,就是占用60MB容量,24 小时就是 1440MB,它怎么在不被你发现的同时,将这 1 个多 G 的数据上传至平台呢?

    说了这么多把他推翻了,那到底上面别人说的那种情况是怎么产生的啊,毕竟热搜榜也不是那么好上的。

    第一个就是巧合了,根据你的点餐习惯,给你推荐一些类似的,很正常。第二个就是外部信息,平台从其他途径拿到你的相关信息,在根据推荐算法给你推荐,估计 ZFB 连你祖宗八代都能分析出来。最后一个就是个性推荐,在大数据的环境下,分析出来的结果,能准确戳中你这个群体的喜好。

    监控这件事情实际上存在巨大的法律风险,而且从现在技术来看,整个一套流程实现起来还是很困难的。所以暂时没必要担心这些软件监听你的事情,如果真的担心,在下载安装软件的时候,把麦克风权限关掉就好了。

    ·END·

    程序员的成长之路

    路虽远,行则必至

    本文原发于 同名微信公众号「程序员的成长之路」,回复「1024」你懂得,给个赞呗。

    微信ID:cxydczzl

    往期精彩回顾

  • 相关阅读:
    PV、UV、GMV
    保存Hive查询结果的方法 insert overwrite 用法
    Hive substr 函数截取字符串
    HIVE中join、semi join、outer join
    Hive 差集运算
    gitlab和github区别
    前端工程化 ESlint 配置
    ES6 WeakMap Map 区别
    js 创建数组方法以及区别
    eslint for...in 报错处理
  • 原文地址:https://www.cnblogs.com/gdjk/p/10605747.html
Copyright © 2011-2022 走看看