当前位置:网站首页 > 行业观察 > 正文

当你在互联网上看别人,别人也在大数据背后偷窥你

作者:中欧商业评论发布时间:2022-03-16分类:行业观察浏览:6186


    《3·15晚会》昨晚落幕,今年共曝光13起事件。低配的儿童智能手表成行走的偷窥器、免费WiFi暗藏漏洞、浏览网页就能泄露手机号......每个事件的背后真相都让人瞠目结舌。3·15晚会总导演尹文之前就透露过,今年晚会将重点关注网络信息安全和儿童互动产品的信息安全。

    

    无论有意还是无意,精确还是粗放,真实还是掺假,我们每天都在产生大量的社交数据,而数据科学家将人们的偏好与倾向一一解码,甚至能够描绘出完整的人物画像与社交图谱,其商业价值不言而喻。

    

    不过,美国亚马逊公司前首席科学家安德雷斯·韦思岸(Andreas Weigend)却从消费者角度提出,每个人都需要考虑如何让数据最好地为自己所用,在分享信息的同时也让自己充分受益于数据财富。

    

    为此,“数据素养”是这个时代的消费者必须具备的技能。最终,人们的生活不应由数据来驱动,后者的作用是帮助我们做出各种正确的决策。同时,身处数据革命的转折点上,更需要新的游戏规则的制定,以及新的权利关系的建立。

当你在互联网上看别人,别人也在大数据背后偷窥你

“数据素养”是必备技能


如今大数据仿佛已经成为一种信仰,不管是互联网公司、科技公司还是变革中的传统企业都是言必谈之。大数据是一种对数据海量集合的统称,对其来源并没有特别的划分,比如来自飞机涡轮发动机的大数据传输回终端之后,能预测其损伤以便及时维护,进而降低风险。不同于大数据,社交数据“取之于民”,是由人们产生和分享的,其中包括你本人的信息,运动、行为、兴趣,以及你与他人、地点、产品甚至意识形态之间的关系。

当你在互联网上看别人,别人也在大数据背后偷窥你

社交数据更不是仅适用于社交媒体。如果我们正在使用地图软件定位自己的位置,事实上就已经产生了社交数据,我们是在知情并且自愿的情况下去让软件获取我们的地理位置,以便获得更好的服务;还有些情况下,社交数据是被动分享的。不管如何,其总量是呈指数级增长的,你可以想象一下:2000年全年产生的数据总量在如今只需要一天就完成了,而预计到2020年,不到1个小时就能产生等量的数据。

事实上,许多商业形态正是因为社交数据而存在的。在中国,许多人可能以为大众点评仅仅是一个应用产品,然而其核心是一家数据提炼公司,它从用户那里获得数据,并将之提供给用户,方便后者做出决策。


数据的价值在于,该数据在多大程度上影响了人们的决策。即便知道了今天的PM2.5是多少,如果我原本也没打算外出,这个数据就没有任何价值。而对于一个准备外出的人来说,PM2.5数据就十分重要。在日常生活中,已经有许多决策活动十分依赖于社交数据了,甚至选择伴侣、工作地点与工作方式、药物治疗方案、学习方式和学习内容也离不开它。


“数据素养”是一种能力,它体现在电子商务公司会用数据预测我们的行为,银行用数据来评定我们的信用等级,雇主通过数据决定是否雇佣我们,但作为个体的我们却还没有充分从数据财富中受益。


每个公民都必须具有数据素养,我对此深信不疑。就像一个不懂中文的人在中国很难做任何决定一样,现在其实更多的人并不具备数据素养。首先,许多人可能并不知道数据本身的用途不大,只有经过数据服务商的收集、分析、比较、过滤呈现出的数据产品和服务才有真正的价值;人们还需要意识到,曾经留下的所有信息和痕迹,想要彻底删除都是完全不可能的,一定会被储存在什么地方。如果人们对此严肃以待,就会对各种公司对数据的处理有所准备。作为消费者,你就可以更加聪明地做决定。

现如今,数据服务商的推荐意见和分析结果对大多数的决策都有引导作用,所以必须摒弃被动型“消费者”的陈旧形象,就像传统意义上的推销狂人已经退出历史舞台、被数据科学家取代那样,我们更应该变成积极的社交数据创造者,了解数据服务商的工作机制,知道哪些参数可以改变或者不能改变,了解不确定因素,善于改正错误并且预测分享社交数据可能带来哪些结果。


具有数据素养,还意味着消费者做任何决定时都要在风险和回报之间做出取舍。虽然大数据可以将不确定性降低,但要做出选择的是你自己,所以能够更多更好地利用数据是一项必备技能。

隐私权是一种幻象


现在人们在互联网上的每个行为都会留下数字痕迹,一方面我们可能正在享受社交数据带给决策过程的便利,另外一方面又会感觉无处藏身,隐私成为一种焦虑和紧张的来源。

当你在互联网上看别人,别人也在大数据背后偷窥你

隐私权是技术于不久之前催生的一个概念,至少在当下的世界里,它并不是为生活在社交数据时代的人提供保护。任何义无反顾投入隐私权保卫战的行为都是不可取的。


20多年前,《纽约客》杂志曾经发表过一幅漫画,题目是“在互联网上,没人知道你是坐在电脑前面的一条狗”。而今天的题目应该是:“在互联网上,所有人都知道你是一条狗,戴着蓝色项圈,对猫感兴趣。你的主人正在度假”。为了免费又及时地联系亲朋好友以及远方的陌生人,我们甘愿把自己的生活公之于众,而社交数据平台为我们展示自己提供了前所未有的良机。

你可以去询问消费者,如果公开自己的数据能够得到更好的回报——更多有助于决策活动的个性化精炼数据——他们一定愿意放弃所谓的隐私。如果你提供的数据不正确,那么得到的产出可能就毫无用处;如果你希望多一点隐私权,就要付出效用降低的代价。举个简单的例子,想要亚马逊送货上门,就必须提供正确的姓名和送货地址等个人信息。


因此,在社交数据泛滥的世界里,旧有规则已经不再适用了,数据带来经济效益,也需要我们搭建新的框架,确定新的思想。隐私权不能够理想化,在数据稀缺、社区本地化和交流成本居高不下的时代也许可以做到,但现在更明智的做法是对当下的现实和未来制定规则。


数据公司其实并不能确保有关你的数据和你分享的数据都能为你所用,因此我们需要获得主动性,自由地决定数据服务商怎样使用我们的数据,这包括四个方面的掌控力:修正数据的权利、对数据进行模糊处理的权利、运用数据展开实验的权利和自主导入和导出数据的权利,而根据这四项开发相应的工具将改进数据服务商的信息产品与服务。


如果数据可能对你产生危害,那么修正数据的权利就变得特别重要,何况未来数据还会超出掌控范围,比如安装在公共场所的摄像头可以帮助评估你是否符合申请职位或贷款资格,你无法阻止这些数据产生,但你有将个人数据与之绑定的权利,并且无论你的数据是什么都应当有权修正,例如反驳、解释或者否认。

当然用户也有对数据模糊处理的权利,虽然数据越模糊,从数据服务商那里获得服务的个性化程度就越低,但人们依然有权提出条件,在不同时间和地点选择适合自己的个性化程度。就像叫外卖的时候,你肯定希望外卖能够送到你的家中而非其他人家里,因此会毫不犹豫地分享自己的精确位置,但是在其他情况下却不一定如此。

运用数据展开试验,就像数据服务商能够不断地对自己的设计、设置、排名和算法开展试验那样,能决定产品与服务对用户的显示排序,这些设置并不对用户开放,但用户需要拥有使用与调整现有设置的权利。


自主导入和导出数据的权利也是为了提高用户的主动性。你必须有能力解读自己的数据,可以要求数据服务商提供你数据的副本。个人的数据不应该被锁在数据服务商的数据库内,如果你能将其他来源的数据放在一起合并、比较、对比,就能从中获得更大的价值,而当这些数据涉及可信度与声望时,尤为显著。


最终,还是要让人类做人类擅长的事情,计算机做计算机擅长的事情,而非混为一谈。这些权利其实是让数据服务商的工作更加透明,让我们保持对重要问题的掌控——我们需要知道数据是怎样影响自己的决定的,而且我们有权独立做出每一个决定。

无处不在又无处可逃


无论是在亚马逊、谷歌还是在其他成功的科技企业中,都遵循着这样一个方法论:PHAME——也就是问题(Problem)、假设(Hypothesis)、行动(Actions)、度量(Metrics)、试验(Experiment)。这里面没有数据的影子,为什么?因为数据已经像空气一样无处不在了,而优秀的公司能够通过数据解决自己的问题。我出生在德国黑森林地区,很久以前,如果那儿的旅店中有水龙头就是一件了不起的事情,值得花大价钱放一块广告牌在路边大肆宣传,现如今已经没人这么做了,因为水龙头已经是一个基础设施。什么时候大数据、社交数据真正实现其价值?那就是当我们停止谈论它们的时候。


柏拉图在《理想国》中的有个洞穴故事:在长长的洞穴一样的地下室,被捆住手脚不能转头也不能走动。在他们的背后有燃烧着的火把,在火把和人之间,又有些别的人拿着各式各样的假人和假兽,在一堵墙的背后做出动作,而这些囚徒只能看到投射在墙壁上的影像,便将它们当做真实的东西了。


而现在我们的世界与那个洞穴并没有什么不同。有人已经提出像脸书或者谷歌对社会产生的影响,它们拥有的数据可以影响情绪,从而改变人们的决策。谷歌和脸书就是我们的光源,在浏览器上看到的东西就像是映在墙壁上的影像,虽然有些是真实的,但那仿佛已经是许多人能够见到的所有了。你可以选择相信,也可以认为自己被操控了,这完全都是个人意见。


一个例子就是美国的总统大选,有人指责这些硅谷的巨头,认为正是因为诋毁希拉里的谣言在这些平台上散布,导致了一位“不受欢迎”的总统的当选。不能否认的是,这些公司的确影响了人们对于这次美国总统大选的看法。当然了,在硅谷还有一些人在指责扎克伯格为什么没有在这次大选中好好运用脸书的影响力。试想,如果他为了支持他青睐的候选人而这样做了,有人有办法阻止他吗?