您现在的位置: 首页 > 营销资讯营销资讯
你的数据正在被克隆?算法偷走的可不只是时间
发布时间:2020-09-01作者:青鸾传媒来源:全网营销点击:
声明:本文来自于微信公众号全媒派(ID:quanmeipai),作者:腾讯传媒,授权青鸾传媒转载发布。
限于技术本身的风险性和伦理悖论,克隆技术被严禁应用于人体实验,这些年,“克隆”这个词在公共场域很少被人提及,取而代之的是“人工智能”。但当今时代,对于个体的“数据克隆”却无时无刻不在进行着。我们的饮食习惯、穿衣品味、出行路线、身体健康状况等都正在以数据的形式被各类APP记录在案,算法甚至还能够通过点赞、评论等行为留痕判断并记录下个体的思想情感和性格特征。
每一个人都是行走的数据源,个体在网络上的所有行为都能够被互联网技术解构,再重组成为可识别、可抓取、可利用的数据图谱,从而为商业活动和个性化服务提供指导。毫无疑问,基于人机交互和算法的内容分发、商品推荐,正是构成移动互联网时代大众传播和电子商务的坚实基础。
但是,算法所带来的隐忧,也越来越多地引起公众的关注,人们惊奇地发现自己正在乐此不疲地刷着各类信息资讯,并在不经意间跌入到了信息茧房的陷阱之中;发现自己在私密交谈时被种草的商品如影随形地出现在网购APP的推荐页面里……让渡隐私以获得便利的事情,每天都在发生,算法偷走的,可不只是用户的消费时间。
或许,从悲观的角度来看,算法对个体数据的复刻所带来的争议并不比生物学上的人体克隆争议要小。本期全媒派(ID:quanmeipai)将从算法的偏见、信息“偏食”的代价和个人信息的权属争论等角度展开论述,抛砖引玉,试析大数据时代全面数据化的现实和被算法支配下的个体困局。总之,算法不是洪水猛兽,但它的风险点也值得反复论证、探讨。
算法的偏见是与生俱来的?
2016 年,国内一篇题为《基于面部图像的自动犯罪概率推断》的论文公开发表,该论文通过LR(逻辑回归法)、KNN(k近邻法)、SVM(支持向量机)和CNN(卷积神经网络)四种算法,对 1856 张人脸进行分析并发现罪犯普遍的面目特征。无独有偶, 2017 年,斯坦福大学一个研究团队发表了一篇题为《通过面部图像分析深度神经网络比人类更精准判断性取向》的论文,宣称该AI算法能够通过照片高准确率的识别出同性恋。
上述两项研究引发了巨大的争议,争议的焦点并不在于算法是否能够实现准确的预测,而在于致力于通过预测提供决策指导的算法,是否会增加或强化传统社会里普遍存在的歧视与偏见,比如上述人脸识别技术在识别犯罪潜质方面的不当科研应用便让很多“瞳距偏近、嘴角下扬、人中明显……”的普通人非常尴尬,让其感受到来自于大数据算法的恶意。
“算法以貌取人”的案例还告诉我们,大数据算法中包含着人的经验的投影,不可避免的带有“以偏概全”的风险。这并非是由数据模型的偏差所导致,而是因为在本质上,作为人类观察世界的表征形式之一,算法未超出对人类经验归纳总结的逻辑范畴,即“通过历史数据的训练,形成类的概念(或聚类或分类),然后对新对象进行归类,按类的集合属性,实现对新对象的特征预测”。
从这一角度来讲,算法的偏见是与生俱来的。国内大数据应用领域的专家学者周涛在《数据的偏见》一文中也明确指出,“让我们不安的是,因为系统设计人员带来的初始偏见,有可能随着数据的积累和算法的运转慢慢强化放大。”也就是说,大数据与算法不可能独立于人从而保持客观性,其会在人机交互的过程中从人身上继承偏见。
此外,在现实的应用场景中,数据样本偏差、算法模型设计缺陷、数据解读受人为干扰等因素都会导致或加剧算法的偏见,从而致使某一被大数据算法关照的标签群体受到不公平待遇。
例如,相关研究表明,Google的广告系统在推送工作招聘信息时,男性受到的高收入工作推送频率远高于女性;“查询被逮捕记录”的广告推送更倾向于推送给黑人群体。还有,我们在日常网购中遭遇的“大数据杀熟”无疑也包含着刻意的偏见。
算法让信息“偏食者”钻进茧房
就目前而言,算法在新闻传播上的一个基础型应用是资讯APP的个性化推荐。
人人有自己的关注点和信息圈层,是再正常不过的社会现象,因此信息“偏食者”的出现也不足为奇。在海量的资讯中找到自己偏好的信息,并据此量身定制一份个性化的资讯信息服务,是信息技术进步的表现,也是资讯过载的必然结果。
但是,人们的担忧在于,算法在内容个性化推荐分发方面的极致应用,或正在把信息的私人订制推入美国学者桑斯坦所提出的“茧房”悖论。
信息茧房的争议史几乎也是数字化媒介的发展史,此间,不乏有论者将致力于个性化资讯推荐的算法视为个体乃至整个社会信息“自闭”的罪魁祸首。显然,这种对待算法的敌视观点不够客观、有失公允。因为,作为独立个体的读者对于内容的选择和鉴别始终掌握着更大的主动权,其随时可以通过丰富阅读打破“茧房”禁锢。
不过,不能否认的是,算法的出现,确实让少数缺乏自制力的信息“偏食者”钻进了牛角尖。对于这部分懒惰的、选择用对信息的自主选择权换取便利的网民而言,算法很可能会越俎代庖,由信息适配者的角色僭越为对个人胃口了如指掌的信息投喂者。
在《新媒体用户研究