正在被“全息”数据化的人

二、身体的数据化

用户“画像”这个词只是一个比喻,其实并不涉及“人脸”这样的身体部位,但随着移动终端、智能传感器等的发展,身体的数据化开始变得普遍。

四、行为的数据化

将用户的内容生产与消费、社交活动、电子商务、劳动,甚至日常活动等各方面的行为数据化,在新媒体时代越来越常见。

七、评价的数据化

在人被全面数据化的同时,数据化的评价机制。

今天,从画像、身体、位置、行为到情绪与心理、关系、评价,人的多种维度都有可能被数据化,甚至思维方式受到数据化的影响。

一、“画像”的数据化

对于网络服务的提供者来说,用户数据主要的使用方向之一,是对用户画像的描绘。

用户画像(persona)这一概念最早源于交互设计/ 产品设计领域。交互设计之父阿兰·库柏(Alan Cooper)较早提出了用户画像的概念,并指出用户画像是真实用户的虚拟代表,是建立在真实数据之上的目标用户模型。

用户画像的内涵主要包含三个要素,即用户属性、用户特征、用户标签。除交互设计外,市场营销、媒体等常常会使用用户画像这样的说法。但在传统时代,由于数据获取困难,以及相关技术的难度,使得用户画像往往是“群像”的,并且这种群像是粗略、模糊的。

在新技术的支持下,今天的用户画像,除群体、整体等层面的描绘外,要获取针对个体用户的、精准的数据画像已经变成可能。其目标为揭示用户的自然属性、个性特点、兴趣偏好、行为习惯、需求特征等,甚至有些画像还能揭示出个体的政治倾向、态度立场等。

从目前的个性化服务的角度看,用户画像常常以“标签”的方式呈现,个体用户身上打上的标签越多,就意味着对用户的了解越丰富。针对个体的算法,常常是针对这些标签进行特定信息或产品的推送的。当然,用标签的方式描述用户也有着局限性,因为用户的行为往往是综合的、变化的。离散的、静态的标签未必能完整反映一个复杂的个体。未来的智能技术、数据分析技术也会改善用户画像的获取方法,使其更精细、更具综合性与动态性,即在不同的目标下,产生不同的数据化画像。

二、身体的数据化

用户“画像”这个词只是一个比喻,其实并不涉及“人脸”这样的身体部位,但随着移动终端、智能传感器等的发展,身体的数据化开始变得普遍。身体或身体“元件”(身体的某个部分)的特征、身体状态等数据,正成为用户数据的重要构成部分。

用户本身在不断进行着身体的数据化。在数字空间的互动中,数据化的身体是一种普遍的表演手段。例如,人们通过照片或视频对身体进行记录。有时这种记录是为了证明身体在某个现实空间的在场,表达某种成就感,并赢得数字空间的存在感。数据化的身体表演,也是人的自我认同的一种方式。英国学者安东尼·吉登斯(Anthony Giddens)在分析身体与自我认同的关系时指出,常规性的身体控制对于个体在日常互动情境中维持自己的保护壳十分重要。要想成为一个有能力的能动者,不仅意味着要保持这样一种持续不断的控制,还意味着要让他人见证自己的状态。

身体以实践方式参与到日常生活互动之中,便是维持一个连贯的自我身份认同感的重要构成部分。对身体外形的控制能力展现了人的自我控制能力和意志力。以图片或影像进行的数据化的身体表演与展示,提供了新的身体表演方式,给“身体”带来了新的应对外部情景和事件的“实践模式”。即使人们的身体实体不能随时调节,但通过拍摄时的设计与后期美化,它们也可以更好地配合或回应外部的情境。

为了这种表演,人们会强化某些方面的行为。例如,健身。有时为了社交表演,人们会对手机中的身体形象进行美化,甚至让原始照片彻底消失,使得这个维度的数据出现失真。社交平台盛行的身体(包括容貌)的视觉化表演,加深了基于身体的社会比较与竞争。人们的身体焦虑、容貌焦虑日益加深。数据化表演带来了人们的相互模仿、相互传染,并且这种相互影响会延伸到线下。

人的某个“元件”被数据化,与人的身体分离,进入数字空间,是人的身体数据化的另一种典型方式。例如,人脸、指纹、声音等身体“元件”,对于网络服务商来说,获取这些数据化的身体元件,主要是基于服务的需要,如提高服务的便利性等。但这也给个体带来了隐私和安全方面的风险。从社会管理的角度看,对这些身体数据的采集,对于社会风险的发现与处置有一定意义,但这也会使个体处于更严密的监控之下。

可穿戴设备对身体状态的数据化,在未来将越来越普遍,特别是在健康、医疗领域将得到广泛应用。对于病人、老年人等特定群体来说,用可穿戴设备进行身体状态监测可以帮助医生及时发现身体的异常动向,尽早做出诊治。而对一般人来说,可穿戴设备带来的数据,将成为身体表演与调节的手段或依据。

可穿戴设备完成的身体数据化,往往要通过网络传递出去,于是身体与网络之间形成了更紧密的连接。当越来越多的身体连上网之后,所谓的“身联网”(Internet of Bodies)就会成为现实,影响身体的因素也会变得更为复杂。

三、位置的数据化

今天的用户是内容网络、关系网络及服务网络等多种网络上的节点,正如在网络上每一台计算机都可以由一个地址来表示一样。用“位置”来测量每个用户,可以更精准地定位到每个用户。个体用户画像与其节点位置的结合,可以使用户分析更为精准、深入。

一方面,移动用户的物理位置是一个自变量,它的每一个变化都有可能导致与之关联的内容、社交与服务目标的变化。对位置及运动轨迹的数据记录与分析是一些应用服务的依据,如打车类应用、健身类应用。

另一方面,运动轨迹在某些时候能反映人在某些方面的“属性”。在智能化的社会管理系统中,物理位置将是最受关注的个人信息之一,在一些特殊情境下,本应属于个人隐私的部分,被要求无条件“交出”“公开”。

今天的物理位置数据只是涉及地理位置这一变量,但未来随着可穿戴设备或传感器的普遍应用,还可以“测量”某一地点相关的多种场景变量,如空间特征、自然环境(如空气质量等)、社会情境等。这些变量的结果也会数据化。

除物理位置外,对用户位置的理解还可以体现在关系网络中的位置、服务网络中的位置等,这两种维度的位置的数据化,正在实践中得到应用。

四、行为的数据化

将用户的内容生产与消费、社交活动、电子商务、劳动,甚至日常活动等各方面的行为数据化,在新媒体时代越来越常见。对于服务提供者来说,用户行为的数据化是他们描绘用户画像,理解用户的社会位置、服务位置的重要依据,是构建与用户相关的算法的基础。

用户在数字空间中自主发布的内容,是对用户行为数据化的重要方式。自主发布内容的行为具有双重含义,一方面,这些内容在一定程度上反映着人们的现实行为;另一方面,内容发布本身又是一种虚拟行为。两种行为既有相关性,又可能出现一定的分离。虚拟行为既是对现实的真实反映,又是对现实行为的回避或遮掩。社交媒体的内容是反映现实还是回避、遮掩现实,这种选择又构成了另一种行为。用户发布的内容传达了人们的思想、观念、观点等精神层面的信息。这些内容是对用户行为分析时的一种主要数据对象。

人们的点赞、转发、评论等就是典型的被数据化、被分析的行为,对这些行为的分析甚至可以揭示出人们的性格等特征。互动行为数据外化着人们的个性特征,以及人们之间的关系。未来对这些互动行为数据的研究也将越来越多。

搜索数据同样是行为数据化的一种体现,它不仅反映了人们对信息的需求,还在一定程度上反映了人们的行为动向与现实状况,如当人们搜索某些景点的信息时,可能是他们要旅游出行的前奏;当人们搜索某种疾病的信息时,可能意味着他们或家人身体出现了问题。对众多用户搜索数据的总体分析,还可以辅助研究者进行社会情状与趋势的分析。这是大数据应用的一种方式。

另一种重要的行为数据是支付数据,支付记录不仅与消费相关,还与人们的活动场所、活动性质相关,它是日常行为轨迹的数据化投射。

当下人们在手机、电脑中输入的任何信息,拍摄的任何照片、视频,以及不想被记录的谈话和活动都是行为数据,它们更直接、深层地反映着人们工作、生活中的细节,甚至个人隐私。这些本应由个人掌握的信息,却有可能被某些应用或平台“偷走”,成为分析数据。

劳动行为的数据化,是行为数据化中的一种特别情形。对于那些主要通过数字平台进行劳动的劳动者(无论是内容生产这样的精神劳动,还是送外卖、送快递、开网约车这样的物质性劳动),其劳动行为的数据化,更是成为典型。平台不仅可以将其成果数据化,还可以将其劳动全程数据化,从他们的空间位置、运动轨迹到劳动进度、时效、评价等。

数据化将普通用户的行为转变为数字空间里的劳动。例如,当用户阅读行为通过数据统计构成流量数据,进而成为平台影响力的衡量指标,甚至影响到广告投放时,阅读行为就成了劳动的一种。在克里斯蒂安·福克斯看来,今天所有的数字平台的用户,实际上就是运输工人,而且是免费替大平台和广告商运输商品意识形态的工人,是一种数字劳动者1。

为了社会竞争的需要,数据劳动正成为一种新的劳动行为,特别是粉丝群体,为了让自己的“偶像”获得更好的数据表现——也是影响力的外在表现,粉丝们需要通过打榜等方式“做数据”。

进一步分析,建立在行为等数据基础上的算法会反过来控制、诱导人们的行为。这意味着行为数据成了一种控制的基础。

在数字空间之外,现实空间无处不在的摄像头,也在将人们的现实活动转变为数据化的记录。这些数据对人们现实行为的反映更为直接、完整,并且发出每一个行为的人,从相貌到身体都会被记录。商家、管理机构等对这些数据的应用及基于数据的控制,也在日益加深。

五、情绪和心理的数据化

随着技术的发展,将人的情绪、心理状态等意识层面的对象数据化,变得越来越常见。

在各种对社交媒体的研究中,用户情绪的分析是一个重要方向。研究者可以通过人们自主发布的内容来分析其情绪倾向,这既可以是个体的情绪,也可以是群体或整体性的情绪。这样的分析结果,往往可以以数据的方式量化。

而眼动仪、脑电仪、皮电传感器等设备,则通过采集与分析人的视线移动、脑电波、汗液等生理信号,将人隐秘的内心活动变成显在的数据,从而精准判断人的注意力指向、大脑兴奋程度等。以这种方式对情绪、心理的揭示,不仅能描述总体状态,还能反映动态变化的过程。

六、关系的数据化

今天的人置身于复杂的关系中,包括人与人、人与内容、人与服务、人与机器、人与环境的关系等,这些关系被越来越多地以数据的方式描绘、计算。

社会学的社会网络分析方法,就是将关系数据化的一种典型方式。它不仅可以反映关系的有无,还可以反映关系的方向,分析在关系基础上形成的权力结构,凝聚子群或社区等。今天在很多领域的研究中,这一方法都被借鉴。

而20 世纪末系统科学领域出现的复杂网络理论,虽然与社会网络分析一样都是以图论为基础的,但相比社会网络分析的静态社会学研究,复杂网络理论侧重于网络动态学的研究,反映的是网络结构的演化、网络结构与网络行为的互动规律。无论是社会网络分析,还是复杂网络分析,都是对关系的数据化研究。这些研究方法,被广泛应用于虚拟空间的关系描绘与分析上。

在利用数据描绘关系的基础上,通过数据分析包括算法去揭示、发现潜在的关系正变成可能。这不仅包括大数据常常强调的各种现象之间的“相关关系”的发现,还包括其他方法对人与内容、人与人等潜在关系的发现。数据分析正在推动着新关系的建立。例如,当内容与人被打上同样的标签时,算法会将该内容推荐给对应的人。当不同的人被打上同样的数据标签时,他们之间也会被标签连接起来。

数据不仅可以显示关系的有无,还可以将关系的亲密程度、依赖程度、重视程度等过去相对模糊的属性用数据方式量化,并且公开化。例如,朋友圈、社群里的点赞数、评论数就是对关系属性的量化与公开化,人们基于数据对关系进行判断、权衡并对关系维护策略进行调整将变成常态。

在一定意义上,数据让世界的关系变得更为多元,它揭示了一些过去不明显的关系,并建构了一些过去不存在的关系。但同时,数据又使得世界的关系变得单一,它抽离了原有关系的丰富属性,使各种关系变成数据能够表现与匹配的关系。

七、评价的数据化

在人被全面数据化的同时,数据化的评价机制——“评分”也在变得普遍

今天数字空间最典型的一类评价是个体之间的相互评价。从电商卖家—买家、快递员—用户、外卖骑手—用户、网约车司机—乘客,到内容平台的创作者—消费者,相互评价制度越来越普及,而这些评价基本上都是以“打分”这样的数据化方式呈现的。

个体间的相互评分,打破了过去单一的组织评价机制,每个个体都拥有了对他人进行评分的权力,每个个体得到的评价也都来自多元的主体。评分制使得评价结果更加明朗,易于人们判断、比较。相互评分制度的盛行,还使得社会互动中人与人的相互监督与约束变得突出。社会互动的结果被量化、记录、保存,成为信任或约束的依据。在社会关系与互动日益多元、复杂的情况下,个体间的评分制可以为互动提供信任基础。

另一类评价是机构对个体的评价。今天这种评价也越来越多地落实为“评分”。管理机构用评分来进行社会治理;用人机构用评分来进行用人选择;投资机构用评分来决定资金的投放。机构对个体的评分结果不仅是对人的状态、信用、能力的评定,也是权利、利益分配的基础。

当下无论是对人还是对其他事物的评价都在日趋数据化,数字拜物教因此盛行。这也是近年来受到越来越多关注的“内卷”的本质之一。基于简单的数据统计、比较,对各种工作、业绩进行考核,其结果往往带来数量上的水涨船高,考核指标不断升级,内部竞争也由此升级。另一方面,出于种种动因,在评分上造假、作弊难以避免,而对评分权力的争夺与垄断也将成为一些机构或平台的目标。

数据化评价是控制的一种方式,既包括个体间的相互制约,也包括平台或机构对个体的控制。有研究者指出,评分机制代表了一种规则理性化的趋势,利于现有法律(及背后的公共权力)和平台私人权力的扩张和强制执行,是对流动的社会规范的进一步确认、固定化和再生产的过程。但评分权力可能会造成道德与社会规范发挥作用空间的压缩,权力的实施方式更加深入和动态化。社会信用监管者能够进入以往传统权力所无法达到的“私人”领地,将行为人的私人空间(如心理状态、行为道德等)统统纳入社会信用系统的监管之下。这也意味着权力的越界。

这种评分机制,不仅会成为机构对个体的规训方式,也会成为个体间相互规训,甚至自我规训的方式。

八、思维方式的数据化

今天人的全面数据化,不仅是因为技术的发展,其背后还有“数据主义”这样一个大背景。在数据主义者看来,数据正取代原子、实体、物质,成为世界的新“基质”。数据遍布世界,世界可以还原为数据。一切事物、人、人际关系、文化、价值都可以还原为不同算法模式下的数据。1尽管数据主义受到学者们的普遍批评,但在现实中,数据的应用仍在不断推进,渗透到社会生活的各个方面。人的数据化正是这种渗透的典型写照。

在这样的背景下,数据化思维弥散在社会环境中,人们或多或少会受到其影响。尽管数据化思维在很多方面具有独特的价值且是对人的直觉、经验性思维的补充,但仍需要足够的数据素养作支撑。而普通人的数据素养普遍不足。有的人会将具有严格规程的数据应用、思维简化为数字思维、流量思维,只看简单的数据结果,并且容易被不科学、不准确的数据迷惑、误导。

一些拥有系统的数据思维与应用能力的人,可能会过于看重数据的价值,过于强调数据、模型等的意义,从而忽视其他思维方式的作用。当下算法思维正与数据思维结伴而行,在某些方面,形成对人的思维的限制与固化。

 

作者简介:彭兰,教育部长江学者特聘教授,中国人民大学新闻学院教授,博士生导师,中国人民大学新闻与社会发展研究中心研究员。入选教育部“新世纪优秀人才支持计划”和北京中青年社科理论人才“百人工程”。兼有计算机与新闻传播学专业双重学科背景,1997年开始从事网络传播的教学与研究,对网络传播有着透彻的理解,参与过大量的网络传播实践研讨,是我国最早从事网络传播教学和研究的学者之一。先后出版《中国网络媒体的第一个十年》《网络传播学》《网络传播概论》《新媒体用户研究——节点化、媒介化、赛博格化的人》《社会化媒体》等20余部专著或教材。


本文摘自《智能与涌现》,作者:彭兰

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年11月6日 14:58
下一篇 2023年11月6日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日