数据的六大经济特性

从中观层面看,各类平台企业汇聚起海量的市场主体经营数据,例如电子商务平台汇聚了入驻商户的高频经营数据,就可以实时感知行业态势、市场冷暖。

只要消费者开始使用智能终端、浏览各类业务,自然就会产生用户注册数据、上网痕迹数据、支付交易数据等,并存在终端上、沉淀在平台企业的大数据中心上。

数据是可以长期存储的,但蕴含的经济价值不是一成不变的,而是快速贬值的,因为数据只是记录了历史,在瞬息万变的世界里,历史数据对当下的商业决策价值有限。

当今时代,数字化转型快速推进,线上线下深度融合,带动数据量保持指数级增长。借助算法分析数据资源、优化商业策略、提升经济效率,已成为商业常态,数据作为生产要素和战略性资源的地位日益凸显。要充分释放数据要素价值,就必须深刻理解数据的经济特征。

数据仅是客观记录,只有被开发利用才能带来经济价值。

数据只是对客观事物的性质、状态以及相互关系等进行记载的符号组合。在数字化时代,数据以“0”或“1”的二进制字符串存储在磁盘、硬盘、光盘等存储介质上,如果没有对应的数据编码规则,这些“0”或“1”的字符串并没有特定含义。

但是,数据一旦被定义或编码,例如与物理世界的人类、市场主体、自然环境等具体事物、对象或应用场景一一对应起来、关联起来,就会被赋予特定内涵,就会蕴含“信息”。再进一步,深入挖掘“信息”背后的事物规律、发展趋势或深刻洞见,就可以提炼升华得到“知识”。

按照经合组织的观点,如果只拥有海量数据,而没有数据挖掘、分析和萃取提炼能力,则会形成“信息过载”;只有当数据被转化为信息或知识,并辅助预测、支撑决策或指导实践之后,才能释放出其蕴含的潜在经济社会价值。

数据开发利用在经济社会发展中的作用日益突出。随着智能手机的广泛普及,机器人、传感器在各行业的规模化部署,数据量积累越来越大。从微观层面看,通过整合来自各方面的数据,市场主体可对客户进行更加精准的“画像”、洞察其行为特征和需求偏好,提供更具个性化的营销方案、更加定制化的产品和服务,从而进一步增强吸引力和竞争力,形成“正向反馈”。

从中观层面看,各类平台企业汇聚起海量的市场主体经营数据,例如电子商务平台汇聚了入驻商户的高频经营数据,就可以实时感知行业态势、市场冷暖;工业互联网平台汇聚了产业链上下游生产供销数据,就可以推动制造业和服务业的深度融合,发展协同化设计、远程交付和预测性维护等新兴生产性服务业。

从宏观层面看,大数据与实体经济的深度融合,衍生出一大批数据采集、清洗、建模等新兴增长点,提升了全要素生产率,是实现经济高质量发展的关键驱动力之一。

数据不是稀缺的,多数是非竞争性、非排他性的,可被重复采集,很难被垄断。

与传统生产要素如土地、资本等具有稀缺性相比,数据要素的最大区别在于它不是稀缺的。包括手机、智能可穿戴设备等在内的消费终端设备以及机器人、生产线等工业装备,都开始具备采集和处理数据的能力。

只要消费者开始使用智能终端、浏览各类业务,自然就会产生用户注册数据、上网痕迹数据、支付交易数据等,并存在终端上、沉淀在平台企业的大数据中心上。同理,只要数字化的联网装备开机运行,就会不停地产生装备状态数据、生产进度数据、故障报警数据、采购销售数据等。

从统计来看,全球数据量每年增长27%左右(来源:IDC,2018),或者说每4年新增加的数据量,都会超过人类有史以来积累的数据量总和。近年来,多国政府还免费开放了大量公共数据,这些数据可被各方下载和开发利用。从这个意义上讲,很多数据都是非竞争性、非排他性的,某些数据被某个市场主体采集后,无法阻止其他主体采集类似数据,只要符合法律规定就可以。

数据不是规模报酬严格递增的,不同来源的异质性数据往往更有价值。

数据所蕴含的信息价值,既与数据总量有关,更与数据来源的多样性、互补性有关。以推断消费者的需求偏好为例(目的是精准投放广告),在算法给定的情况下,增加样本数据规模,的确有助于更加精准地刻画出用户消费习惯,但样本数据量的进一步增加,对于分析用户消费习惯的边际贡献越来越小。

以搜索引擎业务为例,勒纳(Lerner)研究发现,当用户输入搜索关键词时,搜索引擎企业会匹配返回多页搜索结果,但只有用户实际点击的那些记录才更有价值,因为这有助于了解用户诉求,改善广告定向投放的精准度,不过,用户搜索记录增加带来的边际改善却不断下降。

相比单一性的数据量增长,来源多样化的数据可揭示出更加丰富、更多维度的高价值信息,即数据的范围经济效应要更为明显一些。例如,身份数据能反映个人特征,位置数据能反映消费者所处地点,支付数据能反映交易金额,将这些数据汇总起来形成用户数据“档案”,平台企业可更全面了解用户,进而优化市场策略或促销计划,加快向相邻市场拓展。

数据在功能上不是高度差异化的,来源不同的数据往往是可以相互替代的。

用户在使用互联网服务过程中,时刻“留下”自己偏好方面的“蛛丝马迹”,这些数据并不是高度差异化的。一方面,不同市场主体掌握的用户数据很多是相同的。例如,用户要使用网络服务,就需要向宽带企业提供用户身份、联系地址、上网日志等信息;要使用平台服务,就需要下载注册对应的移动应用程序(App),这些App运营企业可能掌握用户身份、地理位置、上网终端、App记录等数据。

显然,各家掌握的用户数据大同小异,区别仅在于各自的用户规模和数据量大小不同而已。另一方面,不同平台掌握的用户数据似乎迥然不同,但在“用户画像”方面,却是高度趋同的。Graef(2015)发现借助用户搜索记录“交叉复现”特定用户群体的音乐偏好结果,与利用社交记录揭示出的音乐偏好结果基本相同。这意味着使用不同数据也可实现相同功能。

Lerner(2014)发现在提升广告精准化方面,亚马逊收集到的用户购物记录数据与谷歌拥有的搜索记录一样高效。简言之,从商业目的来讲,不同数据源可以提供几乎相同的洞见,至少在功能上是具有潜在替代性的。

数据是具有时效性的,其蕴含的经济价值往往随时间而快速贬值。

数据是可以长期存储的,但蕴含的经济价值不是一成不变的,而是快速贬值的,因为数据只是记录了历史,在瞬息万变的世界里,历史数据对当下的商业决策价值有限。数据贬值的速度主要取决于数据类型、用途和具体业务场景。

Statista对谷歌广告数据研究发现,那些仍未经加工的原始数据中,有70%的数据超过90天就会过时。据谷歌披露,用户每天搜索的关键词、搜索结果记录中,有15%是新出现的,这就要求滚动纳入这些最新的搜索记录,唯此才能贴合当下用户关切的搜索需求。

比如,用户毕业前的消费记录只反映了就学期间的购物偏好,一旦工作上岗,再利用之前的数据来定向促销,其精准性就大打折扣。鉴于新模式新业态层出不穷,用户喜好快速变化,历史数据在科学研究方面或许有价值,但在指导即时决策方面的价值,往往要比预期低很多。从这个意义上讲,在位者即便积累或垄断了海量数据,其优势也是有时限的,难以长期保持。

数据既不是决定企业成败的充分条件,也不是必要条件,重要的是要提高数据分析处理能力。

数据只是一种生产要素,要释放数据价值,就必须与劳动、资本、技术等其他要素相结合。纵观国际上一流平台企业的成长历程,绝佳的商业创意、天才的工程师团队、优秀的算法以及对消费者痛点的洞察等,都是关键影响因素,其重要性甚至要比数据更高。

一方面,有数据优势的企业不一定就具备竞争优势。例如,在为电子商务平台吸引了海量用户和店家,积累了丰富数据,然而社交电商、直播电商、跨境电商等新进入者的挑战,使其市场份额正在被侵蚀。在网络效应极强的社交应用上,Myspace 虽积累了海量数据、先发优势突出,Facebook却后来居上。

另一方面,没有数据,也不一定就处于先天劣势。一些初创企业拥有绝佳的创意,诸如在线预约出租车、在线点餐、视频社交等,其App一经推出,就受到用户青睐,迅速沉淀起海量数据。总之,企业拥有数据只是具备了潜在优势,但能否转换为市场优势,还要看与管理、投资、劳动、技术等其他要素配置效率的高低。


注:本文节选自国务院发展研究中心企业研究所《数字平台的发展与治理》(中国发展出版社,2023年),有删减修改。

本文来自微信公众号:腾讯研究院 (ID:cyberlawrc),作者:马源(国务院发展研究中心企业研究所副所长、研究员)、路嘉明(中国人民大学经济学院博士研究生)、方燕(浙江省北大信息技术高等研究院研究员)

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年1月8日 18:07
下一篇 2024年1月8日 19:24

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日