对这个反直觉现象,诺奖得主说错了,NBA球星却说对了

NBA球员的场上表现与条件概率

无论科学家如何说,大多数篮球球迷一直相信热手效应,这甚至反映在《NBA嘉年华》(NBA。

米勒和桑朱尔乔认为,为热手效应构建数学模型,对应的不仅是随机投掷硬币得到的正(H,对应投篮命中)、反(T,对应投篮未中)序列,还要考虑正正(HH,连续得分,有手热征兆)和正反(HT,得分后再投未中)。twitter.com

热手效应的影响

对热手效应的研究,不仅仅关乎NBA和篮球比赛本身。

Go with the hot hand.

——篮球爱好者的一句口头禅

在返朴3月的文章《那个曾经随时可能失明的少年,刚刚获得数学界最高荣誉》中,有一道用于展示概率是如何反直觉的思考题:

假设稍后要掷硬币100 次——可以给出一系列正面(H)和反面(T)的序列。

现在你有选择权,可以选择积分规则。

规则A:对于序列中的每个HH,你都会得到一分;对于每个HT,对手都会得一分。

规则B:反过来,对于序列中的每个HH,对手都会得到一分;对于每个HT,则你得一分。

比如说序列片段HHHT,按A规则就是你得2分,对手1分。

问:为了积分高于对手,你应该选择哪条规则?又或者说,两条规则的获胜概率是一样的?

在文末,笔者指出答案是B。因为HH和HT的数学期望虽然是一样的,但是得分分布不同。此时前者过于集中(3个H得2分),导致它的胜率变低。

从各平台的评论区反馈来看,很多读者朋友对这个结果抱持怀疑的态度。这其实是可以理解的。

3月18日,多伦多大学的数学系助理教授丹尼尔·利特(Daniel Litt)在社交平台X(原twitter)上发布了一则投票贴,其内容正是上面那个问题。在短短2天的时间里,这个投票获得了百万浏览和近500的转评。要知道,丹尼尔并不是什么网红,他平时会和一些数学爱好者或同行互动,分享一些相对硬核的数学内容——也就是绝大多数网友丝毫不想看的内容。所以,他的帖子通常只有个位数的转评,而这一贴的热度之高完全出人意料。

在参与转发和讨论的人中,有图灵奖得主杨立昆(Yann LeCun),金融概率科学畅销书《黑天鹅》的作者纳西姆·尼古拉斯·塔勒布(Nassim Nicholas Taleb)等知名学者。很多人都给出了自己的分析。

24小时后投票人数已达5万,虽然仅有10%的人答对。

多伦多大学数学系助理教授Daniel Litt发起的概率问题投票截图|图源:littmath@twitter.com。

我们当然可以为这个概率问题奉上严密的数学论证,但恐怕这也不是大多数读者“想看”的内容。况且,如此埋没这个问题的现实背景,实在是大煞风景!毕竟,用NBA和NCAA赛场上球员的状态来理解数学模型,要形象具体得多,也更有趣。

《黑天鹅》的作者纳西姆·尼古拉斯·塔勒布编程模拟硬币投掷结果|图源:nntaleb @twitter.com

“疯狂三月”和热手效应

4月9日,NCAA“疯狂三月”全美锦标赛决赛,康涅狄格大学以75:60大胜普渡大学。康涅狄格大学的篮球校队6次打入NCAA决赛,6次夺冠!

NCAA(全国大学体育协会)是由美国和加拿大一千多所大学院校参与的体育运动协会。它举办各种体育项目的联赛,包括篮球、橄榄球、棒球、冰球、田径、体操、摔跤等。其中,最受关注的是NCAA男子篮球一级锦标赛,这项赛事每年3月举行,通常称为“疯狂三月”。该赛事吸引了大量观众和运动员,成为美国大学生最重要的盛会之一。包括NBA在内的赛事直播,都会避开疯狂三月里的重要赛事。国内也有非常多的球迷每年追看这一赛事。

许多球迷一定还记得斯蒂芬·库里(Stephen Curry)在2008年NCAA上的超人表现:他带领弱旅戴维森学院(Davidson College)取得胜利,同时在下半场几乎以一己之力击败了强大的冈萨加(Gonzaga)队。成就年轻库里的,是他的技术、运气,还是那天他有什么特别之处?

几乎每个篮球运动员、教练或球迷都认为,一些球员有一种不可思议的热手效应(hot-hand effect)——有人认为那就是现在更为出名的ZONE状态或心流状态。

热手,基本上是说,球员会进入一种特殊的状态;在这种状态下,他们的个人球技和视野达到顶峰,投篮如有神助。历史上像克雷格·霍奇斯(Craig Hodges)连续命中19个三分球,或已成为金州勇士队控球后卫的斯蒂芬·库里在练习中连续投中105个三分球,篮球评论员通常会将其归因于“手感来了”,“手热起来了”。

用一些NBA球员的说法:你意识到,你的身体是协调的,你的思想是专注的,你情绪是自信的——因此成功是不可避免的,把球投入篮筐,简直毫不费力。

然而,甚至就在NCAA的官方网站上,长久以来对热手效应的解释是:并不存在。那只是一种错觉,因为我们作为人类有一种把随机性片段当作是内在模式的倾向。事实上,在过去的30年里,研究行为和决策的科学家一直持有这种观点。

不久前刚刚去世的诺贝尔经济学奖得主丹尼尔·卡尼曼(Daniel Kahneman)曾直言:“热手效应是一种巨大而普遍的认知错觉。”

丹尼尔·卡尼曼被誉为行为经济学之父,他的畅销著作《思考,快与慢》是引领无数人反思自身的决策方法和思考方式的启蒙读物。像卡尼曼这样声名卓著的学者绝非信口开河之人,他的论断来自心理学家托马斯·吉洛维奇(Thomas Gilovich)、罗伯特·瓦隆(Robert Vallone)和阿莫斯·特沃斯基(Amos Tversky)在1985年发表的具有里程碑意义的论文《篮球赛中的热手:关于随机序列的误解》[1]。这篇论文有时以三位作者的姓氏首字母GVT指代。

在研究NCAA历史上的投篮数据时,GVT发现,投篮命中和未中的出现次序与反复掷硬币看到的正面和反面的顺序一样,是无法区分的。

就像赌徒在掷硬币时偶尔会出现连续的正面一样,篮球运动员在投篮时也会偶尔连中。GVT得出的结论是,热手是一种“认知错觉”;人们倾向于在随机性中“识别出”规律,将完全典型的随机现象视为非随机现象。

从此,学术界将热手效应定性为“热手谬误”。

更重要的是,GVT发现,职业从业者(NBA球员和教练)不仅是认知错觉的受害者,而且他们对热手的信念是顽固的。在NBA的关键比赛里,教练和球员倾向于把投球机会让给看起来手热的球员。

GVT的结果对心理学家和经济学家如何思考信息决策产生了深远的影响。随着GVT的结果被外推到篮球以外的领域,热手谬误成为一种文化模因。从金融投资到电子竞技,均有所反映。

但,真的如此么?

NBA球员的场上表现与条件概率

无论科学家如何说,大多数篮球球迷一直相信热手效应,这甚至反映在《NBA嘉年华》(NBA Jam)等电子游戏中。在游戏里,如果玩家控制球员连续多次投篮入筐,球上就会带着火焰。

当俱乐部雇佣的运动科学顾问向球员和教练讲解GVT的研究结论时,很多球员都选择无视。波士顿凯尔特人队传奇教练、“红衣主教”阿诺德·雅各布·奥尔巴赫(Red Auerbach)有句名言:“这个人(GVT)是谁?他做了个研究,但我不在乎。”

学术界的反对意见同样强烈,但特沃斯基和吉洛维奇成功地捍卫了他们的论点,同时指出了反对他们的论文里所存在的严重缺陷。所以,之后虽仍存在一些孤立的质疑者,但GVT的结果已被当作是科学界(但非篮球界)的共识。

这种情况直到2017年才发生了变化,当时一篇开创性的论文[2]显示,GVT的经典研究——以及后来基于它的研究——存在小而显著的选择偏差,从而影响了统计结果。基本上,研究团队在寻找连胜或热手现象时选择样本的方式使他们的数学模型无效。当研究人员考虑把偏差纳入计算时,热手效应就应该是存在的。当球员变得炙手可“热”时,他们是场上不可忽视的力量。

两名信息科学、运营和决策技术领域的研究员——博科尼大学(Bocconi University)决策科学系副教授约书亚·米勒(Joshua Miller)和阿利坎特大学(The University of Alicante)经济学副教授亚当·桑朱尔乔(Adam Sanjurjo)重新审视了GVT的概率模型,发现后者做了一个隐含的假设,即如果每个球员的100次投篮结果的序列是由掷硬币决定的,则他们连续得分能力的统计数据也必然遵循同样的分布。

令人惊讶的是,这种直觉上显然的预设前提是不正确的。注意,就是在这里,篮球比赛和卷首那个概率问题联系到了一起!

米勒和桑朱尔乔认为,为热手效应构建数学模型,对应的不仅是随机投掷硬币得到的正(H,对应投篮命中)、反(T,对应投篮未中)序列,还要考虑正正(HH,连续得分,有手热征兆)和正反(HT,得分后再投未中)。然而就像笔者一直在强调的,HH和HT的概率虽然是相同的,但前者出现的时候更加集中!这一事实导致GVT的论证失效了。

完整的论证可以在参考文献[2]中找到,该论文可在线获取。在这里的推理应用了所谓的限制选择原则,该原则出现在桥牌中,并且是新信息更新信念的标准数学程序——即贝叶斯推理——背后的直觉理念。米勒两人的结果与各种概率谜题和统计偏差联系起来,问题的最简单版本几乎等同于著名的蒙提霍尔三门问题(Monty Hall problem),后者曾难倒了著名的数学家保罗·埃尔德什(Paul Erdős)和许多其他聪明人。

本文的目的恰好与米勒和桑朱尔乔两人的目标相悖。他们两人当初是为热手效应寻找一个数学模型,而我们则是为了解答最开始的思考题,为数学模型寻找一个可以直观理解它的现实场景!所以,我们现在就可以用NBA球星的表现来解读原始问题的答案为何是B。

如果一个NBA球员状态起伏不定,手热的时候(随机手热,无法控制)一场可以砍下80分,但是手不热时,得分就变成了个位数;同时他的队友的场均得分和他相当,但是每场得分的上下波动在5分以内,那么实际上他对队伍的贡献不如每场得分更均匀的队友。

原题里的规则A,就是一个运气好的时候可以拿到极高分的“选手”。这个选手在某几场比赛里,以高比分碾压对手,但如果只看平均得分的话,他和对手得分相当,而对手每次获胜又都是以微弱优势胜出,那就说明一个“赛季”下来,规则A输多赢少。

所以,选择规则A,获胜的时候有高几率是大比分获胜,拿到了70或80分,但是实际上只要拿到50分就足够了。更多的得分相当于浪费掉了。选择规则B,最高也仅仅是50分,所以规则B每次获胜的时候,得分更加均匀。反复玩这个游戏(每次游戏投掷100次硬币),选B获胜的次数会更多。

极客网站煎蛋网的ID为vevan的网友在CodePen在线社区上分享了用于模拟这个问题的代码段[5],每次运行模拟10万次游戏。可以看到,HH胜出46k次左右,HT胜出48k左右。规则B略占优。

米勒也参与了对原题的讨论,并给出了一个直观解释。| 图源:jben0@twitter.com

热手效应的影响

对热手效应的研究,不仅仅关乎NBA和篮球比赛本身——虽然NBA也是价值百亿美元的大生意——它还关乎信息行为决策以及统计学工具在现实世界里的正确应用。

康涅狄格大学的经济学副教授雷米·莱文(Remy Levin)对米勒和桑朱尔乔的这篇论文评价极高:“非常精彩,是我每年在行为学教学中最喜欢讲授的内容之一。超级有趣、反直觉的有限样本结果,对条件概率的测量实践有重大影响。同时,这也是我最喜欢的科学成果之一。”

现在让我们回到GVT的数据。GVT将投篮分为连续三次(或更多)得分和连续三次(或更多)投篮未中,并比较了各类数据的分布。由于米勒两人指出了一个令人惊讶的数学结论(也是我们的思考题!),他们发现,历史数据里连续投篮得分后,下一投也能得分的概率比人们预期的高出11个百分点!

在连续命中时,投篮准确率相对提升11个百分点是不容忽视的。事实上,这大致等于NBA中平均得分手和最佳三分射手之间的投篮命中率差异。因此,与最初发现的结果相比,GVT的数据揭示了实质性的、具有统计学意义的热手效应!

更重要的是,支持热手效应的证据并不唯一。事实上,在最近的研究中,我们发现这种效应在NBA三分球大赛中以及在其他对照研究中得到了体现。其他研究人员使用罚球和比赛数据进一步佐证了这一点。此外,由于另一个被称为“测量误差”的微妙统计问题,热手效应很有可能比我们估计的更重要。

热手效应背后的机制无疑是十分复杂的。有研究发现,类似于安慰剂效应,如果球员自己不相信热手效应,则他就难以获得超出平时的手感。

2022年的研究[3]进一步指出,手热并不意味着球员可以突然从球场上的任何地方投篮。对NBA的球员来说,手热看起来就像是在比赛中发现了一个可以利用的漏洞——可能是一个更矮的球员在防守他们——并通过采取更多某种类型的投篮来利用漏洞。

虽然这个假设是合理的,但它可能也不是导致手热的唯一因素。短期神经可塑性——玩家大脑快速适应游戏条件的能力——会是一个原因吗?专注力和心理准备呢?不管是什么原因,现有研究提供了强有力的证据来支持热手效应的存在。

因此,令人惊讶的是,那些NBA球星的经验实际上一直都是正确的。今天,NCAA的官方网站已经删除了那个把热手效应归于认知谬误的网页。

参考资料:

[1]The hot hand in basketball: On the misperception of random sequences – ScienceDirect

[2] Surprised by the Gambler’s and Hot Hand Fallacies? A Truth in the Law of Small Numbers by Joshua B. Miller, Adam Sanjurjo:SSRN

[3] The hot hand in the wild | PLOS ONE

[4]OSF Preprints | Surprised by the Hot Hand Fallacy? A Truth in the Law of Small Numbers

Momentum isn’t magic – vindicating the hot hand with the mathematics of streaks (theconversation.com)

[5] https://codepen.io/lunar-dark/pen/NWmpKpM

[6] The Hot Hand and Its Effect on the NBA: arXiv:2010.15943

本文受科普中国·星空计划项目扶持

出品:中国科协科普部

监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司


本文来自微信公众号:返朴 (ID:fanpu2019),作者:嘉伟

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年5月2日
下一篇 2024年5月2日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日