求医17位专家无果的怪病，ChatGPT成功诊断了

2023年9月18日 08:28 • 未来科技

他将狗子从第一次发病开始的症状、治疗过程以及每次的血液检测报告都告诉了GPT-4：

20号当天高烧41.5摄氏度，医生根据验血结果诊断为犬巴贝斯虫病（附血液检测结果），接下来的3天接受抗生素治疗，24日当天接受抗生素治疗，但出现牙龈苍白（附新的血液检测结果）。

对此，研究认为，还不能完全将诊断交给ChatGPT或GPT-4，毕竟他们在诊断这一过程上依旧无法和专业的医生相比。

“怪病”缠身3年求医无果，最终竟然被ChatGPT成功诊断！

这是发生在一名4岁男孩身上的真实经历。

某次运动后，他身体开始剧痛。母亲前后带她看了17名医生，从儿科、骨科到各种专家，先后进行了MRI等一系列检查，但没一个真正找出病因。

他的母亲没抱太大希望地尝试求助ChatGPT，后者却根据描述和检查报告，直接给出了正确的建议。

话题一出冲上知乎热榜，Reddit热度也飙升至2.3k。

有网友表示，GPT这次真的很让人激动：

每个医生的办公室都可以配备一个AI助手，并将它与自己的诊断结果进行比较。

还有网友cue了下谷歌专门训练的辅助医疗诊断大模型Med-PaLM，想知道它的诊断结果如何：

对于大模型而言，这几乎是个完美的测试任务。

所以，这具体是怎么一回事？

究竟是什么样的“怪病”？

故事的主人公名叫Alex，他的母亲Courtney一共有两个孩子。

2020年的一天，Alex的保姆告诉Courtney，Alex每天都要服用止痛药，不然就会疼到崩溃。

接着，Alex又出现了磨牙的症状，父母把这两件事联系到了一起，认为可能是由换牙或者蛀牙引起的疼痛导致的。

于是母亲带着Alex去看了牙医，Alex长达三年的寻医之路便正式开始了。

由于牙医检查之后没有发现任何问题，但提出鉴于Alex正在磨牙，推荐他们去看专业治疗气道阻塞的正畸医生。

正畸医生发现，Alex的上颚太小，导致呼吸困难，于是给Alex放置了一个扩张器。这种治疗方式的确起到了效果，母亲一度认为Alex的病马上就要痊愈了。

很合理，但现实往往是不讲逻辑的。

妈妈很快又发现，只有四岁的Alex个子突然不长了。

这一次，妈妈求助的是一名儿科医生。

医生认为Alex可能是受到了新冠病毒的影响，但妈妈对这个解释并不满意。不过，妈妈还是在2021年初带着Alex去复查了。

医生告诉妈妈，Alex的个子“长高了一点”，但发现Alex的左右脚有些不平衡，建议他们选择物理治疗。

这次妈妈倒是相信了医生的话，但在物理治疗开始之前，Alex又出现了头痛的症状，而且越来越严重。

物理治疗的事只好先搁置一下，母亲先带Alex去看神经（内）科医生，结论是Alex患有偏头痛。

在和头痛进行抗争的同时，Alex还被精疲力竭的症状困扰着，于是又被带到了耳鼻喉科医生那里检查是否有鼻窦问题影响睡眠。

经历了这番波折之后，Alex终于开始接受物理治疗，他的物理治疗师认为，Alex可能患有一种名为Chiari畸形的先天性疾病。

这种先天性疾病会导致头骨与脊柱相接处的大脑出现异常。

母亲开始对此展开研究，带着Alex看了新的儿科医生、小儿内科医生、成人内科医生和肌肉骨骼医生等。

最终Alex看过的医生多达17位，可以说几乎踏遍了能想到的所有科室，甚至被送入急诊，但依旧没能检查出个所以然。

直到ChatGPT让整个事件出现了180度大逆转。

抱着试一试的心态，母亲注册了一个ChatGPT账号。

她将Alex的症状和MRI报告中的注释一并输入，其中有一个细节，就是Alex无法完成盘腿坐的动作。

ChatGPT给出了诊断——脊髓栓系综合征（TCS）。

当然Courtney并没有直接相信，得到答案之后她先是找到了Facebook上的一个患儿家长交流群。

结果看了里面的讨论之后，母亲觉得这些症状和Alex真的是太像了。

这一发现让几近熄灭的希望之火重新燃了起来，事后母亲回忆说，自己在电脑前坐了一整晚，经历了所有的一切。

带着这一结论和Alex的MRI报告，找到了神经外科医生。

这次终于是找对人了，神外医生看了一眼MRI就给出了和ChatGPT一样的结论，并指出了栓系的具体位置。

再后来的事情就比较顺利了。Alex接受了手术治疗，目前正在进行康复。

那么为什么Alex直到看到第18个医生才最终确诊呢？

首先，和Alex自身也有一定关系。

TCS患者的背部通常会出现裂口，但Alex并没有裂口，这种情况称为隐式脊髓栓系综合征（OTCS）。

虽然TCS是罕见病，但在新生儿中的发病率也并不低，约为0.005%~0.025%，比白血病的发病率还要高一些。

△陈莹格，米阳. 妊娠期多发性胎儿发育异常一例[J]. 临床医学进展， 2023， 13(2)

但OTCS就比较罕见了——罕见到发病率根本没统计出来。

不过毕竟故事的最后，外科医生看到MRI图像之后很快就给出了判断。

所以，之前没能确诊，或许是因为“找错了医生”：那17名医生中，的确没有人从事外科。

当然，这也是正常的，毕竟他们都是擅长各自专业领域的专科医生（对应全科医生），专业之外的知识难免了解不全面。

但是这也暴露出了一个问题，遇到无法解释的难题时，这些医生都没有考虑进行多学科会诊，是否全面询问过Alex的各项病史也不得而知。

用母亲Courtney的话说，没有人愿意解决“更大（超出自己学科范围）的问题”，没有人会给出任何关于诊断结果的线索。

而ChatGPT的知识库至少在广度上比细分领域的专业人士要丰富得多，更加全面地考虑了Alex的情况，最终才给出正确的结论。

那么这次ChatGPT的成功诊断，究竟是误打误撞，还是确实已经具备诊断能力了？

AI究竟能不能用于诊断？

事实上，用ChatGPT或GPT-4来做病情诊断工具，也不是第一次有人这样做了。

像是GPT-4出来后不久，就有人用它成功诊断了自家狗子的一种病例，这段经历一度在网上爆火。

他将狗子从第一次发病开始的症状、治疗过程以及每次的血液检测报告都告诉了GPT-4：

GPT-4很快给出了检测结果，并在对话中表明可能是以下两种原因导致的：

1. 溶血：由于各种原因造成的红细胞破坏，如免疫介导性溶血性贫血（IMHA）、毒素或除巴贝斯虫病以外的其他感染。

2. 失血：内部或外部出血，可由创伤、手术或胃肠道问题 (如溃疡或寄生虫)引起。

最终医生诊断结果显示，狗子患上的确实是免疫介导性溶血性贫血（IMHA），对症下药后狗子得救了。

除此之外，也有网友自述被ChatGPT（GPT-4）救了一命的经历。

他在去健身房后浑身酸痛，将病症咨询GPT-4后，得出“横纹肌溶解症”的答案，立刻去医院并因此捡了一命。

但也有学术研究提到，无论是ChatGPT还是GPT-4，都并非一个完全可以依赖的AI医生。

例如哈佛大学附属医院布莱根妇女医院（BWH）发表在JAMA上的一项研究就显示，在给出癌症治疗建议时，ChatGPT只有62%的案例是完全正确的。

在其他的案例中，有34%的建议至少都包含一个或多个和正确诊断结果不一致的答案，还有2%的案例给出了不可信的诊断结果。

对此，研究认为，还不能完全将诊断交给ChatGPT或GPT-4，毕竟他们在诊断这一过程上依旧无法和专业的医生相比。

（不过有网友指出，ChatGPT没诊断成功的原因，可能也和训练数据有关，2021年之后的治疗信息不包含其中。）

对此，哈佛大学流行病学助理教授Andrew Beam认为，ChatGPT和GPT-4的使用效果应该分两面看待：

一方面，它们要比一些普通的诊断软件或是谷歌搜索引擎更好用，尤其是GPT-4这个版本。

但另一方面，它们目前还不太可能取代具备大量专业知识的临床医生。毕竟对于AI来说，它们确实可能在找不到答案时捏造信息，根据“幻觉”推测出错误结果。

美国医学会（AMA）的主席Jesse M. Ehrenfeld对此表示，即使AI能诊断结果，最终的责任还是医生自己的。

总结一下上述观点就是，大伙儿可以用AI辅助诊断病情，比搜索引擎好用，但最终还是得去医院，找医生确诊。

那么，如果打算用大模型“问问诊”，哪个大模型最好用？

有网友就以自己为病例，测试了各种大语言模型是否具备诊断能力，最终认为还是GPT-4比较能胜任：

我曾经就慢性咳嗽的原因咨询过几位医生，但最终是在一个油管频道上得知自己患了LPR（隐性咽喉返流）。

我用自己的病例测了测大模型，GPT-4是唯一一个成功诊断的。Claude 2虽然答案接近，但没能完全自主诊断出来。

参考链接：

[1]https://www.today.com/health/mom-chatgpt-diagnosis-pain-rcna101843

[2]https://www.reddit.com/r/ChatGPT/comments/16gfrwp/a_boy_saw_17_doctors_over_3_years_for_chronic/

[3]https://news.harvard.edu/gazette/story/2023/08/need-cancer-treatment-advice-forget-chatgpt/

本文来自微信公众号：量子位（ID：QbitAI），作者：克雷西、萧箫

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

本来生活亮相中国慈展会：携手伙伴推进乡村振兴产业共建计划

Previous 2023年9月17日 21:13

信托贷款18亿，中公教育“背水一战”

Next 2023年9月18日 10:09

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

求医17位专家无果的怪病，ChatGPT成功诊断了

相关推荐